OPEA
/

Llama-3.2-11B-Vision-Instruct-int4-sym-inc

4-bit precision

Model card Files Files and versions Community

cicdatopea commited on 8 days ago

Commit

6be8cdf

·

verified ·

1 Parent(s): 0c9b026

Update config.json

Files changed (1) hide show

config.json +1 -44

config.json CHANGED Viewed

@@ -26,50 +26,7 @@
     "scale_dtype": "torch.float16",
     "seqlen": 512,
     "sym": true,
-    "to_quant_block_names": [
-      [
-        "language_model.model.layers.0",
-        "language_model.model.layers.1",
-        "language_model.model.layers.2",
-        "language_model.model.layers.3",
-        "language_model.model.layers.4",
-        "language_model.model.layers.5",
-        "language_model.model.layers.6",
-        "language_model.model.layers.7",
-        "language_model.model.layers.8",
-        "language_model.model.layers.9",
-        "language_model.model.layers.10",
-        "language_model.model.layers.11",
-        "language_model.model.layers.12",
-        "language_model.model.layers.13",
-        "language_model.model.layers.14",
-        "language_model.model.layers.15",
-        "language_model.model.layers.16",
-        "language_model.model.layers.17",
-        "language_model.model.layers.18",
-        "language_model.model.layers.19",
-        "language_model.model.layers.20",
-        "language_model.model.layers.21",
-        "language_model.model.layers.22",
-        "language_model.model.layers.23",
-        "language_model.model.layers.24",
-        "language_model.model.layers.25",
-        "language_model.model.layers.26",
-        "language_model.model.layers.27",
-        "language_model.model.layers.28",
-        "language_model.model.layers.29",
-        "language_model.model.layers.30",
-        "language_model.model.layers.31",
-        "language_model.model.layers.32",
-        "language_model.model.layers.33",
-        "language_model.model.layers.34",
-        "language_model.model.layers.35",
-        "language_model.model.layers.36",
-        "language_model.model.layers.37",
-        "language_model.model.layers.38",
-        "language_model.model.layers.39"
-      ]
-    ]
   },
   "text_config": {
     "_attn_implementation_autoset": false,

     "scale_dtype": "torch.float16",
     "seqlen": 512,
     "sym": true,
+    "block_name_to_quantize":"language_model.model.layers"
   },
   "text_config": {
     "_attn_implementation_autoset": false,