OPEA
/

DeepSeek-V3-int4-sym-gptq-inc

4-bit precision

Model card Files Files and versions

cicdatopea commited on Feb 12

Commit

40abeb7

·

verified ·

1 Parent(s): 813ffad

Update README.md

Files changed (1) hide show

README.md +25 -1

README.md CHANGED Viewed

@@ -198,6 +198,30 @@ pip install intel-extension-for-transformers
 ~~~python
 from auto_round import AutoRoundConfig ##must import for autoround format
 from transformers import AutoModelForCausalLM, AutoTokenizer
 import torch
 quantized_model_dir = "OPEA/DeepSeek-V3-int4-sym-gptq-inc"
@@ -383,7 +407,7 @@ https://github.com/intel/auto-round/blob/deepseekv3/modeling_deepseek.py
 git clone https://github.com/intel/auto-round.git && cd auto-round && git checkout deepseekv3
 ```
-torch < 2.6
 ```bash
 python3 -m auto_round --model  "/models/DeepSeek-V3-bf16/"  --group_size 128 --format "auto_gptq"  --iters 200 --devices 0,1,2,3,4 --nsamples 512 --batch_size 8 --seqlen 512   --low_gpu_mem_usage    --output_dir "tmp_autoround"  --disable_eval e 2>&1 | tee -a seekv3.txt
 ```

 ~~~python
 from auto_round import AutoRoundConfig ##must import for autoround format
 from transformers import AutoModelForCausalLM, AutoTokenizer
+#  https://github.com/huggingface/transformers/pull/35493
+def set_initialized_submodules(model, state_dict_keys):
+    """
+    Sets the `_is_hf_initialized` flag in all submodules of a given model when all its weights are in the loaded state
+    dict.
+    """
+    state_dict_keys = set(state_dict_keys)
+    not_initialized_submodules = {}
+    for module_name, module in model.named_modules():
+        if module_name == "":
+            # When checking if the root module is loaded there's no need to prepend module_name.
+            module_keys = set(module.state_dict())
+        else:
+            module_keys = {f"{module_name}.{k}" for k in module.state_dict()}
+        if module_keys.issubset(state_dict_keys):
+            module._is_hf_initialized = True
+        else:
+            not_initialized_submodules[module_name] = module
+    return not_initialized_submodules
+transformers.modeling_utils.set_initialized_submodules = set_initialized_submodules
 import torch
 quantized_model_dir = "OPEA/DeepSeek-V3-int4-sym-gptq-inc"
 git clone https://github.com/intel/auto-round.git && cd auto-round && git checkout deepseekv3
 ```
+**torch < 2.6**
 ```bash
 python3 -m auto_round --model  "/models/DeepSeek-V3-bf16/"  --group_size 128 --format "auto_gptq"  --iters 200 --devices 0,1,2,3,4 --nsamples 512 --batch_size 8 --seqlen 512   --low_gpu_mem_usage    --output_dir "tmp_autoround"  --disable_eval e 2>&1 | tee -a seekv3.txt
 ```