Upload folder using huggingface_hub

Browse files

Files changed (4) hide show

README.md +2 -1
config.json +327 -3
model.safetensors +2 -2
model.safetensors.index.json +372 -372

README.md CHANGED Viewed

@@ -25,12 +25,13 @@ language:
 - ta
 - uk
 pipeline_tag: text-to-speech
 tags:
 - mlx
 ---
 # mlx-community/Llama-OuteTTS-1.0-1B-6bit
-This model was converted to MLX format from [`OuteAI/Llama-OuteTTS-1.0-1B`](https://huggingface.co/OuteAI/Llama-OuteTTS-1.0-1B) using mlx-audio version **0.0.5**.
 Refer to the [original model card](https://huggingface.co/OuteAI/Llama-OuteTTS-1.0-1B) for more details on the model.
 ## Use with mlx

 - ta
 - uk
 pipeline_tag: text-to-speech
+library_name: outetts
 tags:
 - mlx
 ---
 # mlx-community/Llama-OuteTTS-1.0-1B-6bit
+This model was converted to MLX format from [`OuteAI/Llama-OuteTTS-1.0-1B`](https://huggingface.co/OuteAI/Llama-OuteTTS-1.0-1B) using mlx-audio version **0.2.2**.
 Refer to the [original model card](https://huggingface.co/OuteAI/Llama-OuteTTS-1.0-1B) for more details on the model.
 ## Use with mlx

config.json CHANGED Viewed

@@ -59,11 +59,335 @@
     "pruned_heads": {},
     "quantization": {
         "group_size": 64,
-        "bits": 6
     },
     "quantization_config": {
         "group_size": 64,
-        "bits": 6
     },
     "remove_invalid_values": false,
     "repetition_penalty": 1.0,
@@ -90,7 +414,7 @@
     "top_p": 1.0,
     "torch_dtype": "bfloat16",
     "torchscript": false,
-    "transformers_version": "4.52.0.dev0",
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,

     "pruned_heads": {},
     "quantization": {
         "group_size": 64,
+        "bits": 6,
+        "model.model.embed_tokens": true,
+        "model.model.layers.0.self_attn.q_proj": true,
+        "model.model.layers.0.self_attn.k_proj": true,
+        "model.model.layers.0.self_attn.v_proj": true,
+        "model.model.layers.0.self_attn.o_proj": true,
+        "model.model.layers.0.self_attn.rope": false,
+        "model.model.layers.0.mlp.gate_proj": true,
+        "model.model.layers.0.mlp.down_proj": true,
+        "model.model.layers.0.mlp.up_proj": true,
+        "model.model.layers.0.input_layernorm": false,
+        "model.model.layers.0.post_attention_layernorm": false,
+        "model.model.layers.1.self_attn.q_proj": true,
+        "model.model.layers.1.self_attn.k_proj": true,
+        "model.model.layers.1.self_attn.v_proj": true,
+        "model.model.layers.1.self_attn.o_proj": true,
+        "model.model.layers.1.self_attn.rope": false,
+        "model.model.layers.1.mlp.gate_proj": true,
+        "model.model.layers.1.mlp.down_proj": true,
+        "model.model.layers.1.mlp.up_proj": true,
+        "model.model.layers.1.input_layernorm": false,
+        "model.model.layers.1.post_attention_layernorm": false,
+        "model.model.layers.2.self_attn.q_proj": true,
+        "model.model.layers.2.self_attn.k_proj": true,
+        "model.model.layers.2.self_attn.v_proj": true,
+        "model.model.layers.2.self_attn.o_proj": true,
+        "model.model.layers.2.self_attn.rope": false,
+        "model.model.layers.2.mlp.gate_proj": true,
+        "model.model.layers.2.mlp.down_proj": true,
+        "model.model.layers.2.mlp.up_proj": true,
+        "model.model.layers.2.input_layernorm": false,
+        "model.model.layers.2.post_attention_layernorm": false,
+        "model.model.layers.3.self_attn.q_proj": true,
+        "model.model.layers.3.self_attn.k_proj": true,
+        "model.model.layers.3.self_attn.v_proj": true,
+        "model.model.layers.3.self_attn.o_proj": true,
+        "model.model.layers.3.self_attn.rope": false,
+        "model.model.layers.3.mlp.gate_proj": true,
+        "model.model.layers.3.mlp.down_proj": true,
+        "model.model.layers.3.mlp.up_proj": true,
+        "model.model.layers.3.input_layernorm": false,
+        "model.model.layers.3.post_attention_layernorm": false,
+        "model.model.layers.4.self_attn.q_proj": true,
+        "model.model.layers.4.self_attn.k_proj": true,
+        "model.model.layers.4.self_attn.v_proj": true,
+        "model.model.layers.4.self_attn.o_proj": true,
+        "model.model.layers.4.self_attn.rope": false,
+        "model.model.layers.4.mlp.gate_proj": true,
+        "model.model.layers.4.mlp.down_proj": true,
+        "model.model.layers.4.mlp.up_proj": true,
+        "model.model.layers.4.input_layernorm": false,
+        "model.model.layers.4.post_attention_layernorm": false,
+        "model.model.layers.5.self_attn.q_proj": true,
+        "model.model.layers.5.self_attn.k_proj": true,
+        "model.model.layers.5.self_attn.v_proj": true,
+        "model.model.layers.5.self_attn.o_proj": true,
+        "model.model.layers.5.self_attn.rope": false,
+        "model.model.layers.5.mlp.gate_proj": true,
+        "model.model.layers.5.mlp.down_proj": true,
+        "model.model.layers.5.mlp.up_proj": true,
+        "model.model.layers.5.input_layernorm": false,
+        "model.model.layers.5.post_attention_layernorm": false,
+        "model.model.layers.6.self_attn.q_proj": true,
+        "model.model.layers.6.self_attn.k_proj": true,
+        "model.model.layers.6.self_attn.v_proj": true,
+        "model.model.layers.6.self_attn.o_proj": true,
+        "model.model.layers.6.self_attn.rope": false,
+        "model.model.layers.6.mlp.gate_proj": true,
+        "model.model.layers.6.mlp.down_proj": true,
+        "model.model.layers.6.mlp.up_proj": true,
+        "model.model.layers.6.input_layernorm": false,
+        "model.model.layers.6.post_attention_layernorm": false,
+        "model.model.layers.7.self_attn.q_proj": true,
+        "model.model.layers.7.self_attn.k_proj": true,
+        "model.model.layers.7.self_attn.v_proj": true,
+        "model.model.layers.7.self_attn.o_proj": true,
+        "model.model.layers.7.self_attn.rope": false,
+        "model.model.layers.7.mlp.gate_proj": true,
+        "model.model.layers.7.mlp.down_proj": true,
+        "model.model.layers.7.mlp.up_proj": true,
+        "model.model.layers.7.input_layernorm": false,
+        "model.model.layers.7.post_attention_layernorm": false,
+        "model.model.layers.8.self_attn.q_proj": true,
+        "model.model.layers.8.self_attn.k_proj": true,
+        "model.model.layers.8.self_attn.v_proj": true,
+        "model.model.layers.8.self_attn.o_proj": true,
+        "model.model.layers.8.self_attn.rope": false,
+        "model.model.layers.8.mlp.gate_proj": true,
+        "model.model.layers.8.mlp.down_proj": true,
+        "model.model.layers.8.mlp.up_proj": true,
+        "model.model.layers.8.input_layernorm": false,
+        "model.model.layers.8.post_attention_layernorm": false,
+        "model.model.layers.9.self_attn.q_proj": true,
+        "model.model.layers.9.self_attn.k_proj": true,
+        "model.model.layers.9.self_attn.v_proj": true,
+        "model.model.layers.9.self_attn.o_proj": true,
+        "model.model.layers.9.self_attn.rope": false,
+        "model.model.layers.9.mlp.gate_proj": true,
+        "model.model.layers.9.mlp.down_proj": true,
+        "model.model.layers.9.mlp.up_proj": true,
+        "model.model.layers.9.input_layernorm": false,
+        "model.model.layers.9.post_attention_layernorm": false,
+        "model.model.layers.10.self_attn.q_proj": true,
+        "model.model.layers.10.self_attn.k_proj": true,
+        "model.model.layers.10.self_attn.v_proj": true,
+        "model.model.layers.10.self_attn.o_proj": true,
+        "model.model.layers.10.self_attn.rope": false,
+        "model.model.layers.10.mlp.gate_proj": true,
+        "model.model.layers.10.mlp.down_proj": true,
+        "model.model.layers.10.mlp.up_proj": true,
+        "model.model.layers.10.input_layernorm": false,
+        "model.model.layers.10.post_attention_layernorm": false,
+        "model.model.layers.11.self_attn.q_proj": true,
+        "model.model.layers.11.self_attn.k_proj": true,
+        "model.model.layers.11.self_attn.v_proj": true,
+        "model.model.layers.11.self_attn.o_proj": true,
+        "model.model.layers.11.self_attn.rope": false,
+        "model.model.layers.11.mlp.gate_proj": true,
+        "model.model.layers.11.mlp.down_proj": true,
+        "model.model.layers.11.mlp.up_proj": true,
+        "model.model.layers.11.input_layernorm": false,
+        "model.model.layers.11.post_attention_layernorm": false,
+        "model.model.layers.12.self_attn.q_proj": true,
+        "model.model.layers.12.self_attn.k_proj": true,
+        "model.model.layers.12.self_attn.v_proj": true,
+        "model.model.layers.12.self_attn.o_proj": true,
+        "model.model.layers.12.self_attn.rope": false,
+        "model.model.layers.12.mlp.gate_proj": true,
+        "model.model.layers.12.mlp.down_proj": true,
+        "model.model.layers.12.mlp.up_proj": true,
+        "model.model.layers.12.input_layernorm": false,
+        "model.model.layers.12.post_attention_layernorm": false,
+        "model.model.layers.13.self_attn.q_proj": true,
+        "model.model.layers.13.self_attn.k_proj": true,
+        "model.model.layers.13.self_attn.v_proj": true,
+        "model.model.layers.13.self_attn.o_proj": true,
+        "model.model.layers.13.self_attn.rope": false,
+        "model.model.layers.13.mlp.gate_proj": true,
+        "model.model.layers.13.mlp.down_proj": true,
+        "model.model.layers.13.mlp.up_proj": true,
+        "model.model.layers.13.input_layernorm": false,
+        "model.model.layers.13.post_attention_layernorm": false,
+        "model.model.layers.14.self_attn.q_proj": true,
+        "model.model.layers.14.self_attn.k_proj": true,
+        "model.model.layers.14.self_attn.v_proj": true,
+        "model.model.layers.14.self_attn.o_proj": true,
+        "model.model.layers.14.self_attn.rope": false,
+        "model.model.layers.14.mlp.gate_proj": true,
+        "model.model.layers.14.mlp.down_proj": true,
+        "model.model.layers.14.mlp.up_proj": true,
+        "model.model.layers.14.input_layernorm": false,
+        "model.model.layers.14.post_attention_layernorm": false,
+        "model.model.layers.15.self_attn.q_proj": true,
+        "model.model.layers.15.self_attn.k_proj": true,
+        "model.model.layers.15.self_attn.v_proj": true,
+        "model.model.layers.15.self_attn.o_proj": true,
+        "model.model.layers.15.self_attn.rope": false,
+        "model.model.layers.15.mlp.gate_proj": true,
+        "model.model.layers.15.mlp.down_proj": true,
+        "model.model.layers.15.mlp.up_proj": true,
+        "model.model.layers.15.input_layernorm": false,
+        "model.model.layers.15.post_attention_layernorm": false,
+        "model.model.norm": false
     },
     "quantization_config": {
         "group_size": 64,
+        "bits": 6,
+        "model.model.embed_tokens": true,
+        "model.model.layers.0.self_attn.q_proj": true,
+        "model.model.layers.0.self_attn.k_proj": true,
+        "model.model.layers.0.self_attn.v_proj": true,
+        "model.model.layers.0.self_attn.o_proj": true,
+        "model.model.layers.0.self_attn.rope": false,
+        "model.model.layers.0.mlp.gate_proj": true,
+        "model.model.layers.0.mlp.down_proj": true,
+        "model.model.layers.0.mlp.up_proj": true,
+        "model.model.layers.0.input_layernorm": false,
+        "model.model.layers.0.post_attention_layernorm": false,
+        "model.model.layers.1.self_attn.q_proj": true,
+        "model.model.layers.1.self_attn.k_proj": true,
+        "model.model.layers.1.self_attn.v_proj": true,
+        "model.model.layers.1.self_attn.o_proj": true,
+        "model.model.layers.1.self_attn.rope": false,
+        "model.model.layers.1.mlp.gate_proj": true,
+        "model.model.layers.1.mlp.down_proj": true,
+        "model.model.layers.1.mlp.up_proj": true,
+        "model.model.layers.1.input_layernorm": false,
+        "model.model.layers.1.post_attention_layernorm": false,
+        "model.model.layers.2.self_attn.q_proj": true,
+        "model.model.layers.2.self_attn.k_proj": true,
+        "model.model.layers.2.self_attn.v_proj": true,
+        "model.model.layers.2.self_attn.o_proj": true,
+        "model.model.layers.2.self_attn.rope": false,
+        "model.model.layers.2.mlp.gate_proj": true,
+        "model.model.layers.2.mlp.down_proj": true,
+        "model.model.layers.2.mlp.up_proj": true,
+        "model.model.layers.2.input_layernorm": false,
+        "model.model.layers.2.post_attention_layernorm": false,
+        "model.model.layers.3.self_attn.q_proj": true,
+        "model.model.layers.3.self_attn.k_proj": true,
+        "model.model.layers.3.self_attn.v_proj": true,
+        "model.model.layers.3.self_attn.o_proj": true,
+        "model.model.layers.3.self_attn.rope": false,
+        "model.model.layers.3.mlp.gate_proj": true,
+        "model.model.layers.3.mlp.down_proj": true,
+        "model.model.layers.3.mlp.up_proj": true,
+        "model.model.layers.3.input_layernorm": false,
+        "model.model.layers.3.post_attention_layernorm": false,
+        "model.model.layers.4.self_attn.q_proj": true,
+        "model.model.layers.4.self_attn.k_proj": true,
+        "model.model.layers.4.self_attn.v_proj": true,
+        "model.model.layers.4.self_attn.o_proj": true,
+        "model.model.layers.4.self_attn.rope": false,
+        "model.model.layers.4.mlp.gate_proj": true,
+        "model.model.layers.4.mlp.down_proj": true,
+        "model.model.layers.4.mlp.up_proj": true,
+        "model.model.layers.4.input_layernorm": false,
+        "model.model.layers.4.post_attention_layernorm": false,
+        "model.model.layers.5.self_attn.q_proj": true,
+        "model.model.layers.5.self_attn.k_proj": true,
+        "model.model.layers.5.self_attn.v_proj": true,
+        "model.model.layers.5.self_attn.o_proj": true,
+        "model.model.layers.5.self_attn.rope": false,
+        "model.model.layers.5.mlp.gate_proj": true,
+        "model.model.layers.5.mlp.down_proj": true,
+        "model.model.layers.5.mlp.up_proj": true,
+        "model.model.layers.5.input_layernorm": false,
+        "model.model.layers.5.post_attention_layernorm": false,
+        "model.model.layers.6.self_attn.q_proj": true,
+        "model.model.layers.6.self_attn.k_proj": true,
+        "model.model.layers.6.self_attn.v_proj": true,
+        "model.model.layers.6.self_attn.o_proj": true,
+        "model.model.layers.6.self_attn.rope": false,
+        "model.model.layers.6.mlp.gate_proj": true,
+        "model.model.layers.6.mlp.down_proj": true,
+        "model.model.layers.6.mlp.up_proj": true,
+        "model.model.layers.6.input_layernorm": false,
+        "model.model.layers.6.post_attention_layernorm": false,
+        "model.model.layers.7.self_attn.q_proj": true,
+        "model.model.layers.7.self_attn.k_proj": true,
+        "model.model.layers.7.self_attn.v_proj": true,
+        "model.model.layers.7.self_attn.o_proj": true,
+        "model.model.layers.7.self_attn.rope": false,
+        "model.model.layers.7.mlp.gate_proj": true,
+        "model.model.layers.7.mlp.down_proj": true,
+        "model.model.layers.7.mlp.up_proj": true,
+        "model.model.layers.7.input_layernorm": false,
+        "model.model.layers.7.post_attention_layernorm": false,
+        "model.model.layers.8.self_attn.q_proj": true,
+        "model.model.layers.8.self_attn.k_proj": true,
+        "model.model.layers.8.self_attn.v_proj": true,
+        "model.model.layers.8.self_attn.o_proj": true,
+        "model.model.layers.8.self_attn.rope": false,
+        "model.model.layers.8.mlp.gate_proj": true,
+        "model.model.layers.8.mlp.down_proj": true,
+        "model.model.layers.8.mlp.up_proj": true,
+        "model.model.layers.8.input_layernorm": false,
+        "model.model.layers.8.post_attention_layernorm": false,
+        "model.model.layers.9.self_attn.q_proj": true,
+        "model.model.layers.9.self_attn.k_proj": true,
+        "model.model.layers.9.self_attn.v_proj": true,
+        "model.model.layers.9.self_attn.o_proj": true,
+        "model.model.layers.9.self_attn.rope": false,
+        "model.model.layers.9.mlp.gate_proj": true,
+        "model.model.layers.9.mlp.down_proj": true,
+        "model.model.layers.9.mlp.up_proj": true,
+        "model.model.layers.9.input_layernorm": false,
+        "model.model.layers.9.post_attention_layernorm": false,
+        "model.model.layers.10.self_attn.q_proj": true,
+        "model.model.layers.10.self_attn.k_proj": true,
+        "model.model.layers.10.self_attn.v_proj": true,
+        "model.model.layers.10.self_attn.o_proj": true,
+        "model.model.layers.10.self_attn.rope": false,
+        "model.model.layers.10.mlp.gate_proj": true,
+        "model.model.layers.10.mlp.down_proj": true,
+        "model.model.layers.10.mlp.up_proj": true,
+        "model.model.layers.10.input_layernorm": false,
+        "model.model.layers.10.post_attention_layernorm": false,
+        "model.model.layers.11.self_attn.q_proj": true,
+        "model.model.layers.11.self_attn.k_proj": true,
+        "model.model.layers.11.self_attn.v_proj": true,
+        "model.model.layers.11.self_attn.o_proj": true,
+        "model.model.layers.11.self_attn.rope": false,
+        "model.model.layers.11.mlp.gate_proj": true,
+        "model.model.layers.11.mlp.down_proj": true,
+        "model.model.layers.11.mlp.up_proj": true,
+        "model.model.layers.11.input_layernorm": false,
+        "model.model.layers.11.post_attention_layernorm": false,
+        "model.model.layers.12.self_attn.q_proj": true,
+        "model.model.layers.12.self_attn.k_proj": true,
+        "model.model.layers.12.self_attn.v_proj": true,
+        "model.model.layers.12.self_attn.o_proj": true,
+        "model.model.layers.12.self_attn.rope": false,
+        "model.model.layers.12.mlp.gate_proj": true,
+        "model.model.layers.12.mlp.down_proj": true,
+        "model.model.layers.12.mlp.up_proj": true,
+        "model.model.layers.12.input_layernorm": false,
+        "model.model.layers.12.post_attention_layernorm": false,
+        "model.model.layers.13.self_attn.q_proj": true,
+        "model.model.layers.13.self_attn.k_proj": true,
+        "model.model.layers.13.self_attn.v_proj": true,
+        "model.model.layers.13.self_attn.o_proj": true,
+        "model.model.layers.13.self_attn.rope": false,
+        "model.model.layers.13.mlp.gate_proj": true,
+        "model.model.layers.13.mlp.down_proj": true,
+        "model.model.layers.13.mlp.up_proj": true,
+        "model.model.layers.13.input_layernorm": false,
+        "model.model.layers.13.post_attention_layernorm": false,
+        "model.model.layers.14.self_attn.q_proj": true,
+        "model.model.layers.14.self_attn.k_proj": true,
+        "model.model.layers.14.self_attn.v_proj": true,
+        "model.model.layers.14.self_attn.o_proj": true,
+        "model.model.layers.14.self_attn.rope": false,
+        "model.model.layers.14.mlp.gate_proj": true,
+        "model.model.layers.14.mlp.down_proj": true,
+        "model.model.layers.14.mlp.up_proj": true,
+        "model.model.layers.14.input_layernorm": false,
+        "model.model.layers.14.post_attention_layernorm": false,
+        "model.model.layers.15.self_attn.q_proj": true,
+        "model.model.layers.15.self_attn.k_proj": true,
+        "model.model.layers.15.self_attn.v_proj": true,
+        "model.model.layers.15.self_attn.o_proj": true,
+        "model.model.layers.15.self_attn.rope": false,
+        "model.model.layers.15.mlp.gate_proj": true,
+        "model.model.layers.15.mlp.down_proj": true,
+        "model.model.layers.15.mlp.up_proj": true,
+        "model.model.layers.15.input_layernorm": false,
+        "model.model.layers.15.post_attention_layernorm": false,
+        "model.model.norm": false
     },
     "remove_invalid_values": false,
     "repetition_penalty": 1.0,
     "top_p": 1.0,
     "torch_dtype": "bfloat16",
     "torchscript": false,
+    "transformers_version": "4.51.3",
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:374e78ef616cce6f4dee143da17b90633c80aef38ce1105bc735e62754269498
-size 1014444294

 version https://git-lfs.github.com/spec/v1
+oid sha256:b3e6d4cfee72e09349ba4060b72615d1f3c99734ae2360a7a410b65f6a32220a
+size 1014446538

model.safetensors.index.json CHANGED Viewed

@@ -3,377 +3,377 @@
         "total_size": 1014403072
     },
     "weight_map": {
-        "model.embed_tokens.biases": "model.safetensors",
-        "model.embed_tokens.scales": "model.safetensors",
-        "model.embed_tokens.weight": "model.safetensors",
-        "model.layers.0.input_layernorm.weight": "model.safetensors",
-        "model.layers.0.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.0.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.0.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.0.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.0.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.0.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.0.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.0.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.0.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.0.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.0.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.0.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.0.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.0.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.0.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.0.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.0.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.1.input_layernorm.weight": "model.safetensors",
-        "model.layers.1.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.1.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.1.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.1.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.1.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.1.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.1.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.1.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.1.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.1.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.1.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.1.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.1.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.1.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.1.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.1.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.1.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.10.input_layernorm.weight": "model.safetensors",
-        "model.layers.10.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.10.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.10.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.10.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.10.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.10.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.10.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.10.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.10.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.10.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.10.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.10.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.10.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.10.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.10.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.10.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.10.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.11.input_layernorm.weight": "model.safetensors",
-        "model.layers.11.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.11.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.11.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.11.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.11.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.11.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.11.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.11.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.11.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.11.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.11.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.11.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.11.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.11.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.11.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.11.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.11.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.12.input_layernorm.weight": "model.safetensors",
-        "model.layers.12.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.12.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.12.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.12.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.12.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.12.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.12.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.12.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.12.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.12.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.12.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.12.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.12.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.12.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.12.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.12.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.12.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.13.input_layernorm.weight": "model.safetensors",
-        "model.layers.13.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.13.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.13.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.13.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.13.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.13.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.13.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.13.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.13.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.13.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.13.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.13.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.13.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.13.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.13.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.13.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.13.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.14.input_layernorm.weight": "model.safetensors",
-        "model.layers.14.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.14.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.14.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.14.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.14.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.14.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.14.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.14.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.14.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.14.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.14.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.14.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.14.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.14.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.14.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.14.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.14.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.15.input_layernorm.weight": "model.safetensors",
-        "model.layers.15.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.15.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.15.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.15.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.15.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.15.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.15.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.15.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.15.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.15.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.15.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.15.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.15.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.15.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.15.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.15.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.15.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.2.input_layernorm.weight": "model.safetensors",
-        "model.layers.2.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.2.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.2.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.2.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.2.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.2.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.2.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.2.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.2.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.2.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.2.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.2.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.2.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.2.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.2.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.2.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.2.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.3.input_layernorm.weight": "model.safetensors",
-        "model.layers.3.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.3.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.3.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.3.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.3.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.3.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.3.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.3.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.3.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.3.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.3.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.3.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.3.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.3.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.3.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.3.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.3.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.4.input_layernorm.weight": "model.safetensors",
-        "model.layers.4.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.4.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.4.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.4.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.4.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.4.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.4.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.4.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.4.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.4.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.4.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.4.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.4.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.4.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.4.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.4.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.4.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.5.input_layernorm.weight": "model.safetensors",
-        "model.layers.5.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.5.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.5.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.5.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.5.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.5.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.5.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.5.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.5.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.5.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.5.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.5.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.5.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.5.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.5.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.5.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.5.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.6.input_layernorm.weight": "model.safetensors",
-        "model.layers.6.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.6.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.6.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.6.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.6.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.6.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.6.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.6.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.6.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.6.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.6.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.6.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.6.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.6.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.6.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.6.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.6.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.7.input_layernorm.weight": "model.safetensors",
-        "model.layers.7.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.7.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.7.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.7.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.7.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.7.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.7.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.7.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.7.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.7.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.7.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.7.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.7.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.7.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.7.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.7.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.7.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.8.input_layernorm.weight": "model.safetensors",
-        "model.layers.8.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.8.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.8.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.8.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.8.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.8.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.8.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.8.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.8.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.8.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.8.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.8.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.8.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.8.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.8.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.8.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.8.self_attn.v_proj.weight": "model.safetensors",
-        "model.layers.9.input_layernorm.weight": "model.safetensors",
-        "model.layers.9.mlp.down_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.down_proj.scales": "model.safetensors",
-        "model.layers.9.mlp.down_proj.weight": "model.safetensors",
-        "model.layers.9.mlp.gate_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.gate_proj.scales": "model.safetensors",
-        "model.layers.9.mlp.gate_proj.weight": "model.safetensors",
-        "model.layers.9.mlp.up_proj.biases": "model.safetensors",
-        "model.layers.9.mlp.up_proj.scales": "model.safetensors",
-        "model.layers.9.mlp.up_proj.weight": "model.safetensors",
-        "model.layers.9.post_attention_layernorm.weight": "model.safetensors",
-        "model.layers.9.self_attn.k_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.k_proj.scales": "model.safetensors",
-        "model.layers.9.self_attn.k_proj.weight": "model.safetensors",
-        "model.layers.9.self_attn.o_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.o_proj.scales": "model.safetensors",
-        "model.layers.9.self_attn.o_proj.weight": "model.safetensors",
-        "model.layers.9.self_attn.q_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.q_proj.scales": "model.safetensors",
-        "model.layers.9.self_attn.q_proj.weight": "model.safetensors",
-        "model.layers.9.self_attn.v_proj.biases": "model.safetensors",
-        "model.layers.9.self_attn.v_proj.scales": "model.safetensors",
-        "model.layers.9.self_attn.v_proj.weight": "model.safetensors",
-        "model.norm.weight": "model.safetensors"
     }
 }

         "total_size": 1014403072
     },
     "weight_map": {
+        "model.model.embed_tokens.biases": "model.safetensors",
+        "model.model.embed_tokens.scales": "model.safetensors",
+        "model.model.embed_tokens.weight": "model.safetensors",
+        "model.model.layers.0.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.0.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.0.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.0.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.0.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.0.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.0.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.0.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.0.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.0.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.0.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.0.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.0.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.0.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.0.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.0.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.0.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.0.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.0.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.0.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.0.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.0.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.0.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.1.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.1.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.1.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.1.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.1.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.1.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.1.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.1.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.1.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.1.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.1.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.1.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.1.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.1.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.1.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.1.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.1.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.1.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.1.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.1.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.1.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.1.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.1.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.10.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.10.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.10.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.10.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.10.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.10.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.10.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.10.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.10.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.10.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.10.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.10.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.10.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.10.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.10.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.10.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.10.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.10.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.10.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.10.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.10.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.10.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.10.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.11.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.11.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.11.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.11.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.11.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.11.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.11.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.11.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.11.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.11.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.11.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.11.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.11.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.11.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.11.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.11.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.11.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.11.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.11.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.11.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.11.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.11.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.11.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.12.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.12.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.12.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.12.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.12.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.12.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.12.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.12.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.12.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.12.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.12.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.12.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.12.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.12.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.12.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.12.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.12.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.12.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.12.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.12.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.12.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.12.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.12.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.13.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.13.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.13.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.13.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.13.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.13.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.13.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.13.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.13.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.13.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.13.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.13.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.13.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.13.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.13.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.13.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.13.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.13.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.13.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.13.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.13.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.13.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.13.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.14.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.14.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.14.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.14.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.14.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.14.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.14.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.14.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.14.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.14.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.14.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.14.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.14.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.14.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.14.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.14.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.14.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.14.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.14.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.14.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.14.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.14.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.14.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.15.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.15.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.15.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.15.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.15.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.15.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.15.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.15.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.15.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.15.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.15.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.15.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.15.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.15.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.15.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.15.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.15.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.15.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.15.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.15.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.15.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.15.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.15.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.2.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.2.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.2.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.2.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.2.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.2.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.2.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.2.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.2.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.2.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.2.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.2.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.2.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.2.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.2.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.2.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.2.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.2.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.2.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.2.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.2.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.2.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.2.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.3.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.3.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.3.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.3.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.3.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.3.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.3.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.3.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.3.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.3.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.3.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.3.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.3.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.3.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.3.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.3.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.3.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.3.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.3.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.3.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.3.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.3.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.3.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.4.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.4.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.4.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.4.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.4.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.4.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.4.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.4.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.4.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.4.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.4.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.4.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.4.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.4.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.4.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.4.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.4.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.4.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.4.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.4.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.4.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.4.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.4.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.5.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.5.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.5.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.5.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.5.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.5.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.5.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.5.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.5.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.5.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.5.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.5.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.5.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.5.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.5.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.5.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.5.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.5.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.5.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.5.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.5.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.5.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.5.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.6.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.6.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.6.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.6.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.6.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.6.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.6.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.6.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.6.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.6.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.6.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.6.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.6.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.6.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.6.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.6.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.6.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.6.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.6.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.6.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.6.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.6.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.6.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.7.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.7.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.7.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.7.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.7.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.7.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.7.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.7.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.7.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.7.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.7.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.7.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.7.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.7.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.7.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.7.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.7.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.7.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.7.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.7.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.7.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.7.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.7.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.8.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.8.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.8.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.8.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.8.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.8.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.8.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.8.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.8.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.8.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.8.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.8.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.8.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.8.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.8.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.8.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.8.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.8.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.8.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.8.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.8.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.8.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.8.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.layers.9.input_layernorm.weight": "model.safetensors",
+        "model.model.layers.9.mlp.down_proj.biases": "model.safetensors",
+        "model.model.layers.9.mlp.down_proj.scales": "model.safetensors",
+        "model.model.layers.9.mlp.down_proj.weight": "model.safetensors",
+        "model.model.layers.9.mlp.gate_proj.biases": "model.safetensors",
+        "model.model.layers.9.mlp.gate_proj.scales": "model.safetensors",
+        "model.model.layers.9.mlp.gate_proj.weight": "model.safetensors",
+        "model.model.layers.9.mlp.up_proj.biases": "model.safetensors",
+        "model.model.layers.9.mlp.up_proj.scales": "model.safetensors",
+        "model.model.layers.9.mlp.up_proj.weight": "model.safetensors",
+        "model.model.layers.9.post_attention_layernorm.weight": "model.safetensors",
+        "model.model.layers.9.self_attn.k_proj.biases": "model.safetensors",
+        "model.model.layers.9.self_attn.k_proj.scales": "model.safetensors",
+        "model.model.layers.9.self_attn.k_proj.weight": "model.safetensors",
+        "model.model.layers.9.self_attn.o_proj.biases": "model.safetensors",
+        "model.model.layers.9.self_attn.o_proj.scales": "model.safetensors",
+        "model.model.layers.9.self_attn.o_proj.weight": "model.safetensors",
+        "model.model.layers.9.self_attn.q_proj.biases": "model.safetensors",
+        "model.model.layers.9.self_attn.q_proj.scales": "model.safetensors",
+        "model.model.layers.9.self_attn.q_proj.weight": "model.safetensors",
+        "model.model.layers.9.self_attn.v_proj.biases": "model.safetensors",
+        "model.model.layers.9.self_attn.v_proj.scales": "model.safetensors",
+        "model.model.layers.9.self_attn.v_proj.weight": "model.safetensors",
+        "model.model.norm.weight": "model.safetensors"
     }
 }