Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

config.json +52 -52
model-00001-of-00003.safetensors +2 -2
model-00002-of-00003.safetensors +2 -2
model-00003-of-00003.safetensors +2 -2
model.safetensors.index.json +192 -197
tokenizer_config.json +31 -31

config.json CHANGED Viewed

@@ -25,81 +25,81 @@
       "multi_modal_projector",
       "merger",
       "modality_projection",
-      "language_model.model.layers.1.mlp",
       "language_model.model.layers.13.mlp",
       "language_model.model.layers.3.self_attn",
-      "language_model.model.layers.4.mlp",
-      "language_model.model.layers.7.self_attn",
       "language_model.model.layers.0.mlp",
-      "language_model.model.layers.17.mlp",
-      "language_model.model.layers.18.self_attn",
       "language_model.model.layers.5.mlp",
-      "language_model.model.layers.16.self_attn",
-      "language_model.model.layers.11.mlp",
-      "language_model.model.layers.19.self_attn",
-      "language_model.model.layers.6.mlp",
-      "vision_tower.vision_model.encoder.layers.23.self_attn",
-      "language_model.model.layers.10.self_attn",
-      "language_model.model.layers.18.mlp",
       "language_model.model.layers.8.mlp",
-      "language_model.model.layers.12.mlp",
-      "vision_tower.vision_model.encoder.layers.26.self_attn",
-      "language_model.model.layers.14.mlp",
       "language_model.model.layers.7.mlp",
-      "language_model.model.layers.2.mlp",
-      "vision_tower.vision_model.encoder.layers.23.mlp",
-      "vision_tower.vision_model.encoder.layers.24.self_attn",
       "vision_tower.vision_model.encoder.layers.20.self_attn",
-      "vision_tower.vision_model.encoder.layers.21.self_attn",
-      "language_model.model.layers.3.mlp",
-      "vision_tower.vision_model.encoder.layers.22.self_attn",
-      "vision_tower.vision_model.encoder.layers.24.mlp",
-      "vision_tower.vision_model.encoder.layers.21.mlp",
-      "vision_tower.vision_model.encoder.layers.15.self_attn",
-      "vision_tower.vision_model.encoder.layers.16.self_attn",
       "vision_tower.vision_model.encoder.layers.25.self_attn",
-      "vision_tower.vision_model.encoder.layers.18.mlp",
       "vision_tower.vision_model.encoder.layers.15.mlp",
-      "vision_tower.vision_model.encoder.layers.18.self_attn",
       "vision_tower.vision_model.encoder.layers.17.self_attn",
-      "vision_tower.vision_model.encoder.layers.19.self_attn",
       "vision_tower.vision_model.encoder.layers.22.mlp",
-      "vision_tower.vision_model.encoder.layers.25.mlp",
       "vision_tower.vision_model.encoder.layers.17.mlp",
-      "vision_tower.vision_model.encoder.layers.20.mlp",
       "vision_tower.vision_model.encoder.layers.19.mlp",
-      "vision_tower.vision_model.encoder.layers.13.mlp",
       "vision_tower.vision_model.encoder.layers.14.self_attn",
-      "vision_tower.vision_model.encoder.layers.16.mlp",
-      "vision_tower.vision_model.encoder.layers.14.mlp",
       "vision_tower.vision_model.encoder.layers.13.self_attn",
-      "vision_tower.vision_model.encoder.layers.5.mlp",
-      "vision_tower.vision_model.encoder.layers.10.self_attn",
-      "vision_tower.vision_model.encoder.layers.8.mlp",
-      "vision_tower.vision_model.encoder.layers.9.mlp",
       "vision_tower.vision_model.encoder.layers.11.mlp",
-      "vision_tower.vision_model.encoder.layers.6.self_attn",
-      "vision_tower.vision_model.encoder.layers.10.mlp",
-      "vision_tower.vision_model.encoder.layers.9.self_attn",
-      "vision_tower.vision_model.encoder.layers.11.self_attn",
       "vision_tower.vision_model.encoder.layers.8.self_attn",
-      "vision_tower.vision_model.encoder.layers.12.mlp",
       "vision_tower.vision_model.encoder.layers.7.mlp",
-      "vision_tower.vision_model.encoder.layers.5.self_attn",
-      "vision_tower.vision_model.encoder.layers.12.self_attn",
       "vision_tower.vision_model.encoder.layers.3.self_attn",
       "vision_tower.vision_model.encoder.layers.1.self_attn",
-      "vision_tower.vision_model.encoder.layers.6.mlp",
-      "vision_tower.vision_model.encoder.layers.7.self_attn",
-      "vision_tower.vision_model.encoder.layers.4.self_attn",
       "vision_tower.vision_model.encoder.layers.3.mlp",
-      "vision_tower.vision_model.encoder.layers.4.mlp",
       "vision_tower.vision_model.encoder.layers.2.mlp",
-      "vision_tower.vision_model.encoder.layers.1.mlp",
       "vision_tower.vision_model.encoder.layers.2.self_attn",
-      "vision_tower.vision_model.encoder.layers.26.mlp",
-      "vision_tower.vision_model.encoder.layers.0.self_attn",
-      "vision_tower.vision_model.encoder.layers.0.mlp"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,

       "multi_modal_projector",
       "merger",
       "modality_projection",
+      "language_model.model.layers.4.self_attn",
+      "language_model.model.layers.2.self_attn",
       "language_model.model.layers.13.mlp",
+      "language_model.model.layers.2.mlp",
+      "language_model.model.layers.11.mlp",
       "language_model.model.layers.3.self_attn",
+      "language_model.model.layers.12.mlp",
+      "language_model.model.layers.6.self_attn",
+      "language_model.model.layers.0.self_attn",
+      "language_model.model.layers.10.mlp",
+      "language_model.model.layers.5.self_attn",
+      "language_model.model.layers.9.mlp",
+      "language_model.model.layers.1.mlp",
       "language_model.model.layers.0.mlp",
+      "language_model.model.layers.4.mlp",
       "language_model.model.layers.5.mlp",
       "language_model.model.layers.8.mlp",
+      "language_model.model.layers.7.self_attn",
+      "language_model.model.layers.3.mlp",
       "language_model.model.layers.7.mlp",
+      "language_model.model.layers.6.mlp",
+      "vision_tower.vision_model.encoder.layers.26.self_attn",
+      "vision_tower.vision_model.encoder.layers.19.self_attn",
+      "vision_tower.vision_model.encoder.layers.25.mlp",
       "vision_tower.vision_model.encoder.layers.20.self_attn",
+      "vision_tower.vision_model.encoder.layers.18.self_attn",
       "vision_tower.vision_model.encoder.layers.25.self_attn",
+      "vision_tower.vision_model.encoder.layers.22.self_attn",
       "vision_tower.vision_model.encoder.layers.15.mlp",
+      "vision_tower.vision_model.encoder.layers.24.mlp",
       "vision_tower.vision_model.encoder.layers.17.self_attn",
+      "vision_tower.vision_model.encoder.layers.20.mlp",
       "vision_tower.vision_model.encoder.layers.22.mlp",
       "vision_tower.vision_model.encoder.layers.17.mlp",
+      "vision_tower.vision_model.encoder.layers.16.mlp",
+      "vision_tower.vision_model.encoder.layers.23.mlp",
+      "vision_tower.vision_model.encoder.layers.16.self_attn",
+      "vision_tower.vision_model.encoder.layers.24.self_attn",
+      "vision_tower.vision_model.encoder.layers.23.self_attn",
       "vision_tower.vision_model.encoder.layers.19.mlp",
       "vision_tower.vision_model.encoder.layers.14.self_attn",
+      "vision_tower.vision_model.encoder.layers.12.mlp",
+      "vision_tower.vision_model.encoder.layers.15.self_attn",
+      "vision_tower.vision_model.encoder.layers.21.self_attn",
+      "vision_tower.vision_model.encoder.layers.21.mlp",
+      "vision_tower.vision_model.encoder.layers.10.mlp",
       "vision_tower.vision_model.encoder.layers.13.self_attn",
+      "vision_tower.vision_model.encoder.layers.14.mlp",
+      "vision_tower.vision_model.encoder.layers.13.mlp",
+      "vision_tower.vision_model.encoder.layers.18.mlp",
       "vision_tower.vision_model.encoder.layers.11.mlp",
+      "vision_tower.vision_model.encoder.layers.9.mlp",
+      "vision_tower.vision_model.encoder.layers.8.mlp",
+      "vision_tower.vision_model.encoder.layers.10.self_attn",
+      "vision_tower.vision_model.encoder.layers.12.self_attn",
+      "vision_tower.vision_model.encoder.layers.6.mlp",
       "vision_tower.vision_model.encoder.layers.8.self_attn",
       "vision_tower.vision_model.encoder.layers.7.mlp",
+      "vision_tower.vision_model.encoder.layers.11.self_attn",
+      "vision_tower.vision_model.encoder.layers.5.mlp",
+      "vision_tower.vision_model.encoder.layers.4.mlp",
+      "vision_tower.vision_model.encoder.layers.4.self_attn",
+      "vision_tower.vision_model.encoder.layers.7.self_attn",
+      "vision_tower.vision_model.encoder.layers.9.self_attn",
+      "vision_tower.vision_model.encoder.layers.6.self_attn",
       "vision_tower.vision_model.encoder.layers.3.self_attn",
+      "vision_tower.vision_model.encoder.layers.5.self_attn",
       "vision_tower.vision_model.encoder.layers.1.self_attn",
+      "vision_tower.vision_model.encoder.layers.1.mlp",
       "vision_tower.vision_model.encoder.layers.3.mlp",
+      "vision_tower.vision_model.encoder.layers.0.self_attn",
       "vision_tower.vision_model.encoder.layers.2.mlp",
+      "vision_tower.vision_model.encoder.layers.0.mlp",
       "vision_tower.vision_model.encoder.layers.2.self_attn",
+      "vision_tower.vision_model.encoder.layers.26.mlp"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:65c40514ec3214bd0c5fa5466cec219db978c16360382448a96bd6bf40b95dd6
-size 4960125164

 version https://git-lfs.github.com/spec/v1
+oid sha256:9c1cdbe5e9e26335156628ea27119df51624116d1621e7fa8c497d83faeb75c5
+size 4909879825

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0396b9cc8d889d70cd1f15abc8827e22a14a1bfa3b156cd23339d4c106b8468e
-size 4970712399

 version https://git-lfs.github.com/spec/v1
+oid sha256:f45468be8776aed37b4b129b0386c9de6a22d83ace45d37ba0f9eb598bc53cf0
+size 4974472887

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3cd951c9b3acbfb4d5c19e2e6ff7bfd3cd285ad0e75832618ed3e98b6645ad6
-size 2836985438

 version https://git-lfs.github.com/spec/v1
+oid sha256:b13dfd800763fed1abb087b4df1c9ebf81274906559c1230fb6545e89602ca0c
+size 2690885809

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 12767500929
   },
   "weight_map": {
     "language_model.model.embed_tokens.weight": "model-00001-of-00003.safetensors",
@@ -13,30 +13,10 @@
     "language_model.model.layers.0.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.k_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.k_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.k_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.k_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.o_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.o_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.o_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.o_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.q_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.q_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.q_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.q_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.v_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.v_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.v_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.v_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.0.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
@@ -72,32 +52,37 @@
     "language_model.model.layers.1.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.10.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
@@ -199,8 +184,23 @@
     "language_model.model.layers.13.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -302,14 +302,49 @@
     "language_model.model.layers.16.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -341,17 +376,52 @@
     "language_model.model.layers.17.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -376,10 +446,30 @@
     "language_model.model.layers.19.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
@@ -389,30 +479,10 @@
     "language_model.model.layers.2.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -557,28 +627,28 @@
     "language_model.model.layers.22.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.input_layernorm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.23.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -612,47 +682,47 @@
     "language_model.model.layers.24.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.25.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
@@ -1386,39 +1456,19 @@
     "language_model.model.layers.39.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.39.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.39.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.4.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.post_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.k_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.k_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.k_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.k_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.o_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.o_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.o_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.o_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.q_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.q_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.q_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.q_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.v_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.v_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.v_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.v_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.4.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.40.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.40.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.40.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
@@ -1805,37 +1855,17 @@
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.5.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.6.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
@@ -1845,30 +1875,10 @@
     "language_model.model.layers.6.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
@@ -1917,23 +1927,8 @@
     "language_model.model.layers.8.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.9.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",

 {
   "metadata": {
+    "total_size": 12574916961
   },
   "weight_map": {
     "language_model.model.embed_tokens.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.10.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.10.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.13.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.16.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.24.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.24.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.25.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.39.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.39.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.39.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.4.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.4.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.4.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "language_model.model.layers.4.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.4.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.4.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.4.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.40.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.40.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.40.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.5.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",

tokenizer_config.json CHANGED Viewed

@@ -1107,7 +1107,7 @@
       "special": false
     },
     "138": {
-      "content": "▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1115,7 +1115,7 @@
       "special": false
     },
     "139": {
-      "content": "▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1123,7 +1123,7 @@
       "special": false
     },
     "140": {
-      "content": "▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1131,7 +1131,7 @@
       "special": false
     },
     "141": {
-      "content": "▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1139,7 +1139,7 @@
       "special": false
     },
     "142": {
-      "content": "▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1147,7 +1147,7 @@
       "special": false
     },
     "143": {
-      "content": "▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1155,7 +1155,7 @@
       "special": false
     },
     "144": {
-      "content": "▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1163,7 +1163,7 @@
       "special": false
     },
     "145": {
-      "content": "▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1171,7 +1171,7 @@
       "special": false
     },
     "146": {
-      "content": "▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1179,7 +1179,7 @@
       "special": false
     },
     "147": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1187,7 +1187,7 @@
       "special": false
     },
     "148": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1195,7 +1195,7 @@
       "special": false
     },
     "149": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1203,7 +1203,7 @@
       "special": false
     },
     "150": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1211,7 +1211,7 @@
       "special": false
     },
     "151": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1219,7 +1219,7 @@
       "special": false
     },
     "152": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1227,7 +1227,7 @@
       "special": false
     },
     "153": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1235,7 +1235,7 @@
       "special": false
     },
     "154": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1243,7 +1243,7 @@
       "special": false
     },
     "155": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1251,7 +1251,7 @@
       "special": false
     },
     "156": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1259,7 +1259,7 @@
       "special": false
     },
     "157": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1267,7 +1267,7 @@
       "special": false
     },
     "158": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1275,7 +1275,7 @@
       "special": false
     },
     "159": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1283,7 +1283,7 @@
       "special": false
     },
     "160": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1291,7 +1291,7 @@
       "special": false
     },
     "161": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1299,7 +1299,7 @@
       "special": false
     },
     "162": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1307,7 +1307,7 @@
       "special": false
     },
     "163": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1315,7 +1315,7 @@
       "special": false
     },
     "164": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1323,7 +1323,7 @@
       "special": false
     },
     "165": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1331,7 +1331,7 @@
       "special": false
     },
     "166": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1339,7 +1339,7 @@
       "special": false
     },
     "167": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -51344,4 +51344,4 @@
   "tokenizer_class": "GemmaTokenizer",
   "unk_token": "<unk>",
   "use_default_system_prompt": false
-}

       "special": false
     },
     "138": {
+      "content": "\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "139": {
+      "content": "\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "140": {
+      "content": "\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "141": {
+      "content": "\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "142": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "143": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "144": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "145": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "146": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "147": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "148": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "149": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "150": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "151": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "152": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "153": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "154": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "155": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "156": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "157": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "158": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "159": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "160": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "161": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "162": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "163": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "164": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "165": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "166": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "167": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
   "tokenizer_class": "GemmaTokenizer",
   "unk_token": "<unk>",
   "use_default_system_prompt": false
+}