tyzhu
/

tiny_LLaMA_1b_8k_intramask_cc_8k_iter-480000-ckpt-step-60000_hf

Text Generation

text-generation-inference

Model card Files Files and versions Community

tyzhu commited on May 20, 2024

Commit

c635b17

·

verified ·

1 Parent(s): 1c6c4a3

Upload LlamaForCausalLM

Files changed (3) hide show

config.json +2 -3
generation_config.json +2 -1
pytorch_model.bin +2 -2

config.json CHANGED Viewed

@@ -3,7 +3,6 @@
   "architectures": [
     "LlamaForCausalLM"
   ],
-  "attention_bias": false,
   "bos_token_id": 1,
   "eos_token_id": 2,
   "hidden_act": "silu",
@@ -15,13 +14,13 @@
   "num_attention_heads": 32,
   "num_hidden_layers": 22,
   "num_key_value_heads": 4,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
-  "rope_theta": 10000.0,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.34.0",
   "use_cache": true,
   "vocab_size": 32000
 }

   "architectures": [
     "LlamaForCausalLM"
   ],
   "bos_token_id": 1,
   "eos_token_id": 2,
   "hidden_act": "silu",
   "num_attention_heads": 32,
   "num_hidden_layers": 22,
   "num_key_value_heads": 4,
+  "pad_token_id": 0,
   "pretraining_tp": 1,
   "rms_norm_eps": 1e-05,
   "rope_scaling": null,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
   "use_cache": true,
   "vocab_size": 32000
 }

generation_config.json CHANGED Viewed

@@ -2,5 +2,6 @@
   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
-  "transformers_version": "4.34.0"
 }

   "_from_model_config": true,
   "bos_token_id": 1,
   "eos_token_id": 2,
+  "pad_token_id": 0,
+  "transformers_version": "4.31.0"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:46c8af9b871aa0b82b19c8a6d0689e5a523fbfb7300901c694de10313c1f4fda
-size 4400258750

 version https://git-lfs.github.com/spec/v1
+oid sha256:97faca1e99939788dda0cfeaf366391ac0ca0ac50c455861156a2bbb6c7f9b04
+size 4400268618