Spaces:

Dovakiins
/

qwerrwe

Build error

winglian commited on Jul 22, 2023

Commit

1066751

1 Parent(s): 1b63bf1

don't resize embeddings to multiples of 32x by default

Files changed (2) hide show

README.md CHANGED Viewed

@@ -322,6 +322,9 @@ tokenizer_type: AutoTokenizer
 trust_remote_code:
 # use_fast option for tokenizer loading from_pretrained, default to True
 tokenizer_use_fast:
 # whether you are training a 4-bit GPTQ quantized model
 gptq: true

 trust_remote_code:
 # use_fast option for tokenizer loading from_pretrained, default to True
 tokenizer_use_fast:
+# resize the model embeddings when new tokens are added to multiples of 32
+# this is reported to improve training speed on some models
+resize_token_embeddings_to_32x:
 # whether you are training a 4-bit GPTQ quantized model
 gptq: true

src/axolotl/utils/models.py CHANGED Viewed

@@ -301,7 +301,11 @@ def load_model(
             **model_kwargs,
         )
-    embeddings_len = math.ceil(len(tokenizer) / 32) * 32
     model.resize_token_embeddings(embeddings_len)
     if (

             **model_kwargs,
         )
+    embeddings_len = (
+        math.ceil(len(tokenizer) / 32) * 32
+        if cfg.resize_token_embeddings_to_32x
+        else len(tokenizer)
+    )
     model.resize_token_embeddings(embeddings_len)
     if (