Model save

Files changed (5) hide show

README.md CHANGED Viewed

@@ -34,8 +34,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: constant_with_warmup
@@ -45,7 +45,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.54.1
 - Pytorch 2.5.1+cu121
 - Datasets 3.6.0
 - Tokenizers 0.21.2

 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: constant_with_warmup
 ### Framework versions
+- Transformers 4.52.0
 - Pytorch 2.5.1+cu121
 - Datasets 3.6.0
 - Tokenizers 0.21.2

config.json CHANGED Viewed

@@ -53,7 +53,7 @@
   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.54.1",
   "use_cache": false,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.52.0",
   "use_cache": false,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -171,5 +171,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.54.1"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.52.0"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:162041a98357d334a34f317c0cf726b091b5c13eb76ecca228e9177ae570f43f
 size 5560

 version https://git-lfs.github.com/spec/v1
+oid sha256:806f10763aa920c8828349e66b90f2a06b33034c7973b0e254e167f648e8d275
 size 5560

vocab.json CHANGED Viewed

The diff for this file is too large to render. See raw diff