silvente93
/

tfm_rev12

Generated from Trainer

Model card Files Files and versions Community

silvente93 commited on Feb 4

Commit

dde7ecb

•

1 Parent(s): 1a75b77

End of training

Files changed (2) hide show

README.md +4 -2
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -35,10 +35,12 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0005
-- train_batch_size: 32
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 2

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-06
+- train_batch_size: 25
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 10
+- total_train_batch_size: 250
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - num_epochs: 2

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8ee7955e2f9ef3b73478884a05d59569cee79fe54366da2f5e0c723ca075b48
 size 6832600

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b0e68503e9ed60f4339ac380b013f7bc7225102eb7e7339392ee8e8952ae9e4
 size 6832600