vanshikasundrani
/

english-hindi-colloquial-translator

Generated from Trainer

Model card Files Files and versions Community

vanshikasundrani commited on Feb 21

Commit

37aba72

·

verified ·

1 Parent(s): 58310fd

Model save

Files changed (2) hide show

README.md +7 -9
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -17,7 +17,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [unsloth/mistral-7b-bnb-4bit](https://huggingface.co/unsloth/mistral-7b-bnb-4bit) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 4.4128
 ## Model description
@@ -37,22 +37,20 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
-- train_batch_size: 8
-- eval_batch_size: 8
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- lr_scheduler_warmup_steps: 50
-- num_epochs: 5
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
-| 3.4948        | 1.5385 | 100  | 4.4128          |
-| 3.4785        | 3.0769 | 200  | 4.4128          |
-| 3.5234        | 4.6154 | 300  | 4.4128          |
 ### Framework versions
@@ -60,5 +58,5 @@ The following hyperparameters were used during training:
 - PEFT 0.14.0
 - Transformers 4.48.3
 - Pytorch 2.6.0+cu124
-- Datasets 3.3.1
 - Tokenizers 0.21.0

 This model is a fine-tuned version of [unsloth/mistral-7b-bnb-4bit](https://huggingface.co/unsloth/mistral-7b-bnb-4bit) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 8.7228
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 0.0003
+- train_batch_size: 12
+- eval_batch_size: 12
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 2
+- num_epochs: 8
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch  | Step | Validation Loss |
 |:-------------:|:------:|:----:|:---------------:|
+| 4.6198        | 5.9701 | 400  | 8.7228          |
 ### Framework versions
 - PEFT 0.14.0
 - Transformers 4.48.3
 - Pytorch 2.6.0+cu124
+- Datasets 3.3.2
 - Tokenizers 0.21.0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c00ad72f6dd64ef5d99abcdd2dee56e93b5d638a307be275d690d8c41e90f7a8
 size 54560368

 version https://git-lfs.github.com/spec/v1
+oid sha256:f2a84c8123be7b23330a1391eb8d4e0008b566b113078af911689ee270aa76c3
 size 54560368