tsessk
/

SmolLM2-FT-Summarization-Aligned

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

tsessk commited on May 9

Commit

6ec1942

·

verified ·

1 Parent(s): 773a1e3

Model save

Files changed (2) hide show

README.md +4 -4
generation_config.json +1 -1

README.md CHANGED Viewed

@@ -27,7 +27,7 @@ print(output["generated_text"])
 ## Training procedure
-[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/tsessk/SmolLM2-alignment/runs/d16rjtrf)
 This model was trained with DPO, a method introduced in [Direct Preference Optimization: Your Language Model is Secretly a Reward Model](https://huggingface.co/papers/2305.18290).
@@ -35,10 +35,10 @@ This model was trained with DPO, a method introduced in [Direct Preference Optim
 ### Framework versions
 - TRL: 0.17.0
-- Transformers: 4.51.3
-- Pytorch: 2.6.0+cu124
 - Datasets: 3.6.0
-- Tokenizers: 0.21.1
 ## Citations

 ## Training procedure
+[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/tsessk/SmolLM2-alignment/runs/95alwlls)
 This model was trained with DPO, a method introduced in [Direct Preference Optimization: Your Language Model is Secretly a Reward Model](https://huggingface.co/papers/2305.18290).
 ### Framework versions
 - TRL: 0.17.0
+- Transformers: 4.48.3
+- Pytorch: 2.5.1+cu124
 - Datasets: 3.6.0
+- Tokenizers: 0.21.0
 ## Citations

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 2,
-  "transformers_version": "4.51.3"
 }

   "bos_token_id": 1,
   "eos_token_id": 2,
   "pad_token_id": 2,
+  "transformers_version": "4.48.3"
 }