chloeli
/

qwen-2.5-0.5B-instruct-sft-lora-countdown-o3-5k

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Model card Files Files and versions Community

qwen-2.5-0.5B-instruct-sft-lora-countdown-o3-5k / README.md

Commit History

End of training

6d682b2
verified

chloeli commited on 12 days ago

Model save

09f9928
verified

chloeli commited on 12 days ago