chloeli
/

qwen-2.5-0.5B-instruct-sft-lora-countdown-o3-5k

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Model card Files Files and versions Community

qwen-2.5-0.5B-instruct-sft-lora-countdown-o3-5k / tokenizer_config.json

Commit History

Training in progress, step 100

c1cfee5
verified

chloeli commited on 12 days ago