Kaelan
/

Smollm2-1.7B-COT-GRPO-Lora-1epoch

text-generation-inference

Model card Files Files and versions Community

Smollm2-1.7B-COT-GRPO-Lora-1epoch

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

Kaelan's picture

Trained with Unsloth

180dfbd verified 4 months ago