nomadicsynth
/

Qwen2.5-3B-Instruct-Reasoning-gsm8k-cosine-reward-lora

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-Reasoning-gsm8k-cosine-reward-lora

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

nomadicsynth's picture

Trained with Unsloth

287fc0f verified 5 months ago