sroecker
/

Qwen-1.B-GRPO-gsm8k-1000

text-generation-inference

Model card Files Files and versions Community

Qwen-1.B-GRPO-gsm8k-1000 / vocab.json

Commit History

Trained with Unsloth

40b1c5d
verified

sroecker commited on Feb 4