ununtrium
/

Qwen2.5-1.5B-Open-R1-GRPO-2rewards

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO-2rewards

Commit History

End of training

26daf8e
verified

ununtrium commited on Feb 19

Model save

f1296f5
verified

ununtrium commited on Feb 19

initial commit

9969c36
verified

ununtrium commited on Feb 19