himanshushukla12
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-test

Commit History

End of training

d1ae942
verified

himanshushukla12 commited on 10 days ago

Model save

9730220
verified

himanshushukla12 commited on 10 days ago

initial commit

98e7418
verified

himanshushukla12 commited on 10 days ago