himanshushukla12
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / merges.txt

himanshushukla12's picture

himanshushukla12

Model save

9730220 verified 10 days ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.