himanshushukla12
/

Qwen2-0.5B-GRPO-test

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO-test / runs

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

himanshushukla12's picture

himanshushukla12

Model save

9730220 verified 10 days ago