Haitao999
/

Qwen2.5-7B-GRPO-NM-COT-20K-2epoch

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-7B-GRPO-NM-COT-20K-2epoch

Commit History

End of training

5aa8424
verified

Haitao999 commited on Apr 2

Model save

05d7c11
verified

Haitao999 commited on Apr 2

initial commit

43e698d
verified

Haitao999 commited on Apr 1