Haitao999
/

Qwen2.5-7B-GRPO-NM-COT-20K

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

Qwen2.5-7B-GRPO-NM-COT-20K / runs /Apr01_11-12-53_SH-IDC1-10-140-1-45

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

Haitao999's picture

Model save

48d3732 verified 3 months ago

events.out.tfevents.1743477401.SH-IDC1-10-140-1-45

6.37 kB
LFS

Model save 3 months ago