Haitao999
/

Qwen2.5-7B-GRPO-NM-COT_2048

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-7B-GRPO-NM-COT_2048 / tokenizer.json

Commit History

Training in progress, step 20

26fa649
verified

Haitao999 commited on Mar 22