Mingsmilet
/

Qwen-2.5-7B-Simple-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-Simple-GRPO

Commit History

Update README.md

5d4270e
verified

Mingsmilet commited on Feb 17

Update README.md

b22d6fe
verified

Mingsmilet commited on Feb 16

Model save

10fa216
verified

Mingsmilet commited on Feb 16

initial commit

88b4b33
verified

Mingsmilet commited on Feb 16