KMasaki
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO / tokenizer.json

Commit History

Training in progress, step 400

aabc5c0
verified

KMasaki commited on 24 days ago

Model save

92ad8b3
verified

KMasaki commited on 30 days ago

Model save

588db1f
verified

KMasaki commited on Feb 19