KMasaki
/

Qwen2.5-1.5B-Open-R1-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO / tokenizer_config.json

Commit History

Training in progress, epoch 0

f5c5cc8
verified

KMasaki commited on Mar 16

Model save

588db1f
verified

KMasaki commited on Feb 19