sergiopaniego
/

Qwen2-0.5B-GRPO

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-GRPO / runs

Ctrl+K

Ctrl+K

1 contributor

History: 46 commits

sergiopaniego's picture

sergiopaniego HF Staff

Training in progress, step 170

f9264f2 verified 3 months ago