krisezra87
/

Qwen2.5-1.5B-Open-R1-Code-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-Code-GRPO / model.safetensors

Commit History

Training in progress, step 502

d5d80c2
verified

krisezra87 commited on May 3

Training in progress, step 501

7c54f42
verified

krisezra87 commited on May 3

Training in progress, step 450

15347dc
verified

krisezra87 commited on May 3

Training in progress, step 400

9627d23
verified

krisezra87 commited on May 3

Training in progress, step 350

7fe0da2
verified

krisezra87 commited on May 3

Training in progress, step 300

aef2a4d
verified

krisezra87 commited on May 2

Training in progress, step 250

3f6a1fd
verified

krisezra87 commited on May 2

Training in progress, step 200

072bda2
verified

krisezra87 commited on May 2

Training in progress, step 150

75797e5
verified

krisezra87 commited on May 2

Training in progress, step 100

6c29afc
verified

krisezra87 commited on May 2

Training in progress, step 50

c023668
verified

krisezra87 commited on May 2