Blancy
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Commit History

End of training

f657a83
verified

Blancy commited on 4 days ago

Model save

7d04e6e
verified

Blancy commited on 4 days ago

Training in progress, step 62

e3c259e
verified

Blancy commited on 4 days ago

End of training

339c829
verified

Blancy commited on 7 days ago

Model save

432af8b
verified

Blancy commited on 7 days ago

Training in progress, step 62

82c90dd
verified

Blancy commited on 7 days ago

End of training

eb71f5a
verified

Blancy commited on 9 days ago

Model save

69bc205
verified

Blancy commited on 9 days ago

Training in progress, step 178

f2b70a5
verified

Blancy commited on 9 days ago

End of training

fe9c678
verified

Blancy commited on 28 days ago

Model save

18e23cb
verified

Blancy commited on 28 days ago

Training in progress, step 178

415c617
verified

Blancy commited on 28 days ago

End of training

11511bd
verified

Blancy commited on 28 days ago

Model save

266f1a2
verified

Blancy commited on 28 days ago

Training in progress, step 1000

a0ebfa0
verified

Blancy commited on Apr 18

End of training

073cd96
verified

Blancy commited on Apr 14

Model save

6f7c70c
verified

Blancy commited on Apr 14

Training in progress, epoch 0

590c4bd
verified

Blancy commited on Apr 14

End of training

1594905
verified

Blancy commited on Apr 14

Model save

7869312
verified

Blancy commited on Apr 14

Training in progress, epoch 0

4c7ed6b
verified

Blancy commited on Apr 14

initial commit

51d21ff
verified

Blancy commited on Feb 26