KMasaki
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / config.json

Commit History

End of training

a0a30e7
verified

KMasaki commited on 20 days ago

Training in progress, step 3347

1182be3
verified

KMasaki commited on 20 days ago

End of training

8578253
verified

KMasaki commited on 20 days ago

Training in progress, step 3200

805daa7
verified

KMasaki commited on 20 days ago

End of training

1b3a6df
verified

KMasaki commited on 20 days ago

Training in progress, step 400

aed6d0d
verified

KMasaki commited on 24 days ago

End of training

9f545cf
verified

KMasaki commited on 26 days ago

Training in progress, epoch 0

b482d92
verified

KMasaki commited on 26 days ago

End of training

249dd33
verified

KMasaki commited on 27 days ago

Training in progress, epoch 0

e447237
verified

KMasaki commited on 27 days ago