KMasaki
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO / all_results.json

Commit History

Model save

093d421
verified

KMasaki commited on 20 days ago

Model save

b33b9f2
verified

KMasaki commited on 20 days ago

Model save

526ad82
verified

KMasaki commited on 20 days ago

Model save

694f08c
verified

KMasaki commited on 26 days ago

Model save

c736381
verified

KMasaki commited on 27 days ago