Blancy
/

DeepSeek-R1-Distill-Qwen-0.5B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-0.5B-GRPO / all_results.json

Commit History

Model save

a5f1ee4
verified

Blancy commited on Apr 18

Model save

d75d467
verified

Blancy commited on Apr 17

Model save

8809c7b
verified

Blancy commited on Apr 17

Model save

0e9211a
verified

Blancy commited on Apr 16