Dongwei
/

DeepSeek-R1-Distill-Qwen-7B-GRPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-GRPO

Commit History

End of training

177ffda
verified

Dongwei commited on 12 days ago

Model save

385d039
verified

Dongwei commited on 12 days ago

Model save

521ec25
verified

Dongwei commited on 12 days ago

Model save

71a6027
verified

Dongwei commited on 12 days ago

initial commit

6a40c47
verified

Dongwei commited on 14 days ago