ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all-RL

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all-RL

File size: 152 Bytes

8d710c6

Base Model: ReasoningEval/DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all

Training Epochs: 3

Training Objective: RL

Training Data: ReasoningEval/Huatuo-RL