ReasoningEval
/

DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all-RL

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all-RL / README.md

shengliu66's picture

Update README.md

8d710c6 verified 9 days ago

|

history blame contribute delete

152 Bytes

	Base Model: ReasoningEval/DeepSeek-R1-Distill-Qwen-7B-Huatuo-SFT-all

	Training Epochs: 3

	Training Objective: RL

	Training Data: ReasoningEval/Huatuo-RL