zijianh
/

DeepSeek-R1-Distill-Qwen-7B-RL-length-penalty-low-high-0_5-new

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-RL-length-penalty-low-high-0_5-new

Commit History

Training in progress, step 58

d0736a5
verified

zijianh commited on Mar 22

Training in progress, step 50

263ac95
verified

zijianh commited on Mar 22

Training in progress, step 40

b0e9a9a
verified

zijianh commited on Mar 22

Training in progress, step 30

d51cf42
verified

zijianh commited on Mar 22

Training in progress, step 20

ccc6a28
verified

zijianh commited on Mar 22

Training in progress, step 10

a6b5e0a
verified

zijianh commited on Mar 22

initial commit

f2b7775
verified

zijianh commited on Mar 22