zijianh
/

DeepSeek-R1-Distill-Qwen-7B-RL-length-penalty-low-medium-0_05-new

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-7B-RL-length-penalty-low-medium-0_05-new

Commit History

Model save

f8aaf9f
verified

zijianh commited on Mar 23

Training in progress, step 58

c3ca971
verified

zijianh commited on Mar 23

Training in progress, step 50

c082c3a
verified

zijianh commited on Mar 23

Training in progress, step 40

d6df62c
verified

zijianh commited on Mar 23

Training in progress, step 30

eea2705
verified

zijianh commited on Mar 23

Training in progress, step 20

285514c
verified

zijianh commited on Mar 23

Training in progress, step 10

931af95
verified

zijianh commited on Mar 23

initial commit

2337d32
verified

zijianh commited on Mar 23