JayHyeon
/

Qwen_0.5-ultrainteract_BDPO_5e-7-1ep_0.5bdpo_lambda

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-ultrainteract_BDPO_5e-7-1ep_0.5bdpo_lambda

Commit History

End of training

e195b5a
verified

JayHyeon commited on Apr 21

Model save

b9a916b
verified

JayHyeon commited on Apr 21

Training in progress, step 970

300ea23
verified

JayHyeon commited on Apr 21

Training in progress, step 500

b0f1ccb
verified

JayHyeon commited on Apr 21

End of training

e19f5b0
verified

JayHyeon commited on Mar 29

Model save

ad12bca
verified

JayHyeon commited on Mar 29

Training in progress, step 3258

0d35d7d
verified

JayHyeon commited on Mar 29

Training in progress, step 3000

c988547
verified

JayHyeon commited on Mar 29

Training in progress, step 2500

b432e43
verified

JayHyeon commited on Mar 29

Training in progress, step 2000

ec3719a
verified

JayHyeon commited on Mar 29

Training in progress, step 1500

b6a59fe
verified

JayHyeon commited on Mar 29

Training in progress, step 1000

8656476
verified

JayHyeon commited on Mar 29

Training in progress, step 500

3c8fce9
verified

JayHyeon commited on Mar 29

initial commit

0eea246
verified

JayHyeon commited on Mar 29