JayHyeon
/

Qwen_1.5B-BDPO_5e-7-3ep_0.5bdpo_lambda

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_1.5B-BDPO_5e-7-3ep_0.5bdpo_lambda

Commit History

End of training

a3a03f1
verified

JayHyeon commited on 22 days ago

Model save

7fb05e3
verified

JayHyeon commited on 22 days ago

Training in progress, step 2910

8b9acb4
verified

JayHyeon commited on 22 days ago

Training in progress, step 2000

069f040
verified

JayHyeon commited on 23 days ago

Training in progress, step 1000

6090453
verified

JayHyeon commited on 23 days ago

initial commit

7bcbecb
verified

JayHyeon commited on 23 days ago