JayHyeon
/

Qwen_0.5-ultrainteract_BDPO_5e-7-1ep_0.5bdpo_lambda

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen_0.5-ultrainteract_BDPO_5e-7-1ep_0.5bdpo_lambda / model.safetensors

Commit History

Training in progress, step 970

300ea23
verified

JayHyeon commited on Apr 21

Training in progress, step 500

b0f1ccb
verified

JayHyeon commited on Apr 21

Training in progress, step 3258

0d35d7d
verified

JayHyeon commited on Mar 29

Training in progress, step 3000

c988547
verified

JayHyeon commited on Mar 29

Training in progress, step 2500

b432e43
verified

JayHyeon commited on Mar 29

Training in progress, step 2000

ec3719a
verified

JayHyeon commited on Mar 29

Training in progress, step 1500

b6a59fe
verified

JayHyeon commited on Mar 29

Training in progress, step 1000

8656476
verified

JayHyeon commited on Mar 29

Training in progress, step 500

3c8fce9
verified

JayHyeon commited on Mar 29