ShenaoZ
/

0.0001_withdpo_3iters_bs256_551lr_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

0.0001_withdpo_3iters_bs256_551lr_iter_1

Commit History

End of training

2967a44
verified

ShenaoZ commited on May 3, 2024

Model save

8a67cc9
verified

ShenaoZ commited on May 3, 2024

initial commit

44b28f1
verified

ShenaoZ commited on May 3, 2024