CharlesLi
/

OpenELM-1_1B-DPO-full-max-6-reward

Text Generation

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

OpenELM-1_1B-DPO-full-max-6-reward / runs

Commit History

Model save

79746cb
verified

CharlesLi commited on Oct 7, 2024

Model save

30bb95c
verified

CharlesLi commited on Oct 6, 2024

Model save

9ad5984
verified

CharlesLi commited on Oct 5, 2024

Model save

0efffe3
verified

CharlesLi commited on Sep 16, 2024