ubermenchh
/

SmolLM2-DPO-ultrafeedback-binarized-preferences

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

SmolLM2-DPO-ultrafeedback-binarized-preferences

Commit History

End of training

c0db0bf
verified

ubermenchh commited on Feb 2

initial commit

6d73cf7
verified

ubermenchh commited on Feb 2