taicheng
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / README.md

Commit History

End of training

73cd53d
verified

taicheng commited on Sep 13, 2024

Model save

0993a3c
verified

taicheng commited on Sep 13, 2024

Model save

d1f6790
verified

taicheng commited on Sep 12, 2024