shenxq
/

zephyr-7b-dpo-qlora-pairrm

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Community

zephyr-7b-dpo-qlora-pairrm / README.md

Commit History

End of training

26127fb
verified

shenxq commited on Mar 19, 2024

Model save

c7bc043
verified

shenxq commited on Mar 19, 2024

End of training

193ff66
verified

shenxq commited on Mar 19, 2024

Model save

41409cb
verified

shenxq commited on Mar 19, 2024