taicheng
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Sep12_12-22-03_qa-a40-005.crc.nd.edu

Commit History

Model save

d1f6790
verified

taicheng commited on Sep 12, 2024

Training in progress, step 955

1cbd8b1
verified

taicheng commited on Sep 12, 2024

Training in progress, step 900

7918a20
verified

taicheng commited on Sep 12, 2024

Training in progress, step 800

6fc398d
verified

taicheng commited on Sep 12, 2024

Training in progress, step 700

d25713d
verified

taicheng commited on Sep 12, 2024

Training in progress, step 600

b7de8ac
verified

taicheng commited on Sep 12, 2024