EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old / runs /Feb23_07-46-59_586cb8b6da8c

1 contributor

History: 8 commits

EllieS's picture

Model save

8c89d20 verified about 1 year ago

events.out.tfevents.1708674753.586cb8b6da8c.16472.0

491 kB
LFS

Model save about 1 year ago
events.out.tfevents.1708707204.586cb8b6da8c.16472.1

828 Bytes
LFS

Model save about 1 year ago