EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old / trainer_state.json

EllieS's picture

Model save

8c89d20 verified 12 months ago

history contribute delete

369 kB

File too large to display, you can check the raw version instead.