deepakkarkala
/

llama31-8b-dpo-qlora-test

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

4-bit precision

Model card Files Files and versions Community

llama31-8b-dpo-qlora-test

Commit History

End of training

e8508f6
verified

deepakkarkala commited on Feb 19

Model save

9a248c3
verified

deepakkarkala commited on Feb 19

Training in progress, step 76

454764f
verified

deepakkarkala commited on Feb 19

initial commit

6d5044e
verified

deepakkarkala commited on Feb 19