jdineen
/

Llama-3.1-8B-DPO-Baseline-wjb-1600-vanilla-harmful-100steps

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.1-8B-DPO-Baseline-wjb-1600-vanilla-harmful-100steps

Commit History

End of training

e42a5ad
verified

jdineen commited on May 8

Model save

f6c73fb
verified

jdineen commited on May 8

Training in progress, step 100

64d05ab
verified

jdineen commited on May 8

initial commit

3e1031d
verified

jdineen commited on May 8