NanQiangHF
/

llama3.1_8b_dpo_bwgenerator

Generated from Trainer

Model card Files Files and versions Community

llama3.1_8b_dpo_bwgenerator / model-00001-of-00004.safetensors

Commit History

Upload LlamaForCausalLM

f660926
verified

NanQiangHF commited on 11 days ago

Upload LlamaForCausalLM

086d365
verified

NanQiangHF commited on 23 days ago

Upload LlamaForCausalLM

5a1bcca
verified

NanQiangHF commited on 24 days ago