THUDM
/

LongReward-llama3.1-8b-DPO

Text Generation

text-generation-inference

Model card Files Files and versions Community

LongReward-llama3.1-8b-DPO / README.md

Commit History

Update README.md

7311e4c
verified

NeoZ123 commited on Oct 29, 2024

Update README.md

d89db22
verified

NeoZ123 commited on Oct 29, 2024

add readme

db7b354

davidlvxin commited on Oct 22, 2024