estnafinema0
/

smolLM-variation-dpo

Text Generation

Direct Preference Optimization

text-generation-inference

Model card Files Files and versions Community

smolLM-variation-dpo

Commit History

Update README.md

16d610a
verified

estnafinema0 commited on Mar 30

Upload tokenizer

d80113e
verified

estnafinema0 commited on Mar 30

Upload LlamaForCausalLM

2208881
verified

estnafinema0 commited on Mar 30

initial commit

5e35805
verified

estnafinema0 commited on Mar 30