mradermacher
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Generated from Trainer

Model card Files Files and versions

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF / README.md

Commit History

auto-patch README.md

6b122cd
verified

mradermacher commited on 5 days ago

auto-patch README.md

375d1cc
verified

mradermacher commited on 7 days ago

auto-patch README.md

dc333b2
verified

mradermacher commited on 7 days ago

uploaded from rich1

d4d3bfb
verified

mradermacher commited on 7 days ago