mradermacher
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Generated from Trainer

Model card Files Files and versions

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF / Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO.Q8_0.gguf

Commit History

uploaded from rich1

c2c5310
verified

mradermacher commited on 7 days ago