mradermacher
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Generated from Trainer

Model card Files Files and versions

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

mradermacher's picture

uploaded from rich1

d3d9186 verified 7 days ago