mradermacher
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Generated from Trainer

Model card Files Files and versions

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO-GGUF

Ctrl+K

Ctrl+K

1 contributor

History: 4 commits

mradermacher's picture

uploaded from rich1

6530f78 verified 7 days ago