AmberYifan
/

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-14B-Instruct-ultrafeedback-spin-iter1-RPO / train_results.json

Commit History

Model save

8292808
verified

AmberYifan commited on 7 days ago