CodeGoat24
/

UnifiedReward-Think-7b

Model card Files Files and versions

CodeGoat24 commited on 18 days ago

Commit

f157db6

·

verified ·

1 Parent(s): 373d46a

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -112,9 +112,9 @@ print(text_outputs[0])
 ## Citation
 ```
-@article{UnifiedReward-Think,
-  title={Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning.},
-  author={Wang, Yibin and Li, Zhimin and Zang, Yuhang and Wang, Chunyu and Lu, Qinglin, and Jin, Cheng and Wang, Jiaqi},
   journal={arXiv preprint arXiv:2505.03318},
   year={2025}
 }

 ## Citation
 ```
+@article{unifiedreward-think,
+  title={Unified multimodal chain-of-thought reward model through reinforcement fine-tuning},
+  author={Wang, Yibin and Li, Zhimin and Zang, Yuhang and Wang, Chunyu and Lu, Qinglin and Jin, Cheng and Wang, Jiaqi},
   journal={arXiv preprint arXiv:2505.03318},
   year={2025}
 }