15 12 8

Yihe Deng PRO

ydeng9

https://yihe-deng.notion.site/Yihe-Deng-167ab2d2c1fb80b3a76dfb120f716c84

Yihe__Deng

AI & ML interests

LLM post-training

Recent Activity

published a dataset 10 days ago

ydeng9/llavaone_grpo_v2

published a dataset 10 days ago

ydeng9/OpenVLThinker_sft_iter2

upvoted a paper 15 days ago

When To Solve, When To Verify: Compute-Optimal Problem Solving and Generative Verification for LLM Reasoning

View all activity

Organizations

ydeng9's activity

published 2 datasets 10 days ago

ydeng9/llavaone_grpo_v2

Viewer • Updated Mar 15 • 3.11k • 45 • 1

ydeng9/OpenVLThinker_sft_iter2

Viewer • Updated 26 days ago • 5.54k • 5

upvoted a paper 15 days ago

When To Solve, When To Verify: Compute-Optimal Problem Solving and Generative Verification for LLM Reasoning

Paper • 2504.01005 • Published 17 days ago • 15

upvoted a paper 16 days ago

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published 18 days ago • 61

New activity in ydeng9/OpenVLThinker-7B 23 days ago

Highlight code

#2 opened 24 days ago by

nielsr

New activity in ydeng9/OpenVLThinker-7B 24 days ago

Add library name and pipeline tag

#1 opened 25 days ago by

nielsr

updated a model 24 days ago

ydeng9/OpenVLThinker-7B

Image-Text-to-Text • Updated 23 days ago • 652 • 16

liked a model 24 days ago

ydeng9/OpenVLThinker-7B

Image-Text-to-Text • Updated 23 days ago • 652 • 16

authored a paper 25 days ago

OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement

Paper • 2503.17352 • Published 27 days ago • 22

upvoted a paper 25 days ago

OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement

Paper • 2503.17352 • Published 27 days ago • 22

commented a paper 25 days ago

OpenVLThinker: An Early Exploration to Complex Vision-Language Reasoning via Iterative Self-Improvement

Paper • 2503.17352 • Published 27 days ago • 22 •

updated a dataset 26 days ago

ydeng9/OpenVLThinker_sft_iter2

Viewer • Updated 26 days ago • 5.54k • 5

published a model 28 days ago

ydeng9/OpenVLThinker-7B

Image-Text-to-Text • Updated 23 days ago • 652 • 16

updated a dataset about 1 month ago

ydeng9/captioned-data-subsetv1

Viewer • Updated about 1 month ago • 59.3k • 64

published a dataset about 1 month ago

ydeng9/captioned-data-subsetv1

Viewer • Updated about 1 month ago • 59.3k • 64

updated 3 datasets about 1 month ago