5 18 4

Xiyao Wang

russwang

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

upvoted a paper 7 days ago

ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation

updated a dataset 9 days ago

russwang/LLaVA-Critic-GRPO-shortprompt

View all activity

Organizations

upvoted a paper 2 days ago

SPIRAL: Self-Play on Zero-Sum Games Incentivizes Reasoning via Multi-Agent Multi-Turn Reinforcement Learning

Paper • 2506.24119 • Published 3 days ago • 35

upvoted a paper 7 days ago

ShareGPT-4o-Image: Aligning Multimodal Models with GPT-4o-Level Image Generation

Paper • 2506.18095 • Published 11 days ago • 63

updated a dataset 9 days ago

russwang/LLaVA-Critic-GRPO-shortprompt

Viewer • Updated 9 days ago • 40.2k

published a dataset 9 days ago

russwang/LLaVA-Critic-GRPO-shortprompt

Viewer • Updated 9 days ago • 40.2k

updated a dataset 10 days ago

russwang/LLaVA-Critic-GRPO

Viewer • Updated 10 days ago • 40.2k

published a dataset 10 days ago

russwang/LLaVA-Critic-GRPO

Viewer • Updated 10 days ago • 40.2k

updated a dataset 16 days ago

russwang/Thinklite-hard11k

Viewer • Updated 16 days ago • 11k • 65

published a dataset 16 days ago

russwang/Thinklite-hard11k

Viewer • Updated 16 days ago • 11k • 65

updated a dataset 16 days ago

russwang/MMK12

Viewer • Updated 16 days ago • 15.6k • 65

published a dataset 16 days ago

russwang/MMK12

Viewer • Updated 16 days ago • 15.6k • 65

authored a paper 17 days ago

ViCrit: A Verifiable Reinforcement Learning Proxy Task for Visual Perception in VLMs

Paper • 2506.10128 • Published 22 days ago • 22

upvoted a paper 17 days ago

ViCrit: A Verifiable Reinforcement Learning Proxy Task for Visual Perception in VLMs

Paper • 2506.10128 • Published 22 days ago • 22

updated a collection 17 days ago

ViCrit

Collection

5 items • Updated 17 days ago • 1

commented a paper 17 days ago

ViCrit: A Verifiable Reinforcement Learning Proxy Task for Visual Perception in VLMs

Paper • 2506.10128 • Published 22 days ago • 22 •

updated a collection 22 days ago

ViCrit

Collection

5 items • Updated 17 days ago • 1

updated a collection 23 days ago

ViCrit

Collection

5 items • Updated 17 days ago • 1

authored a paper 23 days ago

MORSE-500: A Programmatically Controllable Video Benchmark to Stress-Test Multimodal Reasoning

Paper • 2506.05523 • Published 28 days ago • 33

Xiyao Wang

AI & ML interests

Recent Activity

Organizations

russwang's activity