Hao Li's picture

5

Hao Li

cpsxhao

·

https://cpsxhao.github.io

cpsxhao

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

upvoted a paper 10 days ago

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

upvoted a paper 23 days ago

GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing

View all activity

Organizations

None yet

cpsxhao's activity

upvoted a paper 2 days ago

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

Paper • 2504.02826 • Published 3 days ago • 60

upvoted a paper 10 days ago

Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy

Paper • 2503.19757 • Published 12 days ago • 48

upvoted a paper 23 days ago

GoT: Unleashing Reasoning Capability of Multimodal Large Language Model for Visual Generation and Editing

Paper • 2503.10639 • Published 24 days ago • 48

upvoted a paper 4 months ago

SynerGen-VL: Towards Synergistic Image Understanding and Generation with Vision Experts and Token Folding

Paper • 2412.09604 • Published Dec 12, 2024 • 37

upvoted a paper 6 months ago

PUMA: Empowering Unified MLLM with Multi-granular Visual Generation

Paper • 2410.13861 • Published Oct 17, 2024 • 56