3 14 1

Zedong Wang

ZedongWangAI

https://jacky1128.github.io

AI & ML interests

Computer Vision, Multi-task Learning, Multi-modal Learning.

Recent Activity

upvoted a paper about 11 hours ago

Perspective-Aware Reasoning in Vision-Language Models via Mental Imagery Simulation

upvoted a paper about 23 hours ago

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

upvoted a paper about 23 hours ago

Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs

View all activity

Organizations

ZedongWangAI's activity

upvoted a paper about 11 hours ago

Perspective-Aware Reasoning in Vision-Language Models via Mental Imagery Simulation

Paper • 2504.17207 • Published 3 days ago • 23

upvoted 2 papers about 23 hours ago

Token-Shuffle: Towards High-Resolution Image Generation with Autoregressive Models

Paper • 2504.17789 • Published 2 days ago • 11

Breaking the Modality Barrier: Universal Embedding Learning with Multimodal LLMs

Paper • 2504.17432 • Published 3 days ago • 32

upvoted 2 papers 23 days ago

AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction

Paper • 2504.01014 • Published 25 days ago • 64

Audio-visual Controlled Video Diffusion with Masked Selective State Spaces Modeling for Natural Talking Head Generation

Paper • 2504.02542 • Published 24 days ago • 42

commented a paper 23 days ago

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83 •

authored 2 papers 24 days ago

Boosting Discriminative Visual Representation Learning with Scenario-Agnostic Mixup

Paper • 2111.15454 • Published Nov 30, 2021

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83

commented 3 papers 24 days ago

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83 •

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83 •

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83 •

updated a collection 24 days ago

Representation Learning & Generation

Collection

8 items • Updated 24 days ago • 1

upvoted a paper 24 days ago

Scaling Language-Free Visual Representation Learning

Paper • 2504.01017 • Published 25 days ago • 29

updated a collection 24 days ago

Representation Learning & Generation

Collection

8 items • Updated 24 days ago • 1

upvoted a paper 24 days ago

MergeVQ: A Unified Framework for Visual Generation and Representation with Disentangled Token Merging and Quantization

Paper • 2504.00999 • Published 25 days ago • 83