3 496 162

Yuseung "Phillip" Lee

phillipinseoul

https://phillipinseoul.github.io/

phillipinseoul

AI & ML interests

Computer Vision

Recent Activity

upvoted a paper about 17 hours ago

RoboBrain 2.0 Technical Report

upvoted a paper about 21 hours ago

StreamDiT: Real-Time Streaming Text-to-Video Generation

liked a model about 23 hours ago

TRI-ML/prismatic-vlms

View all activity

Organizations

upvoted a paper about 17 hours ago

RoboBrain 2.0 Technical Report

Paper • 2507.02029 • Published 6 days ago • 20

upvoted a paper about 21 hours ago

StreamDiT: Real-Time Streaming Text-to-Video Generation

Paper • 2507.03745 • Published 4 days ago • 15

upvoted a paper 1 day ago

How Well Does GPT-4o Understand Vision? Evaluating Multimodal Foundation Models on Standard Computer Vision Tasks

Paper • 2507.01955 • Published 6 days ago • 25

upvoted a paper 2 days ago

Fast and Simplex: 2-Simplicial Attention in Triton

Paper • 2507.02754 • Published 5 days ago • 22

upvoted 4 papers 5 days ago

Thinking with Images for Multimodal Reasoning: Foundations, Methods, and Future Frontiers

Paper • 2506.23918 • Published 9 days ago • 73

upvoted 2 papers 7 days ago

MoCa: Modality-aware Continual Pre-training Makes Better Bidirectional Multimodal Embeddings

Paper • 2506.23115 • Published 10 days ago • 36

GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning

Paper • 2507.01006 • Published 7 days ago • 174

upvoted 2 papers 9 days ago

Fine-Grained Preference Optimization Improves Spatial Reasoning in VLMs

Paper • 2506.21656 • Published 12 days ago • 13

BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing

Paper • 2506.17450 • Published 18 days ago • 60

upvoted 2 papers 12 days ago

MMSearch-R1: Incentivizing LMMs to Search

Paper • 2506.20670 • Published 13 days ago • 59

WorldVLA: Towards Autoregressive Action World Model

Paper • 2506.21539 • Published 12 days ago • 36

upvoted 3 papers 14 days ago

Unified Vision-Language-Action Model

Paper • 2506.19850 • Published 14 days ago • 23

Guidance in the Frequency Domain Enables High-Fidelity Sampling at Low CFG Scales

Paper • 2506.19713 • Published 15 days ago • 13

GRPO-CARE: Consistency-Aware Reinforcement Learning for Multimodal Reasoning

Paper • 2506.16141 • Published 20 days ago • 27

upvoted 3 papers 16 days ago

Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition

Paper • 2506.17201 • Published 18 days ago • 52

DreamCube: 3D Panorama Generation via Multi-plane Synchronization

Paper • 2506.17206 • Published 18 days ago • 21

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

Paper • 2506.09049 • Published 28 days ago • 34

Yuseung "Phillip" Lee

AI & ML interests

Recent Activity

Organizations

phillipinseoul's activity