4 21 1

Mingyang Song

hitsmy

AI & ML interests

LVLMs

Recent Activity

upvoted a paper 4 days ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

upvoted a paper 4 days ago

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

authored a paper 10 days ago

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

View all activity

Organizations

upvoted 2 papers 4 days ago

Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models

Paper • 2601.22060 • Published 8 days ago • 145

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published 5 days ago • 123

upvoted a paper 10 days ago

AdaReasoner: Dynamic Tool Orchestration for Iterative Visual Reasoning

Paper • 2601.18631 • Published 12 days ago • 47

upvoted a collection about 1 month ago

AdaReasoner

Collection

AdaReasoner: Models and Datasets • 12 items • Updated 10 days ago • 3

upvoted 2 papers about 1 month ago

DiffThinker: Towards Generative Multimodal Reasoning with Diffusion Models

Paper • 2512.24165 • Published Dec 30, 2025 • 51

VA-π: Variational Policy Alignment for Pixel-Aware Autoregressive Generation

Paper • 2512.19680 • Published Dec 22, 2025 • 11

upvoted 2 papers 4 months ago

Diversity-Incentivized Exploration for Versatile Reasoning

Paper • 2509.26209 • Published Sep 30, 2025 • 16

Native Hybrid Attention for Efficient Sequence Modeling

Paper • 2510.07019 • Published Oct 8, 2025 • 17

upvoted a paper 5 months ago

Reasoning over Boundaries: Enhancing Specification Alignment via Test-time Delibration

Paper • 2509.14760 • Published Sep 18, 2025 • 53

upvoted 2 papers 6 months ago

Speed Always Wins: A Survey on Efficient Architectures for Large Language Models

Paper • 2508.09834 • Published Aug 13, 2025 • 53

StableAvatar: Infinite-Length Audio-Driven Avatar Video Generation

Paper • 2508.08248 • Published Aug 11, 2025 • 27

upvoted 3 papers 9 months ago

FullFront: Benchmarking MLLMs Across the Full Front-End Engineering Workflow

Paper • 2505.17399 • Published May 23, 2025 • 14

Learn to Reason Efficiently with Adaptive Length-based Reward Shaping

Paper • 2505.15612 • Published May 21, 2025 • 34

OpenThinkIMG: Learning to Think with Images via Visual Tool Reinforcement Learning

Paper • 2505.08617 • Published May 13, 2025 • 42

upvoted 2 papers 10 months ago

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published Apr 21, 2025 • 88

A Survey of Efficient Reasoning for Large Reasoning Models: Language, Multimodality, and Beyond

Paper • 2503.21614 • Published Mar 27, 2025 • 42

upvoted a paper 11 months ago

From Head to Tail: Towards Balanced Representation in Large Vision-Language Models through Adaptive Data Calibration

Paper • 2503.12821 • Published Mar 17, 2025 • 10

upvoted a paper 12 months ago

MoM: Linear Sequence Modeling with Mixture-of-Memories

Paper • 2502.13685 • Published Feb 19, 2025 • 36

upvoted 2 papers about 1 year ago

Test-Time Preference Optimization: On-the-Fly Alignment via Iterative Textual Feedback

Paper • 2501.12895 • Published Jan 22, 2025 • 61

PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models

Paper • 2501.03124 • Published Jan 6, 2025 • 14

Mingyang Song

AI & ML interests

Recent Activity

Organizations

hitsmy's activity