weixuchen's picture

32 6

weixuchen

KageXu

AI & ML interests

computer vision

Recent Activity

upvoted a paper 6 days ago

VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos

upvoted a paper 6 days ago

Table-R1: Inference-Time Scaling for Table Reasoning

upvoted a paper 9 days ago

ViewSpatial-Bench: Evaluating Multi-perspective Spatial Localization in Vision-Language Models

View all activity

Organizations

None yet

KageXu's activity

upvoted 2 papers 6 days ago

VF-Eval: Evaluating Multimodal LLMs for Generating Feedback on AIGC Videos

Paper • 2505.23693 • Published 7 days ago • 56

Table-R1: Inference-Time Scaling for Table Reasoning

Paper • 2505.23621 • Published 7 days ago • 88

upvoted 6 papers 9 days ago

ViewSpatial-Bench: Evaluating Multi-perspective Spatial Localization in Vision-Language Models

Paper • 2505.21500 • Published 9 days ago • 11

SeePhys: Does Seeing Help Thinking? -- Benchmarking Vision-Based Physics Reasoning

Paper • 2505.19099 • Published 11 days ago • 8

Frame In-N-Out: Unbounded Controllable Image-to-Video Generation

Paper • 2505.21491 • Published 9 days ago • 17

rStar-Coder: Scaling Competitive Code Reasoning with a Large-Scale Verified Dataset

Paper • 2505.21297 • Published 9 days ago • 27

OpenS2V-Nexus: A Detailed Benchmark and Million-Scale Dataset for Subject-to-Video Generation

Paper • 2505.20292 • Published 10 days ago • 52

OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Paper • 2505.18445 • Published 13 days ago • 63

upvoted a paper about 1 month ago

Towards Understanding Camera Motions in Any Video

Paper • 2504.15376 • Published Apr 21 • 157

upvoted a paper 3 months ago

SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

Paper • 2503.07605 • Published Mar 10 • 69

upvoted 2 papers 4 months ago

Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation

Paper • 2502.08690 • Published Feb 12 • 44

The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

Paper • 2502.08946 • Published Feb 13 • 194

liked 6 models 4 months ago

AIDC-AI/Ovis2-34B

Image-Text-to-Text • Updated Feb 27 • 5.98k • 148

meta-llama/Llama-3.3-70B-Instruct

Text Generation • Updated Dec 21, 2024 • 767k • • 2.35k

deepseek-ai/DeepSeek-R1

Text Generation • Updated Mar 27 • 696k • • 12.3k

tomg-group-umd/huginn-0125

Text Generation • Updated Apr 15 • 4.88k • 270

microsoft/OmniParser-v2.0

Updated Mar 28 • 1.77k • 1.26k

deepseek-ai/Janus-Pro-7B

Any-to-Any • Updated Feb 1 • 98.4k • 3.4k

upvoted 2 papers 4 months ago

TVBench: Redesigning Video-Language Evaluation

Paper • 2410.07752 • Published Oct 10, 2024 • 6

ReLU's Revival: On the Entropic Overload in Normalization-Free Large Language Models

Paper • 2410.09637 • Published Oct 12, 2024 • 4