2 4 2

Chuhan Li

ChuhanLi

https://leechuh.github.io

AI & ML interests

None yet

Recent Activity

upvoted a paper 19 days ago

Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

upvoted a paper 3 months ago

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

authored a paper 3 months ago

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

View all activity

Organizations

ChuhanLi's activity

upvoted a paper 19 days ago

Advances and Challenges in Foundation Agents: From Brain-Inspired Intelligence to Evolutionary, Collaborative, and Safe Systems

Paper • 2504.01990 • Published 26 days ago • 261

upvoted a paper 3 months ago

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

Paper • 2501.12380 • Published Jan 21 • 86

authored a paper 3 months ago

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

Paper • 2501.12380 • Published Jan 21 • 86

updated a dataset 3 months ago

yale-nlp/M3SciQA

Viewer • Updated Jan 13 • 1.45k • 137 • 7

New activity in meta-llama/Llama-3.2-11B-Vision 5 months ago

multi-image inference

#45 opened 6 months ago by

eternal8848

authored a paper 5 months ago

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

Paper • 2411.04075 • Published Nov 6, 2024 • 17

upvoted a paper 6 months ago

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

Paper • 2411.04075 • Published Nov 6, 2024 • 17

commented a paper 6 months ago

M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models

Paper • 2411.04075 • Published Nov 6, 2024 • 17 •

authored a paper 6 months ago

TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models

Paper • 2410.23266 • Published Oct 30, 2024 • 20

liked a dataset 6 months ago

yale-nlp/TOMATO

Viewer • Updated Nov 8, 2024 • 1.48k • 349 • 6

upvoted a paper 6 months ago

TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models

Paper • 2410.23266 • Published Oct 30, 2024 • 20

updated a dataset 6 months ago

yale-nlp/TOMATO

Viewer • Updated Nov 8, 2024 • 1.48k • 349 • 6

liked a dataset 6 months ago

yale-nlp/M3SciQA

Viewer • Updated Jan 13 • 1.45k • 137 • 7

updated 2 datasets 6 months ago

yale-nlp/M3SciQA

Viewer • Updated Jan 13 • 1.45k • 137 • 7

yale-nlp/M3SciQA

Viewer • Updated Jan 13 • 1.45k • 137 • 7