3 4 6

Shusheng Yang

ShushengYang

https://shushengyang.com

AI & ML interests

computer vision, vision language model

Recent Activity

liked a dataset about 1 month ago

nyu-visionx/VSI-Bench

authored a paper about 1 month ago

Qwen Technical Report

authored a paper about 1 month ago

ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers

View all activity

Organizations

ShushengYang's activity

liked a dataset about 1 month ago

nyu-visionx/VSI-Bench

Viewer • Updated 16 days ago • 5.13k • 1.9k • 30

authored 5 papers about 1 month ago

Unleashing Vanilla Vision Transformer with Masked Image Modeling for Object Detection

Paper • 2204.02964 • Published Apr 6, 2022

Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Paper • 2412.14171 • Published Dec 18, 2024 • 24

upvoted a paper about 1 month ago

Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Paper • 2412.14171 • Published Dec 18, 2024 • 24

commented a paper about 1 month ago

Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Paper • 2412.14171 • Published Dec 18, 2024 • 24 •

updated 2 datasets about 1 month ago

nyu-visionx/VSI-Bench

Viewer • Updated 16 days ago • 5.13k • 1.9k • 30

ShushengYang/VSIBench1214

Viewer • Updated Dec 18, 2024 • 5.13k • 17

updated 4 datasets 2 months ago

ShushengYang/multi_frame_existence_1120_10f1e

Viewer • Updated Nov 20, 2024 • 500 • 12

ShushengYang/multi_frame_existence_1120_5f1e

Viewer • Updated Nov 20, 2024 • 500 • 7

ShushengYang/multi_frame_existence_1120_3f1e

Viewer • Updated Nov 20, 2024 • 500 • 8

ShushengYang/multi_frame_existence_1120_2f1e

Viewer • Updated Nov 20, 2024 • 500 • 12

updated 6 datasets 3 months ago

ShushengYang/teaser

Viewer • Updated Nov 11, 2024 • 2 • 12

ShushengYang/rel_dist_to_center_miniset

Viewer • Updated Nov 8, 2024 • 50 • 13

ShushengYang/rel_dist_occmap_gen

Viewer • Updated Nov 8, 2024 • 50 • 9

ShushengYang/rel_dist_to_bbox_qa

Viewer • Updated Nov 5, 2024 • 50 • 12

ShushengYang/sn_rel_dir_parsed_pred_to_answer

Viewer • Updated Nov 5, 2024 • 49 • 16

ShushengYang/sn_rel_dir_raw_pred_to_answer

Viewer • Updated Nov 5, 2024 • 50 • 10