VisualWebInstruct - a TIGER-Lab Collection

TIGER-Lab 's Collections

MoCha

General-Reasoner

Vamba

ABC

VisualWebInstruct

CritiqueFineTuning

VISTA

VLM2Vec

MAmmoTH

UniIR

Science

Mantis

VisualWebInstruct

updated May 5

Scaling up MM data

TIGER-Lab/VisualWebInstruct-Recall

Viewer • Updated Mar 16 • 361k • 469 • 3
TIGER-Lab/VisualWebInstruct-Seed

Viewer • Updated Mar 16 • 60.3k • 141 • 17
TIGER-Lab/VisualWebInstruct

Viewer • Updated Apr 10 • 1.91M • 973 • 36
VisualWebInstruct: Scaling up Multimodal Instruction Data through Web Search

Paper • 2503.10582 • Published Mar 13 • 23
TIGER-Lab/MAmmoTH-VL2

Image-Text-to-Text • 8B • Updated May 7 • 73 • 12
Running on Zero

1

1

MAmmoTH-VL2

🐠

Strong Vision Language Model trained with VisualWebInstruct