TON-3B-CLEVR / README.md

kolerk

Create README.md

b9f78e1 verified 27 days ago

preview code

raw

history blame contribute delete

344 Bytes

metadata

license: apache-2.0
datasets:
  - leonardPKU/clevr_cogen_a_train
language:
  - en
metrics:
  - accuracy
base_model:
  - Qwen/Qwen2.5-VL-3B-Instruct
pipeline_tag: image-text-to-text

This is the model cited in the paper: Think or Not? Selective Reasoning via Reinforcement Learning for Vision-Language Models.