Beijing Academy of Artificial Intelligence

Team

non-profit

https://www.baai.ac.cn/english.html

Activity Feed Request to join this org

AI & ML interests

None defined yet.

Recent Activity

suimu updated a Space about 8 hours ago

BAAI/MTVCraft

tanhuajie2001 updated a dataset 2 days ago

BAAI/ShareRobot-Bench

wwen1997 authored a paper 5 days ago

Object-aware Inversion and Reassembly for Image Editing

View all activity

Articles

Letting Large Models Debate: The First Multilingual LLM Debate Competition

suimu

updated a Space about 8 hours ago

MTVCraft

Open Veo3-style Audio-Video Generation

tanhuajie2001

updated a dataset 2 days ago

BAAI/ShareRobot-Bench

Preview • Updated 2 days ago • 222 • 1

wwen1997

authored 9 papers 5 days ago

Object-aware Inversion and Reassembly for Image Editing

Paper • 2310.12149 • Published Oct 18, 2023

LoRA-Composer: Leveraging Low-Rank Adaptation for Multi-Concept Customization in Training-Free Diffusion Models

Paper • 2403.11627 • Published Mar 18, 2024

FreeCustom: Tuning-Free Customized Image Generation for Multi-Concept Composition

Paper • 2405.13870 • Published May 22, 2024

AniDoc: Animation Creation Made Easier

Paper • 2412.14173 • Published Dec 18, 2024 • 57

LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis

Paper • 2412.15214 • Published Dec 19, 2024 • 15

FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior

Paper • 2407.04947 • Published Jul 6, 2024

Omni-R1: Reinforcement Learning for Omnimodal Reasoning via Two-System Collaboration

Paper • 2505.20256 • Published May 26 • 17

GUI-G$^2$: Gaussian Reward Modeling for GUI Grounding

Paper • 2507.15846 • Published 29 days ago • 130

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published 7 days ago • 32

ZacLiu

in BAAI/Infinity-MM 7 days ago

Critical Data Quality Issues in Cambrain Subsets: Duplicates, Missing Samples, and Source Mislabeling

#16 opened 26 days ago by

yimingju2

updated a dataset 7 days ago

BAAI/CI-VID

Viewer • Updated 7 days ago • 342k • 1.49k • 1

tellarin

authored a paper 11 days ago

DeepPHY: Benchmarking Agentic VLMs on Physical Reasoning

Paper • 2508.05405 • Published 12 days ago • 61

ZacLiu

authored a paper 13 days ago

Trainable Dynamic Mask Sparse Attention

Paper • 2508.02124 • Published 15 days ago • 15

ldwang

authored a paper 13 days ago

Trainable Dynamic Mask Sparse Attention

Paper • 2508.02124 • Published 15 days ago • 15

MonteXiaofeng

authored a paper 27 days ago

SPAR: Scholar Paper Retrieval with LLM-based Agents for Enhanced Academic Search

Paper • 2507.15245 • Published 29 days ago • 11

cmyopu

authored a paper 27 days ago

RoboOS: A Hierarchical Embodied Framework for Cross-Embodiment and Multi-Agent Collaboration

Paper • 2505.03673 • Published May 6 • 1

tanhuajie2001

authored 2 papers about 1 month ago

RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete

Paper • 2502.21257 • Published Feb 28 • 2

Reason-RFT: Reinforcement Fine-Tuning for Visual Reasoning

Paper • 2503.20752 • Published Mar 26 • 1