Junfei Xiao's picture

Junfei Xiao

lambertxiao

·

AI & ML interests

None yet

Organizations

upvoted a paper 4 months ago

Captain Safari: A World Engine

Paper • 2511.22815 • Published Nov 28, 2025 • 12

upvoted a paper 9 months ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

Paper • 2508.06471 • Published Aug 8, 2025 • 211

upvoted 2 papers 10 months ago

Captain Cinema: Towards Short Movie Generation

Paper • 2507.18634 • Published Jul 24, 2025 • 42

Vision-Language-Vision Auto-Encoder: Scalable Knowledge Distillation from Diffusion Models

Paper • 2507.07104 • Published Jul 9, 2025 • 46

upvoted a paper 11 months ago

Play to Generalize: Learning to Reason Through Game Play

Paper • 2506.08011 • Published Jun 9, 2025 • 15

upvoted a paper about 1 year ago

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published Apr 11, 2025 • 130

upvoted a collection over 1 year ago

Qwen2.5-VL

Vision-language model series based on Qwen2.5 • 10 items • Updated Mar 2 • 562

upvoted 7 papers over 1 year ago

Kimi k1.5: Scaling Reinforcement Learning with LLMs

Paper • 2501.12599 • Published Jan 22, 2025 • 130

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 449

FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces

Paper • 2501.12909 • Published Jan 22, 2025 • 74

Diffusion Adversarial Post-Training for One-Step Video Generation

Paper • 2501.08316 • Published Jan 14, 2025 • 36

VideoAuteur: Towards Long Narrative Video Generation

Paper • 2501.06173 • Published Jan 10, 2025 • 31

GenEx: Generating an Explorable World

Paper • 2412.09624 • Published Dec 12, 2024 • 98

Generative World Explorer

Paper • 2411.11844 • Published Nov 18, 2024 • 77

upvoted a paper almost 2 years ago

DataComp-LM: In search of the next generation of training sets for language models

Paper • 2406.11794 • Published Jun 17, 2024 • 55

upvoted a collection about 2 years ago

ViTamin Family

Designing Scalable Vision Models in the Vision-language Era. The best performing model is 'jienengchen/ViTamin-XL-384px'. • 16 items • Updated Apr 11, 2024 • 8

upvoted a paper about 2 years ago

PaLM2-VAdapter: Progressively Aligned Language Model Makes a Strong Vision-language Adapter

Paper • 2402.10896 • Published Feb 16, 2024 • 16