Haowei Zhang's picture

Haowei Zhang

freesky

·

freesky01

AI & ML interests

None yet

Recent Activity

liked a model 3 days ago

liked a model 3 days ago

sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

upvoted a paper 3 days ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

View all activity

Organizations

upvoted a paper 3 days ago

The Past Is Not Past: Memory-Enhanced Dynamic Reward Shaping

Paper • 2604.11297 • Published 5 days ago • 134

upvoted a paper 10 days ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 21 days ago • 353

upvoted a paper 16 days ago

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published 22 days ago • 52

upvoted 2 papers about 1 month ago

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 423

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Paper • 2603.04918 • Published Mar 5 • 56

upvoted a paper about 2 months ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

upvoted 6 papers 2 months ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published Feb 11 • 49

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published Feb 9 • 38

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars

Paper • 2602.01538 • Published Feb 2 • 15

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 118

UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing

Paper • 2602.02437 • Published Feb 2 • 80

upvoted 8 papers 3 months ago

AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts

Paper • 2601.20730 • Published Jan 28 • 21

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 50

Learning to Discover at Test Time

Paper • 2601.16175 • Published Jan 22 • 44

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

Paper • 2512.04677 • Published Dec 4, 2025 • 177

Patient-Similarity Cohort Reasoning in Clinical Text-to-SQL

Paper • 2601.09876 • Published Jan 14 • 7

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published Jan 22 • 92

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Paper • 2601.14724 • Published Jan 21 • 75