11 12 5

Dawei Zhu

dwzhu

dwzhu-pku

AI & ML interests

natural language processing

Recent Activity

authored a paper about 9 hours ago

MiMo-VL Technical Report

upvoted a paper about 14 hours ago

MiMo-VL Technical Report

upvoted a collection 5 days ago

MiMo-VL

View all activity

Organizations

dwzhu's activity

authored a paper about 9 hours ago

MiMo-VL Technical Report

Paper • 2506.03569 • Published 1 day ago • 53

upvoted a paper about 14 hours ago

MiMo-VL Technical Report

Paper • 2506.03569 • Published 1 day ago • 53

upvoted a collection 5 days ago

MiMo-VL

Collection

2 items • Updated 7 days ago • 23

authored a paper 23 days ago

MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining

Paper • 2505.07608 • Published 24 days ago • 77

upvoted a paper 24 days ago

MiMo: Unlocking the Reasoning Potential of Language Model -- From Pretraining to Posttraining

Paper • 2505.07608 • Published 24 days ago • 77

authored 5 papers 2 months ago

ConFiguRe: Exploring Discourse-level Chinese Figures of Speech

Paper • 2209.07678 • Published Sep 16, 2022

Long Context Alignment with Short Instructions and Synthesized Positions

Paper • 2405.03939 • Published May 7, 2024

More Tokens, Lower Precision: Towards the Optimal Token-Precision Trade-off in KV Cache Compression

Paper • 2412.12706 • Published Dec 17, 2024

MMTEB: Massive Multilingual Text Embedding Benchmark

Paper • 2502.13595 • Published Feb 19 • 34

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 49

upvoted a paper 2 months ago

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 49

commented a paper 2 months ago

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 49 •

upvoted a paper 3 months ago

MPO: Boosting LLM Agents with Meta Plan Optimization

Paper • 2503.02682 • Published Mar 4 • 27

upvoted an article 7 months ago

Article

Accelerating LLM Inference: Fast Sampling with Gumbel-Max Trick

•

Oct 24, 2024

• 12

upvoted 2 papers 8 months ago

MixEval-X: Any-to-Any Evaluations from Real-World Data Mixtures

Paper • 2410.13754 • Published Oct 17, 2024 • 76

Harnessing Webpage UIs for Text-Rich Visual Understanding

Paper • 2410.13824 • Published Oct 17, 2024 • 32

updated a model 9 months ago

dwzhu/e5rope-base

New activity in dwzhu/e5rope-base 9 months ago

`README.md` script error

#1 opened 9 months ago by

reaganjlee

New activity in mteb/leaderboard 12 months ago

fix metrics for LongEmbed

#124 opened 12 months ago by

dwzhu

liked a Space 12 months ago

5.77k

MTEB Leaderboard

🥇

Embedding Leaderboard