lee dong ryeol's picture

lee dong ryeol

drlee1

·

DONGRYEOLLEE1

AI & ML interests

None yet

Recent Activity

liked a model 2 days ago

microsoft/Multilingual-MiniLM-L12-H384

liked a model 5 days ago

ByteDance-Seed/Seed-OSS-36B-Instruct

liked a dataset 5 days ago

allganize/RAG-Evaluation-Dataset-KO

View all activity

Organizations

None yet

upvoted an article 15 days ago

Article

ChatML vs Harmony: Understanding the new Format from OpenAI 🔍

By

•

18 days ago

• 27

upvoted 2 papers 19 days ago

Efficient Agents: Building Effective Agents While Reducing Cost

Paper • 2508.02694 • Published Jul 24 • 82

Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

Paper • 2508.01191 • Published 25 days ago • 226

upvoted 2 papers 20 days ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published Jul 24 • 290

Qwen-Image Technical Report

Paper • 2508.02324 • Published 23 days ago • 227

upvoted 2 papers 3 months ago

Large Language Models for Data Synthesis

Paper • 2505.14752 • Published May 20 • 50

CommonCanvas: An Open Diffusion Model Trained with Creative-Commons Images

Paper • 2310.16825 • Published Oct 25, 2023 • 36

upvoted 7 papers 4 months ago

R&B: Domain Regrouping and Data Mixture Balancing for Efficient Foundation Model Training

Paper • 2505.00358 • Published May 1 • 26

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published Apr 21 • 86

TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published Apr 22 • 120

Efficient Pretraining Length Scaling

Paper • 2504.14992 • Published Apr 21 • 20

Antidistillation Sampling

Paper • 2504.13146 • Published Apr 17 • 61

SFT or RL? An Early Investigation into Training R1-Like Reasoning Large Vision-Language Models

Paper • 2504.11468 • Published Apr 10 • 29

BitNet b1.58 2B4T Technical Report

Paper • 2504.12285 • Published Apr 16 • 74

upvoted an article 6 months ago

Article

Welcome Gemma 3: Google's all new multimodal, multilingual, long context open LLM

By

and 3 others •

Mar 12

• 455

upvoted 3 papers 6 months ago

RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation

Paper • 2412.11919 • Published Dec 16, 2024 • 37

JuStRank: Benchmarking LLM Judges for System Ranking

Paper • 2412.09569 • Published Dec 12, 2024 • 20

Phi-4 Technical Report

Paper • 2412.08905 • Published Dec 12, 2024 • 121

upvoted 2 papers 7 months ago

YuLan-Mini: An Open Data-efficient Language Model

Paper • 2412.17743 • Published Dec 23, 2024 • 67

Token-Budget-Aware LLM Reasoning

Paper • 2412.18547 • Published Dec 24, 2024 • 47