Face's picture

1 23

Face

HugThat

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Efficient Inference for Large Reasoning Models: A Survey

upvoted a paper 2 days ago

Expanding RL with Verifiable Rewards Across Diverse Domains

upvoted a paper 2 days ago

What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

View all activity

Organizations

None yet

HugThat's activity

upvoted 4 papers 2 days ago

Efficient Inference for Large Reasoning Models: A Survey

Paper • 2503.23077 • Published 5 days ago • 39

Expanding RL with Verifiable Rewards Across Diverse Domains

Paper • 2503.23829 • Published 4 days ago • 16

What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models

Paper • 2503.24235 • Published 3 days ago • 42

Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement Learning on the Base Model

Paper • 2503.24290 • Published 3 days ago • 52

upvoted a paper 10 days ago

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Paper • 2503.14476 • Published 16 days ago • 112

upvoted a paper 12 days ago

Reinforcement Learning for Reasoning in Small LLMs: What Works and What Doesn't

Paper • 2503.16219 • Published 14 days ago • 46

upvoted 5 papers 16 days ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

Paper • 2503.12545 • Published 18 days ago • 5

Aligning Multimodal LLM with Human Preference: A Survey

Paper • 2503.14504 • Published 16 days ago • 22

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

Paper • 2503.12505 • Published 18 days ago • 9

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

Paper • 2503.12937 • Published 18 days ago • 27

BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing

Paper • 2503.13434 • Published 17 days ago • 25

upvoted 5 papers 21 days ago

MedAgentsBench: Benchmarking Thinking Models and Agent Frameworks for Complex Medical Reasoning

Paper • 2503.07459 • Published 24 days ago • 15

MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System

Paper • 2503.09600 • Published 22 days ago • 4

LMM-R1: Empowering 3B LMMs with Strong Reasoning Abilities Through Two-Stage Rule-Based RL

Paper • 2503.07536 • Published 24 days ago • 83

Motion Anything: Any to Motion Generation

Paper • 2503.06955 • Published 25 days ago • 29

Quantization for OpenAI's Whisper Models: A Comparative Analysis

Paper • 2503.09905 • Published 22 days ago • 6

upvoted 3 papers about 1 month ago

Slamming: Training a Speech Language Model on One GPU in a Day

Paper • 2502.15814 • Published Feb 19 • 68

Can Community Notes Replace Professional Fact-Checkers?

Paper • 2502.14132 • Published Feb 19 • 6

SWE-Lancer: Can Frontier LLMs Earn $1 Million from Real-World Freelance Software Engineering?

Paper • 2502.12115 • Published Feb 17 • 43