Latent Reasoning - a alexngai Collection

alexngai 's Collections

Latent Reasoning

Autonomous Research

Memory/Search/Retrieval/RAG

Automated Research

Test-Time Compute/Optimal Scaling

Self-Improving Agents

Codegen Benchmarks

Latent Reasoning

updated May 7

Deliberation in Latent Space via Differentiable Cache Augmentation

Paper • 2412.17747 • Published Dec 23, 2024 • 33
Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published Dec 9, 2024 • 87
RM-R1: Reward Modeling as Reasoning

Paper • 2505.02387 • Published May 5 • 78