rubbyninja's picture

37

rubbyninja

rubbyninja

·

AI & ML interests

None yet

Organizations

None yet

upvoted a paper 7 months ago

A Fingerprint for Large Language Models

Paper • 2407.01235 • Published Jul 1, 2024 • 1

upvoted a paper 9 months ago

Diffusion-LM Improves Controllable Text Generation

Paper • 2205.14217 • Published May 27, 2022 • 2

upvoted a paper 11 months ago

VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

Paper • 2501.09781 • Published Jan 16, 2025 • 27

upvoted 2 papers 12 months ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published Jan 31, 2025 • 124

Better & Faster Large Language Models via Multi-token Prediction

Paper • 2404.19737 • Published Apr 30, 2024 • 81

upvoted 13 papers about 1 year ago

Direct Preference Optimization: Your Language Model is Secretly a Reward Model

Paper • 2305.18290 • Published May 29, 2023 • 64

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22, 2025 • 441

Titans: Learning to Memorize at Test Time

Paper • 2501.00663 • Published Dec 31, 2024 • 29

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 150

Movie Gen: A Cast of Media Foundation Models

Paper • 2410.13720 • Published Oct 17, 2024 • 100

Large Concept Models: Language Modeling in a Sentence Representation Space

Paper • 2412.08821 • Published Dec 11, 2024 • 17

Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context

Paper • 1901.02860 • Published Jan 9, 2019 • 4

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

Paper • 2404.07143 • Published Apr 10, 2024 • 111

Memory Layers at Scale

Paper • 2412.09764 • Published Dec 12, 2024 • 5

Self-Taught Evaluators

Paper • 2408.02666 • Published Aug 5, 2024 • 29

ReFT: Reasoning with Reinforced Fine-Tuning

Paper • 2401.08967 • Published Jan 17, 2024 • 31

O1 Replication Journey -- Part 2: Surpassing O1-preview through Simple Distillation, Big Progress or Bitter Lesson?

Paper • 2411.16489 • Published Nov 25, 2024 • 45

O1 Replication Journey: A Strategic Progress Report -- Part 1

Paper • 2410.18982 • Published Oct 8, 2024 • 3

upvoted 2 papers over 1 year ago

Test-Time Training with Self-Supervision for Generalization under Distribution Shifts

Paper • 1909.13231 • Published Sep 29, 2019 • 1

The Surprising Effectiveness of Test-Time Training for Abstract Reasoning

Paper • 2411.07279 • Published Nov 11, 2024 • 4