Nikita Balagansky's picture

2 13 3

Nikita Balagansky

elephantmipt

·

AI & ML interests

None yet

Organizations

upvoted 2 papers 22 days ago

Interpretability as Compression: Reconsidering SAE Explanations of Neural Activations with MDL-SAEs

Paper • 2410.11179 • Published Oct 15, 2024 • 2

Teach Old SAEs New Domain Tricks with Boosting

Paper • 2507.12990 • Published 23 days ago • 11

upvoted a paper about 1 month ago

Alchemist: Turning Public Text-to-Image Data into Generative Gold

Paper • 2505.19297 • Published May 25 • 83

upvoted a paper 2 months ago

Train Sparse Autoencoders Efficiently by Utilizing Features Correlation

Paper • 2505.22255 • Published May 28 • 25

upvoted 2 papers 5 months ago

Scale-wise Distillation of Diffusion Models

Paper • 2503.16397 • Published Mar 20 • 42

Transformers without Normalization

Paper • 2503.10622 • Published Mar 13 • 168

upvoted 2 papers 6 months ago

You Do Not Fully Utilize Transformer's Representation Capacity

Paper • 2502.09245 • Published Feb 13 • 38

The Differences Between Direct Alignment Algorithms are a Blur

Paper • 2502.01237 • Published Feb 3 • 115

upvoted a paper 10 months ago

Mechanistic Permutability: Match Features Across Layers

Paper • 2410.07656 • Published Oct 10, 2024 • 20

upvoted 2 papers about 1 year ago

XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning

Paper • 2406.08973 • Published Jun 13, 2024 • 90

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality

Paper • 2405.21060 • Published May 31, 2024 • 68

upvoted 2 papers over 1 year ago

Mixture-of-Depths: Dynamically allocating compute in transformer-based language models

Paper • 2404.02258 • Published Apr 2, 2024 • 107

Learn Your Reference Model for Real Good Alignment

Paper • 2404.09656 • Published Apr 15, 2024 • 88