5 7

Andrey Galichin

andreuka18

avgalichin

AI & ML interests

None yet

Recent Activity

upvoted a paper 8 days ago

Inverse-and-Edit: Effective and Fast Image Editing by Cycle Consistency Models

updated a dataset 10 days ago

andreuka18/Nemotron-Post-Training-Dataset-10k-Nemotron-Nano-v1

published a dataset 10 days ago

andreuka18/Nemotron-Post-Training-Dataset-10k-Nemotron-Nano-v1

View all activity

Organizations

None yet

Collections 1

Papers 1

arxiv:2503.18878

models 6

datasets 31

andreuka18/Nemotron-Post-Training-Dataset-10k-Nemotron-Nano-v1

Viewer • Updated 10 days ago • 10k

andreuka18/OpenThoughts-10k-Nemotron

Viewer • Updated 10 days ago • 10k

andreuka18/Llama-3.1-8B-slimpajama-openthoughts-tokenized

Viewer • Updated Apr 29 • 800k • 70

andreuka18/Llama-3.1-8B-OpenThoughts-114k-plain-tokenized

Viewer • Updated Apr 29 • 752k • 30

andreuka18/DeepSeek-R1-Distill-Llama-8B-slimpajama-openthoughts-tokenized

Viewer • Updated Apr 28 • 800k • 27

andreuka18/lmsys-openthoughts-subset-DeepSeek-R1

Viewer • Updated Apr 24 • 12k • 28

andreuka18/DeepSeek-R1-Distill-Llama-8B-SlimPajama-1B-tokenized

Viewer • Updated Apr 23 • 1M • 28

andreuka18/Llama-3.1-8B-SlimPajama-1B-tokenized

Viewer • Updated Apr 23 • 1M • 28

andreuka18/truthful_qa

Viewer • Updated Apr 15 • 790 • 36

andreuka18/lmsys-chat-1m-100k-DeepSeek-R1

Viewer • Updated Apr 11 • 100k • 18

View 31 datasets

Andrey Galichin

AI & ML interests

Recent Activity

Organizations

Collections 1

andreuka18/DeepSeek-R1-Distill-Llama-8B-lmsys-openthoughts-tokenized

andreuka18/deepseek-r1-distill-llama-8b-lmsys-openthoughts

andreuka18/OpenThoughts-10k-DeepSeek-R1

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

andreuka18/DeepSeek-R1-Distill-Llama-8B-lmsys-openthoughts-tokenized

andreuka18/deepseek-r1-distill-llama-8b-lmsys-openthoughts

andreuka18/OpenThoughts-10k-DeepSeek-R1

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Papers 1

models 6

andreuka18/sae-slimpajama-deepseek-r1-llama-8b

andreuka18/sae-deepseek-r1-llama-8b

andreuka18/deepseek-r1-distill-llama-8b-lmsys-openthoughts

andreuka18/deepseek-r1-distill-llama-8b-openthoughts

andreuka18/deepseek-r1-distill-llama-8b-lmsys

andreuka18/sae-expansion-1-countdown-r1-qwen2.5-1.5B-distill

datasets 31

andreuka18/Nemotron-Post-Training-Dataset-10k-Nemotron-Nano-v1

andreuka18/OpenThoughts-10k-Nemotron

andreuka18/Llama-3.1-8B-slimpajama-openthoughts-tokenized

andreuka18/Llama-3.1-8B-OpenThoughts-114k-plain-tokenized

andreuka18/DeepSeek-R1-Distill-Llama-8B-slimpajama-openthoughts-tokenized

andreuka18/lmsys-openthoughts-subset-DeepSeek-R1

andreuka18/DeepSeek-R1-Distill-Llama-8B-SlimPajama-1B-tokenized

andreuka18/Llama-3.1-8B-SlimPajama-1B-tokenized

andreuka18/truthful_qa

andreuka18/lmsys-chat-1m-100k-DeepSeek-R1

Andrey Galichin

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 1

models 6 Sort: Recently updated

datasets 31 Sort: Recently updated

models 6

datasets 31