1 6 20

Niels Horn PRO

nilq

https://niels.ninja

nilq

AI & ML interests

Natural language understanding, synthetic emotional speech, mechanistic interpretability.

Recent Activity

liked a Space 24 days ago

Stable-X/Hi3DGen

liked a model about 1 month ago

zzzrw/DeepMesh

liked a Space about 1 month ago

nanotron/ultrascale-playbook

View all activity

Organizations

Collections 4

Papers 1

arxiv:2410.12391

models 16

datasets 9

nilq/baby-python-and-tiny-stories-and-lua

Viewer • Updated Apr 14, 2024 • 12.3M • 56

nilq/baby-python-and-lua

Viewer • Updated Apr 8, 2024 • 12.3M • 62 • 1

nilq/baby-python-and-tiny-stories

Viewer • Updated Apr 8, 2024 • 13.9M • 32

nilq/python-and-tiny-stories

Updated Apr 8, 2024 • 4

nilq/baby-python

Viewer • Updated Mar 16, 2024 • 11.7M • 19 • 1

nilq/small-lua-stack

Viewer • Updated Feb 28, 2024 • 559k • 53 • 2

nilq/small-python-stack

Viewer • Updated Feb 28, 2024 • 2.59M • 92

nilq/babylm-100M

Viewer • Updated Jan 21, 2024 • 12.7M • 36

nilq/babylm-10M

Viewer • Updated Jan 21, 2024 • 3.14M • 28

Niels Horn PRO

AI & ML interests

Recent Activity

Organizations

Collections 4

Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

Diverse Weight Averaging for Out-of-Distribution Generalization

Fusing finetuned models for better pretraining

Sudden Drops in the Loss: Syntax Acquisition, Phase Transitions, and Simplicity Bias in MLMs

nilq/lua-mistral-1L-mini

nilq/mistral-1L-mini

nilq/mistral-1L-tiny

nilq/lua-mistral-1L-tiny

Papers 1

models 16

nilq/baby-python-mistral-1L-tiny-TinyStories-ft

nilq/baby-python-mistral-1L-tiny-lua-ft

nilq/baby-python-1L-mistral-lua-stories-slerp

nilq/baby-python-mistral-1L-tiny-base

nilq/lua-stories-slerp-mistral-1L-tiny

nilq/lua-stories-slerp-mistral-2L-tiny

nilq/mistral-2L-tiny

nilq/lua-stories-linear-mistral-1L-tiny

nilq/python-mistral-1L-mini

nilq/mistral-1L-tiny

datasets 9

nilq/baby-python-and-tiny-stories-and-lua

nilq/baby-python-and-lua

nilq/baby-python-and-tiny-stories

nilq/python-and-tiny-stories

nilq/baby-python

nilq/small-lua-stack

nilq/small-python-stack

nilq/babylm-100M

nilq/babylm-10M

Niels Horn PRO

AI & ML interests

Recent Activity

Organizations

Collections 4

Papers 1

models 16 Sort: Recently updated

datasets 9 Sort: Recently updated

models 16

datasets 9