Small model pretraining experiments - a amang1802 Collection

amang1802 's Collections

ThinkTransformer experiments

Small model pretraining experiments

PPO experiments

Synthetic Data rewrite (model checkpoints)

Synthetic Data rewrite research (training and eval datasets)

WildeWeb Research

Small model pretraining experiments

updated Feb 9