Tfree-HAT-7b-pretrained

Aleph-Alpha 's Collections

updated 21 days ago

Tokenizer free models based on Hierarchical Autoregressive Transformer (https://arxiv.org/abs/2501.10322) trained from scratch.