multilingual - a CelesteChen Collection

CelesteChen 's Collections

models

code

RAG

others

math

Align

multilingual

updated Dec 9, 2024

Evaluating Tokenizer Performance of Large Language Models Across Official Indian Languages

Paper • 2411.12240 • Published Nov 19, 2024 • 7
LLäMmlein: Compact and Competitive German-Only Language Models from Scratch

Paper • 2411.11171 • Published Nov 17, 2024 • 8
Xmodel-1.5: An 1B-scale Multilingual LLM

Paper • 2411.10083 • Published Nov 15, 2024 • 14
Marco-LLM: Bridging Languages via Massive Multilingual Training for Cross-Lingual Enhancement

Paper • 2412.04003 • Published Dec 5, 2024 • 10