⚠ En cours d'upload. Les demandes d'accès ne seront traitées qu'une fois la mise en ligne terminée. Actuellement 13 228h 12min 30s d'audio bruts.
Bretagne
non-profit
AI & ML interests
None defined yet.
Recent Activity
Des audios avec leurs transcriptions en breton.
Dictionnaires "bruts" non parsés, au format PDF. L'idée est de s'en servir comme documents requêtables dans un système de RAG en breton.
Jeux de données ayant des problèmes d'alignement et qui seraient donc à reprendre/nettoyer
Actuellement 595h 19min 19s d'audio bruts.
Liste de ressources représentant 13 846h 51m 16s d'audios bruts en breton
Des audios avec leurs transcriptions en français.
-
cis-lmu/glotlid
Text Classification • Updated • 23.5k • 74 -
facebook/fasttext-language-identification
Text Classification • Updated • 429k • 243 -
SebOchs/canine-c-lang-id
Text Classification • 0.1B • Updated • 5 • 2 -
Mike0307/multilingual-e5-language-detection
Text Classification • Updated • 729 • • 11
⚠ En cours d'upload. Les demandes d'accès ne seront traitées qu'une fois la mise en ligne terminée. Actuellement 13 228h 12min 30s d'audio bruts.
Liste de ressources représentant 13 846h 51m 16s d'audios bruts en breton
Des audios avec leurs transcriptions en breton.
Des audios avec leurs transcriptions en français.
-
cis-lmu/glotlid
Text Classification • Updated • 23.5k • 74 -
facebook/fasttext-language-identification
Text Classification • Updated • 429k • 243 -
SebOchs/canine-c-lang-id
Text Classification • 0.1B • Updated • 5 • 2 -
Mike0307/multilingual-e5-language-detection
Text Classification • Updated • 729 • • 11
Dictionnaires "bruts" non parsés, au format PDF. L'idée est de s'en servir comme documents requêtables dans un système de RAG en breton.
Jeux de données ayant des problèmes d'alignement et qui seraient donc à reprendre/nettoyer
Actuellement 595h 19min 19s d'audio bruts.