data-silence
commited on
Commit
•
4f941c4
1
Parent(s):
ee4d528
Update README.md
Browse files
README.md
CHANGED
@@ -3,4 +3,56 @@ language:
|
|
3 |
- ru
|
4 |
library_name: fasttext
|
5 |
pipeline_tag: text-classification
|
6 |
-
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
- ru
|
4 |
library_name: fasttext
|
5 |
pipeline_tag: text-classification
|
6 |
+
---
|
7 |
+
|
8 |
+
# FastText Классификатор текста
|
9 |
+
|
10 |
+
Это модель FastText для классификации текста, обученная на моём новостной датасете data-silence/rus_news_classifier, состоящем из новостей за последние 5 лет, размещенная на Hugging Face Hub.
|
11 |
+
|
12 |
+
## Описание модели
|
13 |
+
|
14 |
+
Эта модель использует FastText для классификации текста по 11 категориям. Она была обучена на ~ 70_000 примерах и достигает точности 0.8691016964865116 на тестовом наборе данных.
|
15 |
+
|
16 |
+
### Задача
|
17 |
+
|
18 |
+
Модель предназначена для классификации русскоязычных новостных статей по 11 категориям.
|
19 |
+
|
20 |
+
|
21 |
+
### Категории
|
22 |
+
|
23 |
+
Модель классифицирует тексты по следующим категориям:
|
24 |
+
{
|
25 |
+
0: 'climate', 1: 'conflicts', 2: 'culture', 3: 'economy', 4: 'gloss',
|
26 |
+
5: 'health', 6: 'politics', 7: 'science', 8: 'society', 9: 'sports', 10: 'travel'
|
27 |
+
}
|
28 |
+
|
29 |
+
## Использование
|
30 |
+
|
31 |
+
Чтобы использовать эту модель, вам понадобятся библиотеки `fasttext` и `transformers`. Установите их с помощью pip:
|
32 |
+
|
33 |
+
`pip install fasttext transformers`
|
34 |
+
|
35 |
+
Пример использования модели:
|
36 |
+
|
37 |
+
```python
|
38 |
+
from transformers import pipeline
|
39 |
+
|
40 |
+
classifier = pipeline("text-classification", model="[ВАШ_ПОЛЬЗОВАТЕЛЬ]/[ИМЯ_РЕПОЗИТОРИЯ]")
|
41 |
+
|
42 |
+
text = "Ваш текст для классификации здесь"
|
43 |
+
result = classifier(text)
|
44 |
+
print(result)
|
45 |
+
```
|
46 |
+
|
47 |
+
## Контакты
|
48 |
+
|
49 |
+
Если у вас есть вопросы или предложения по улучшению модели, пожалуйста, создайте issue в этом репозитории или свяжитесь со мной по адресу [email protected].
|
50 |
+
|
51 |
+
@misc{data-silence_fasttext_classifier,
|
52 |
+
author = {Max K},
|
53 |
+
title = {FastText Классификатор текста},
|
54 |
+
year = {2024},
|
55 |
+
publisher = {Hugging Face},
|
56 |
+
journal = {Hugging Face Hub},
|
57 |
+
howpublished = {\url{https://huggingface.co/data-silence/fasttext-rus-news-classifier}}
|
58 |
+
}
|