File size: 1,412 Bytes
0b5f5a1 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 |
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
# Загрузка модели и токенизатора
model_name = "data-silence/news_classifier_ft"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
# Перевод модели в режим оценки и на нужное устройство
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)
model.eval()
# Словарь для маппинга индексов на категории
id2label = {
0: 'climate', 1: 'conflicts', 2: 'culture', 3: 'economy', 4: 'gloss',
5: 'health', 6: 'politics', 7: 'science', 8: 'society', 9: 'sports', 10: 'travel'
}
def predict(text):
# Токенизация входного текста
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True).to(device)
# Получение предсказания
with torch.no_grad():
outputs = model(**inputs)
# Получение индекса предсказанной метки
predicted_label_id = outputs.logits.argmax(-1).item()
# Преобразование индекса в текстовую метку
predicted_label = id2label[predicted_label_id]
return {"label": predicted_label} |