📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺

RuAdapt-CEFR — это модель, разработанная студентами ДГТУ "Школа Икс", предназначенная для упрощения и адаптации текстов на основе их сложности.

🚀 Особенности модели:

✅ Основана на ai-forever/rugpt3large_based_on_gpt2
✅ Дообучена на RuAdapt и RuSimpleSentEval
✅ Позволяет адаптировать тексты под уровни CEFR (A1–C2)
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику

🎯 Использование

Модель принимает промпт следующего формата:

Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target}

Пример запроса:

from transformers import pipeline

model = "ваш_юзернейм/ruadapt-cefr"
pipe = pipeline("text-generation", model=model)

text = "Научно-технический прогресс оказывает огромное влияние на современный мир."
level = "A2"

prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:"
result = pipe(prompt, max_length=100)

print(result[0]["generated_text"])

🔗 Ссылка на Google Colab

📌 Открыть в Google Colab

📚 Датасеты

  • RuAdapt

  • RuSimpleSentEval

🎨 Области применения

  • Упрощение текстов для изучающих русский язык

  • Автоматическая адаптация текстов под CEFR

  • Образовательные и академические задачи

Downloads last month
17
Safetensors
Model size
774M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for dwaru/RuAdaptGPT2Large

Finetuned
(8)
this model
Quantizations
1 model