metadata

language:
  - ru
  - en
license: mit
tags:
  - chat
  - instruct
  - distilled
  - QA
pipeline_tag: text-generation
datasets:
  - d0rj/ru-instruct
base_model:
  - stepenZEN/DeepSeek-R1-Distill-Llama-8B-Abliterated

DeepSeek-R1-Distill-Llama-8B-Abliterated-RU

Модель представляет собой дообученную версию DeepSeek-R1-Distill-Llama-8B-Abliterated:cite[10] на русскоязычном синтетическом датасете инструкций.

Особенности

Базовая архитектура: Основана на Llama-8B с дистилляцией знаний от DeepSeek-R1:cite[3]:cite[6]
Дообучение: Адаптация под русский язык через датасет ru-instruct (800k+ примеров)
Оптимизация:
- Удаление артефактов перевода через модель Den4ikAI/nonsense_gibberish_detector:cite[8]
- Дедупликация методом SimHash
Мультидоменность: Поддержка математических расчётов, программирования и QA:cite[8]

Датасет обучения

Комбинация 7 переведённых датасетов:

Источник	Описание
OpenOrca-ru	1.2M диалогов с детализированными ответами
OpenHermes-2.5-ru	Инструкции для сложных задач
Dolphin-ru	Мультизадачные инструкции
GSM8k-ru	Математические задачи
Boolq-ru	Вопросы с ответами Да/Нет
Conala-mined-ru	Python-сниппеты
Alpaca-cleaned-ru	Общие инструкции

Формат данных:

{
    "conversations": [
        {"role": "system", "content": "..."},
        {"role": "user", "content": "..."},
        {"role": "assistant", "content": "..."}
    ],
    "source": "название_датасета"
}