Огромное вам спасибо. Продолжение?

#5
by Makar7 - opened

Спасибо за ваш вклад в открытые модели.

Будет ли также готова YandexGPT-5-Lite-8B модель (если "да" то когда)?

Будут ли и дальше модели, например, намного большего размера?

Yandex org

Мы думаем над этим
Хотим оценить интерес сообщества к такой модели, выявить потребности.
Подписывайтесь на нас на HF и в https://t.me/stuffyNLP и узнаете первым новости о следующих опенсорсах :)

Надеюсь, что полноценная версия будет считать себя Алисой в полной мере. Я читал на Хабре, https://habr.com/ru/companies/yandex/articles/739626/ как команда Яндекса создавала YandexGPT и как в него добавляла характер Алисы. Не хотелось бы в плане её характера получать какие-либо ухудшения. Ну и конечно же хотелось бы более открытой лицензии для полноценной YandexGPT-5-Lite-8B, а то сейчас вроде бы и открытые веса, но выглядит так как будто бы это закрытые веса.

Также у меня есть вопросы:
Почему вы для своей большой модели YandexGPT-5 выбрали в качестве основы Qwen2.5 32b, а не версию 72B, которая очевидно умнее? Это же было бы намного логичнее.
А также вопрос: почему вы так и не добавили пока ни в одну из своих моделей режим рассуждений? Если это из-за колонок, то можно было бы сделать так, чтобы Алиса, начиная обдумывать ответ на вопрос, говорила: «Дайте-ка подумать». Либо же просто можно сделать выбор между рассуждающей и не рассуждающей моделью. Вы же можете до обучить модель на DeepSeek-R1 так как её лицензия это позволяет.

Одним словом удачи! (надеюсь не в пустоту говорю)

Спасибо большое за интересные вопросы! Постараюсь ответить:

  1. Алиса — отдельный продукт, который работает на базе моделей YandexGPT. Персонажность — это уже часть непосредственно самой Алисы, у нас пока нет планов по её опенсоурсу. Но, кажется, что сообществу нужен скорее ассистент общего назначения.
  2. Лицензия лишь ограничивает, но не запрещает коммерческое использование. Есть ли какие-то задачи которые хотелось бы решать, но лицензия не позволяет? У llama и qwen похожие лицензии, например. Можно написать нам на [email protected] и обсудить условия использования — мы открыты к диалогу :)
  3. Модели с 32B параметрами отлично справляются с задачами пользователя и они быстрые в инференсе. Мы долго выбирали оптимальное решение и вложили много сил в дообучение, алаймент. Подробнее про большую модель можно почитать на нашей статье на Хабре https://habr.com/en/companies/yandex/articles/885218/ про YandexGPT 5
  4. Сейчас активно работаем над исследованием ризонинга, stay tuned :)

Ладно спасибо что ответили

Sign up or log in to comment