Огромное вам спасибо. Продолжение?
Спасибо за ваш вклад в открытые модели.
Будет ли также готова YandexGPT-5-Lite-8B модель (если "да" то когда)?
Будут ли и дальше модели, например, намного большего размера?
Мы думаем над этим
Хотим оценить интерес сообщества к такой модели, выявить потребности.
Подписывайтесь на нас на HF и в https://t.me/stuffyNLP и узнаете первым новости о следующих опенсорсах :)
Надеюсь, что полноценная версия будет считать себя Алисой в полной мере. Я читал на Хабре, https://habr.com/ru/companies/yandex/articles/739626/ как команда Яндекса создавала YandexGPT и как в него добавляла характер Алисы. Не хотелось бы в плане её характера получать какие-либо ухудшения. Ну и конечно же хотелось бы более открытой лицензии для полноценной YandexGPT-5-Lite-8B, а то сейчас вроде бы и открытые веса, но выглядит так как будто бы это закрытые веса.
Также у меня есть вопросы:
Почему вы для своей большой модели YandexGPT-5 выбрали в качестве основы Qwen2.5 32b, а не версию 72B, которая очевидно умнее? Это же было бы намного логичнее.
А также вопрос: почему вы так и не добавили пока ни в одну из своих моделей режим рассуждений? Если это из-за колонок, то можно было бы сделать так, чтобы Алиса, начиная обдумывать ответ на вопрос, говорила: «Дайте-ка подумать». Либо же просто можно сделать выбор между рассуждающей и не рассуждающей моделью. Вы же можете до обучить модель на DeepSeek-R1 так как её лицензия это позволяет.
Одним словом удачи! (надеюсь не в пустоту говорю)
Спасибо большое за интересные вопросы! Постараюсь ответить:
- Алиса — отдельный продукт, который работает на базе моделей YandexGPT. Персонажность — это уже часть непосредственно самой Алисы, у нас пока нет планов по её опенсоурсу. Но, кажется, что сообществу нужен скорее ассистент общего назначения.
- Лицензия лишь ограничивает, но не запрещает коммерческое использование. Есть ли какие-то задачи которые хотелось бы решать, но лицензия не позволяет? У llama и qwen похожие лицензии, например. Можно написать нам на [email protected] и обсудить условия использования — мы открыты к диалогу :)
- Модели с 32B параметрами отлично справляются с задачами пользователя и они быстрые в инференсе. Мы долго выбирали оптимальное решение и вложили много сил в дообучение, алаймент. Подробнее про большую модель можно почитать на нашей статье на Хабре https://habr.com/en/companies/yandex/articles/885218/ про YandexGPT 5
- Сейчас активно работаем над исследованием ризонинга, stay tuned :)
Ладно спасибо что ответили