Огромное вам спасибо. Продолжение?

by Makar7 - opened 1 day ago

Discussion

Makar7

1 day ago

•

edited 1 day ago

Спасибо за ваш вклад в открытые модели.

Будет ли также готова YandexGPT-5-Lite-8B модель (если "да" то когда)?

Будут ли и дальше модели, например, намного большего размера?

vorobyov01

Yandex org 1 day ago

Мы думаем над этим
Хотим оценить интерес сообщества к такой модели, выявить потребности.
Подписывайтесь на нас на HF и в https://t.me/stuffyNLP и узнаете первым новости о следующих опенсорсах :)

Makar7

1 day ago

•

edited 1 day ago

Надеюсь, что полноценная версия будет считать себя Алисой в полной мере. Я читал на Хабре, https://habr.com/ru/companies/yandex/articles/739626/ как команда Яндекса создавала YandexGPT и как в него добавляла характер Алисы. Не хотелось бы в плане её характера получать какие-либо ухудшения. Ну и конечно же хотелось бы более открытой лицензии для полноценной YandexGPT-5-Lite-8B, а то сейчас вроде бы и открытые веса, но выглядит так как будто бы это закрытые веса.

Также у меня есть вопросы:
Почему вы для своей большой модели YandexGPT-5 выбрали в качестве основы Qwen2.5 32b, а не версию 72B, которая очевидно умнее? Это же было бы намного логичнее.
А также вопрос: почему вы так и не добавили пока ни в одну из своих моделей режим рассуждений? Если это из-за колонок, то можно было бы сделать так, чтобы Алиса, начиная обдумывать ответ на вопрос, говорила: «Дайте-ка подумать». Либо же просто можно сделать выбор между рассуждающей и не рассуждающей моделью. Вы же можете до обучить модель на DeepSeek-R1 так как её лицензия это позволяет.

Одним словом удачи! (надеюсь не в пустоту говорю)

vorobyov01

Yandex org about 18 hours ago

•

edited about 18 hours ago

Спасибо большое за интересные вопросы! Постараюсь ответить:

Алиса — отдельный продукт, который работает на базе моделей YandexGPT. Персонажность — это уже часть непосредственно самой Алисы, у нас пока нет планов по её опенсоурсу. Но, кажется, что сообществу нужен скорее ассистент общего назначения.
Лицензия лишь ограничивает, но не запрещает коммерческое использование. Есть ли какие-то задачи которые хотелось бы решать, но лицензия не позволяет? У llama и qwen похожие лицензии, например. Можно написать нам на [email protected] и обсудить условия использования — мы открыты к диалогу :)
Модели с 32B параметрами отлично справляются с задачами пользователя и они быстрые в инференсе. Мы долго выбирали оптимальное решение и вложили много сил в дообучение, алаймент. Подробнее про большую модель можно почитать на нашей статье на Хабре https://habr.com/en/companies/yandex/articles/885218/ про YandexGPT 5
Сейчас активно работаем над исследованием ризонинга, stay tuned :)

Makar7

about 18 hours ago

•

edited about 10 hours ago

Ладно спасибо что ответили

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment