Яндекс выпустил новое поколение генеративных нейросетей — YandexGPT 4

24.10.2024
Новая линейка включает языковую модель Pro и облегчённую версию Lite. Они превосходят по качеству ответов предыдущие версии, способны рассуждать и обрабатывать в 4 раза более длинные запросы — порядка 60 страниц текста.

Это позволяет использовать нейросети для решения более сложных и разнообразных бизнес-задач, от анализа обращений клиентов до автоматизации закупок.

Модели четвёртого поколения доступны по API в Yandex Cloud, часть функций пока работают в тестовом режиме. Новые модели применимы в разных сферах бизнеса. С их помощью можно сортировать письма и заявки клиентов, анализировать резюме и решать другие задачи, связанные с обработкой текста. Версия Pro больше подходит для сложных трудоёмких задач — например, анализа продаж. Lite будет полезна в более простых сценариях, где важна скорость ответа. Попробовать новые модели можно в демоверсии — в чате на платформе Yandex Cloud. В будущем они появятся в сервисах Яндекса для широкой аудитории. Первым таким сервисом станет Алиса с опцией «Про».

По качеству ответов YandexGPT 4 Pro выигрывает у модели прошлого поколения в среднем в 70% случаев, а в некоторых типах задач — например, в ответах на открытые вопросы — вплотную приближается к GPT-4o. Версия Lite отвечает не хуже самой мощной модели Яндекса прошлого поколения. Это стало возможным благодаря улучшению процесса обучения. В частности, разработчики научили нейросеть рассуждать — на примерах с пошаговым решением задач.

Модели нового поколения способны рассуждать (поддерживать функцию chain-of-thought). Прежде чем ответить на сложный вопрос, они разбивают задачу на более простые и решают их пошагово, выстраивая цепочку рассуждений. Это не только улучшает качество ответов, но и помогает нейросети отвечать на вопросы, которые требуют анализа. Например, новая модель способна изучить жалобу клиента, разобраться в проблеме и предложить выход из ситуации. В будущем в API появится возможность включать скрытые рассуждения для всех запросов.

Нейросети нового поколения обрабатывают в четыре раза больше текста, чем модели третьего поколения. В итоге они гораздо дольше удерживают контекст беседы, могут отвечать на сложные длинные вопросы и анализировать порядка 60 страниц текста. Новые модели лучше отвечают на вопросы с опорой на внешние источники (применяется в системах RAG, Retrieval Augmented Generation). Такими источниками могут быть, например, документы компании или статьи. Доля ошибок, в том числе выдуманных фактов, снизилась в таких сценариях почти в два раза — с 4% до 2,1%. Кроме того, новые модели в среднем в два раза быстрее предыдущих отвечают на вопросы.

YandexGPT 4 умеет генерировать команды для сторонних приложений. Например, если попросить нейросеть найти билет на самолет, она напишет команду для сервиса авиабилетов, чтобы он запустил функцию поиска мест. Генерация команд станет доступна в Yandex Cloud в ближайшее время, и разработчики смогут использовать новые модели для работы с внешними приложениями. Для этого им нужно будет описать функции и правила составления команд, а модель будет сама определять, когда ими воспользоваться.

Читайте также
Деловые сообщества в России появляются как грибы после дождя — сегодня в стране действует более 108 бизнес-клубов. Рост спроса на них понятен — в условиях неопределенности и турбулентности рынка компаниям нужна безопасная площадка для обмена опытом, налаживания деловых связей и поиска единомышленников. Крупные системные интеграторы активно подхватывают этот тренд, предлагая своим клиентам эксклюзивные клубные форматы, в рамках которых особенно наболевшие проблемы можно обсудить в закрытом круге «своих». Как может выглядеть такое сообщество и зачем это нужно ИТ-бизнесу — в материале IT-World.

Похожие статьи