Сбер открывает доступ к своей нейросетевой модели GigaChat

24.04.2023
Сбер выпустил собственную версию мультимодальной нейросети, которая на первом этапе будет доступна в режиме тестирования по приглашениям.

Она умеет отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и картинки на основе описаний в рамках единого контекста. В отличие от иностранной нейросети, сервис GigaChat изначально уже поддерживает мультимодальное взаимодействие и более грамотно общается на русском языке.

Архитектура сервиса GigaChat основана на нейросетевом ансамбле модели NeONKA (NEural Omnimodal Network with Knowledge-Awareness), включающей различные нейросетевые модели и метод supervised fine-tuning, reinforcement learning with human feedback. Благодаря этому новая нейросеть Сбера может решать множество интеллектуальных задач: поддерживать беседу, писать тексты, отвечать на фактологические вопросы. А включение в ансамбль модели Kandinsky 2.1 даёт нейросети навык создания изображений. Входящую в состав NeONKA ru-GPT 3.5 с 13 млрд параметров планируется выложить в открытый доступ в целях ускорения развития open-source сообщества и технологий в области искусственного интеллекта.

Модель уже активно внедряется во многие продукты и сервисы Сбера. Виртуальный ассистент Салют — один из первых продуктов, который получит в ближайшее время все возможности новой модели. Первая версия модели NeONKA была оптимизирована по размеру и скорости для применения в высоконагруженных сервисах.

Новая умная нейросеть подойдёт для работы представителей СМИ, редакторов, программистов, педагогов, студентов, маркетологов и представителей других профессий. В будущем разработчикам и бизнесу GigaChat также будет доступен для использования через облачное API.

Сейчас модель работает в режиме закрытой бета-версии. Чтобы бесплатно протестировать новую нейросеть, необходимо вступить в закрытое сообщество в Телеграм-канале.

В разработке модели участвуют команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI и ряда отраслевых экспертов, привлечённых для передачи GigaChat различных предметных знаний, настройки её на корректное исполнение инструкций и точность. Обучение нейросети происходило на суперкомпьютере Christofari Neo.

В GigaChat применяется ряд решений, призванных исключить использование генеративных моделей, противоречащее Кодексу этики в сфере искусственного интеллекта.

Читайте также
Когда дело касается цифровизации промышленности, легко увлечься разговорами о высоких технологиях, алгоритмах и искусственном интеллекте. Однако для крупных компаний, таких как «Росатом», этот процесс — не только про модернизацию, но и про баланс: между затратами и экономической целесообразностью, между технологиями будущего и реалиями текущего управления. Валентин Чубаров, руководитель проектного офиса «Инфраструктурная Iot-платформа», «Росатом Инфраструктурные решения» (РИР, входит в госкорпорацию «Росатом») делится тем, как удается внедрять инновации в масштабах всей страны, управляя инвестициями и обеспечивая безопасность критической инфраструктуры.

Похожие статьи