Что такое генеративный AI, и как он работает?
Еще несколько лет назад, когда обсуждались новые разработки в оласти искуственного интеллекта, подразумевалась модель машинного обучения способная делать прогнозы на основе уже имеющихся данных. Такие модели обучаются на больших базах данных, чтобы с большой вероятностью прогнозировать что-либо. Это могут быть возможные проблемы со здоровьем пациента или вероятные сценарии поведения личности в смоделированной ситуации — области его применения практически не ограничены. Единственное условие: для обучения ИИ необходима обширная выборка данных. Чем она обширнее, тем выше вероятность получения точных прогнозов.
В отличие от традиционного применения искусственного интеллекта, генеративный ИИ разработан для того, чтобы создавать новые данные, а не делать прогнозы относительно конкретного набора данных.
Генеративная система искусственного интеллекта — это система, которая учится генерировать объекты, похожие на те, с помощью которых она обучалась.
Ранним примером генеративного ИИ является гораздо более простая модель, известная как цепь Маркова. Метод назван в честь Андрея Маркова, русского математика, который в 1906 году представил этот статистический метод для моделирования поведения случайных процессов. В машинном обучении модели Маркова уже давно используются для задач прогнозирования следующего слова. Это всем знакомая функция автозаполнения или всплывающая подсказка в поисковой строке браузера.
При прогнозировании текста модель Маркова генерирует следующее слово в предложении, просматривая предыдущее слово или несколько предыдущих слов. Эта модель позволяет понять принцип работы генеративного искусственного интеллекта, однако она не может создавать правдоподобный и достаточно длинный текст, поскольку в своей работе опирается лишь на несколько последних слов.
С появлением новых возможностей, связанных с возросшей производительностью и быстродействие вычислительных мощностей, появились и новые, более совершенные модели генеративного искусственного интеллекта. Их отличие от предшественников заключается в сложности объектов, которые они могут генерировать, и объемах данных на которых они обучаются и используют.
По сути, модели генеративного искусственного интеллекта, с помощью которых работает ChatGPT и другие подобные системы, являются усовершенствованной моделью Маркова. Отличие между ними лишь в намного большем количестве используемых данных. Не будем забывать о том, что современные модели генеративного ИИ, обучаются на огромном количестве данных, находящемся в Интернете.
В этом огромном источнике текстов, слова появляются последовательно и с определенными зависимостями. Большая выборка данных помогает модели понять, как использовать куски текста. Она изучает закономерности этих блоков и использует эти знания предсказывая возможный ход мысли.
Несмотря на рост генеративного искусственного интеллекта, уже сейчас тестируются и другие модели с более сложными принципами работы:
В 2014 году исследователи из Монреальского университета предложили архитектуру машинного обучения, известную как генеративно-состязательная сеть (GAN). GAN используют две модели, которые работают в тандеме: одна учится генерировать целевой результат (например, изображение), а другая учится отличать истинные данные от выходных данных генератора. Генератор пытается обмануть дискриминатор и в процессе учится выдавать более реалистичные результаты. Генератор изображений StyleGAN основан на этих типах моделей.
Диффузионные модели были представлены исследователями из Стэнфордского университета и Калифорнийского университета в Беркли. Уточняя результаты с помощью текстовых запросов, эти модели учатся генерировать новые данные, и позволяют создавать реалистичные изображения. Модель диффузии лежит в основе системы преобразования текста в изображение Stable Diffusion.
Несмотря на то, что генеративные модели достигли впечатляющих результатов, они далеко не всегда являются лучшим инструментом для работы с данными. Например, для задач связанных с прогнозированием на основе структурированных данных, они уступают традиционным методам машинного обучения.
Кроме того, генеративный ИИ создан для того чтобы использовать информацию и модели поведения заложенные в обучающих данных. Если ему «скормить» ультранационалистические или псевдонаучные идеи, то он и будет генерировать новый контент в подобном ключе.
Другой проблемой применения моделей генеративного интеллекта является проблема авторских прав. Генераторы текста обладают способностью к плагиату и могут генерировать контент, который выглядит так, как будто он был создан конкретным человеком, что вряд ли может понравиться настоящим авторам.
С другой стороны, генеративный ИИ может расширить возможности людей творческих профессий помогая им создавать то, что в обычных условиях было бы для них недоступно из-за отсутствия времени и денег.
Одним из многообещающих направлений развития генеративного искусственного интеллекта, является его использование в производстве. Мы уже писали о замещении целой индустрии фотомоделей всего одним приложением. А если допустить возможность, что вместе с генерацией изображения мебели, ИИ будет дополнять его производственными чертежами?
Да, есть различия в принципах работы моделей искусственного интеллекта и процессе мышления человека, но возможно у нас есть и что-то общее. У людей есть способность думать и мечтать, придумывать интересные идеи и планы, и генеративный ИИ — это инструмент, который поможет нам реализовать свои мечты.
Источник: mit.edu
Опубликовано 13.11.2023