OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o

Логотип компании
12.09.2024Автор
OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o

Фото: PatrickAssale / Shutterstock

OpenAI представила новую модель искусственного интеллекта o1, которая способна рассуждать и решать задачи, как человек. Новая модель в 6 раз лучше пишет код, в 5 раз быстрее решает математические задачи и готова бросить вызов ученым и программистам.

12 сентября 2024 года OpenAI представила новую модель OpenAI o1, которая способна буквально «думать» как человек. Эта модель не просто генерирует текст на основе данных, а строит логические рассуждения, анализирует задачи и улучшает ответы, что делает ее в 5–6 раз производительнее предыдущей модели GPT-4o. IT-World уже сообщал о работе OpenAI над новой технологией под кодовым названием «Strawberry», которая позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования».

Основные показатели новой модели говорят сами за себя. На квалификационном экзамене Международной математической олимпиады (IMO) GPT-4o решила только 13% задач, в то время как OpenAI o1 справилась с 83%, что соответствует уровню 500 лучших студентов США. В программировании результаты не менее впечатляющие: на платформе Codeforces o1 заняла 89-й процентиль, продемонстрировав способность решать сложные задачи на уровне ведущих участников соревнований.

OpenAI представила новую модель o1: нейросеть, которая думает и решает в 6 раз лучше GPT-4o. Рис. 1

OpenAI утверждает, что о1 обучена «думать», подобно человеку, используя методику обучения с подкреплением. Это значит, что модель анализирует возможные варианты, строит цепочку мыслей (chain of thought), проверяет свои шаги и только затем выдает ответ. Такой подход позволяет существенно повысить точность и эффективность модели, что особенно важно в научных приложениях, математике и программировании.

Для сравнения: GPT-4o, предыдущая версия модели, решала только 12% задач на экзамене AIME (Американская математическая олимпиада), тогда как OpenAI o1 достигла 74% правильных решений. При повторном ранжировании 1000 образцов с использованием функции подсчета баллов модель o1 показала результат в 93%. В тестах по физике, биологии и химии (GPQA diamond) OpenAI o1 также превзошла экспертов с докторскими степенями, став первой моделью, достигшей такого уровня.

Исследователи пытаются понять, как работают большие языковые модели

Одновременно OpenAI усиливает меры безопасности, совершенствуя внутренние протоколы и взаимодействие с федеральными правительствами, чтобы соответствовать этическим нормам и минимизировать риски. По данным компании, новый подход к обучению и интеграции цепочки рассуждений в поведение модели способствует лучшему обучению модели человеческим ценностям и принципам.

У ChatGPT уже есть приложения для Android и iOS, и десктопная версия для MacOS. Тем не менее для пользователей из России доступ к ChatGPT ограничен. IT-World ранее разбирался какие нейросети доступны в России, как к ним подключиться и использовать.

Пока OpenAI o1 остается дорогим решением: стоимость использования через API составляет $15 за 1 миллион входных токенов и $60 за 1 миллион выходных токенов, что в 3-4 раза дороже по сравнению с GPT-4o. Но компания уверена, что эта инвестиция окупится за счет повышения качества решений и скорости работы в критически важных задачах.

На данный момент OpenAI предоставляет доступ к o1 в виде превью-версии для пользователей ChatGPT Plus и Team, а также API-доступ. Разработчики также анонсировали более доступную версию o1-mini, которая будет дешевле на 80% и также подойдет для программирования и других задач, требующих высокого уровня анализа. Полноценная версия модели обещана к релизу в ближайшее время.

Читайте также
В Правительстве РФ готовится очередной национальный проект, получивший название «Средства производства и автоматизации». На его реализацию выделяется более 300 млрд рублей. Цель – предоставить дополнительный ресурс для развития российских промышленных предприятий. По словам Первого заместителя Председателя Правительства РФ Дениса Мантурова, одним из трех основных направлений, на которых будет сосредоточено внимание, станет развитие робототехники.

Похожие статьи