OpenAI разрабатывает новую технологию под кодовым названием «Strawberry»
Согласно источнику и внутренним документам, просмотренным Reuters, проект Strawberry позволит моделям ИИ не только генерировать ответы, но и планировать действия в Интернете автономно, выполняя «глубокие исследования». Документ описывает цель Strawberry как улучшение способности ИИ к рассуждению, что до сих пор не удавалось другим моделям.
Представитель OpenAI заявил, что компания стремится к тому, чтобы её модели ИИ видели и понимали мир так же, как люди, и что постоянные исследования новых возможностей ИИ являются общей практикой в отрасли.
Проект ранее был известен как Q*, и источники сообщают, что в начале этого года были проведены демонстрации, показывающие способность модели отвечать на сложные научные и математические вопросы. На недавнем внутреннем собрании сотрудников OpenAI представила исследовательский проект с новыми навыками рассуждения, напоминающими человеческие, хотя неясно, был ли это именно Strawberry.
OpenAI надеется, что нововведение значительно улучшит способности рассуждения её моделей, включая специализированный способ обработки модели после её предварительной тренировки на больших наборах данных. Этот процесс включает методы, такие как «тонкая настройка», и напоминает метод, разработанный в Стэнфорде в 2022 году под названием «Self-Taught Reasoner» (STaR), который позволяет моделям ИИ самообучаться до более высоких уровней интеллекта.
Strawberry направлен на выполнение сложных задач, требующих планирования и выполнения действий в течение продолжительного времени. OpenAI создаёт и оценивает модели на основе специального набора данных для «глубоких исследований» и планирует использовать эти возможности для автономного проведения исследований в Интернете и выполнения работы инженеров по программному обеспечению и машинному обучению.