Alibaba запускает математические AI-модели, превосходящие разработки OpenAI и Google

Логотип компании
13.08.2024
Alibaba запускает математические AI-модели, превосходящие разработки OpenAI и Google

Фото: Below the Sky / Shutterstock

Alibaba Group представила новые математические AI-модели Qwen2-Math, которые, по утверждению компании, опережают по производительности решения от OpenAI и Google.

Alibaba Group Holding, одна из ведущих мировых технологических компаний, представила серию больших языковых моделей (LLM) Qwen2-Math, разработанных специально для решения математических задач. Эти модели, по данным компании, показали более высокие результаты по сравнению с аналогами от OpenAI, Google и других крупных игроков на рынке AI.

Qwen2-Math включает три модели с разным количеством параметров — ключевым показателем, который определяет качество и точность вывода на основе обученных данных. Ведущая модель, Qwen2-Math-72B-Instruct, превзошла такие модели, как GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Google Gemini 1.5 Pro и Llama-3.1-405B от Meta Platforms*.

Эти результаты были получены на основе тестов, включая GSM8K — набор из 8,500 сложных математических задач, OlympiadBench — научный мультимодальный бенчмарк, и китайский экзамен gaokao, который является одним из самых сложных вступительных экзаменов в мире.

Ранее IT-World уже рассказывал о принципах работы самых популярных нейросетей и областях их применения. В своем обзоре редакция IT-World собрала основную информацию о наиболеепопулярных моделях ИИ, включая ChatGPT-4o, YandexGPT, GigaChat, Grok, LLaMA, Claude и Gemini.

Alibaba же уделила особое внимание логическим и математическим возможностям своих моделей, что позволяет им решать сложные задачи с высокой точностью. Тем не менее, на данный момент модели поддерживают только английский язык, но компания уже работает над двуязычными и многоязычными версиями.

* Запрещена в России

Читайте также
Что важно сделать до разработки корпоративного портала в виде мобильного приложения и почему? Что необходимо сделать после того, как создан полезный и удобный портал? Как оценить эффективность корпоративного портала? Разбирается IT-World.

Источник: South China Morning Post

Похожие статьи