Alibaba запускает математические AI-модели, превосходящие разработки OpenAI и Google
Alibaba Group Holding, одна из ведущих мировых технологических компаний, представила серию больших языковых моделей (LLM) Qwen2-Math, разработанных специально для решения математических задач. Эти модели, по данным компании, показали более высокие результаты по сравнению с аналогами от OpenAI, Google и других крупных игроков на рынке AI.
Qwen2-Math включает три модели с разным количеством параметров — ключевым показателем, который определяет качество и точность вывода на основе обученных данных. Ведущая модель, Qwen2-Math-72B-Instruct, превзошла такие модели, как GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Google Gemini 1.5 Pro и Llama-3.1-405B от Meta Platforms*.
Эти результаты были получены на основе тестов, включая GSM8K — набор из 8,500 сложных математических задач, OlympiadBench — научный мультимодальный бенчмарк, и китайский экзамен gaokao, который является одним из самых сложных вступительных экзаменов в мире.
Ранее IT-World уже рассказывал о принципах работы самых популярных нейросетей и областях их применения. В своем обзоре редакция IT-World собрала основную информацию о наиболеепопулярных моделях ИИ, включая ChatGPT-4o, YandexGPT, GigaChat, Grok, LLaMA, Claude и Gemini.
Alibaba же уделила особое внимание логическим и математическим возможностям своих моделей, что позволяет им решать сложные задачи с высокой точностью. Тем не менее, на данный момент модели поддерживают только английский язык, но компания уже работает над двуязычными и многоязычными версиями.
* Запрещена в России
Источник: South China Morning Post