Лидеры опенсорс-проектов России: кто формирует будущее машинного обучения?

Логотип компании
18.09.2024
Лидеры опенсорс-проектов России: кто формирует будущее машинного обучения?

Изображение: freepik.com

Исследовательский центр «Сильный ИИ в промышленности» при ИТМО провел анализ развития и применения мирового опенсорса в сфере машинного обучения и работы с данными в РФ. Лидерами российских разработчиков опенсорс-решений стали «Яндекс», Сбер и Т-Банк: компании демонстрируют высокие показатели в создании и поддержке опенсорс-решений, и их проекты активно используются как внутри страны, так и на международных рынках.

По данным исследования, большинство российских компаний-разработчиков опенсорс-решений ориентируются не только на внутренний рынок, но и стремятся интегрироваться в международное сообщество. Важнейшими факторами для пользователей при выборе решений стали их эффективность и функциональность, а не национальная принадлежность разработчика.

На основе мнений экспертов и данных с платформ GitHub и PyPI были выделены ведущие проекты в различных категориях: ML и алгоритмы, математика, инфраструктура, визуализация BI, хранение данных и MLOps. В топ попали как российские разработки, так и международные решения, в частности, CatBoost, LangChain, Spark, MetaBase, Numpy, ClickHouse.

Также эксперты определили лидеров среди российских компаний-разработчиков на основе количества опенсорс-проектов, их популярности, качества репозиториев, а также активности контрибьюторов. «Яндекс» занял первую позицию благодаря значительному количеству проектов, высокому уровню их использования, качеству репозиториев и активному участию разработчиков. CatBoost, один из ключевых проектов компании, востребован как в России, так и за рубежом. Также «Яндекс» активно поддерживает сообщество, организуя мероприятия и программы для разработчиков.

В топ-10 также вошли Postgres Pro, VK, Авито, Evrone, МТС, Selectel и ведущие университеты (в их числе ИТМО).

Лидеры опенсорс-проектов России: кто формирует будущее машинного обучения?. Рис. 1

Названы и основные проблемы при использовании опенсорса. Отмечается, что у создателей и пользователей опенсорс- инструментов часто возникают противоречия в требованиях к реализации, что может блокировать совместную работу над проектом. «Корпорациям нужно одно — например, повышение масштабируемости решений на большие объемы данных или вычислительные ресурсы. Сообществу индивидуальных пользователей ― другое: удобная установка на одиночные ПК, хорошая производительность на слабых системах и так далее». «Часто выделяемые недостатки открытых проектов ― документация, поддержка, совместимость с корпоративными системами и платформами».

Широкий круг сторонних экспертов помог выявить сильные и слабые стороны российского опенсорс-движения. Среди главных выводов — сохранение значимости GitHub как основной платформы для разработки, а также растущий интерес к альтернативам (Gitee, GitVerse). «Среди перспектив развития опенсорса эксперты выделяют сохранение ключевой роли человека на фоне ИИ, запрос на демократизацию и автоматизацию применения ИИ-решений, а также “международность” open source сообщества». Эксперты подчеркивают важность вклада в опенсорс для общего развития индустрии, отмечая, что необходимость финансовой поддержки таких проектов возрастает.

Читайте также
Российский рынок BI растет, причем как в корпоративном сегменте, так и в сегменте B2G. Елена Новикова, Управляющий собственник компании «Полимедиа», делится с IT-World мыслями о том, с чем связан рост, по каким критериям заказчики выбирают готовые платформенные решения и что ждет от BI-аналитики государственный сектор.

Источник: opensource.itmo.ru

Похожие статьи