IBM направляет 3500 специалистов на развитие Apache Spark

Логотип компании
17.06.2015
IBM направляет 3500 специалистов на развитие Apache Spark
Apache Spark является проектом с открытым кодом, предназначенным для обработки “больших данных”.

Корпорация IBM объявила, что направит 3500 исследователей работать над Apache Spark, который является проектом с открытым кодом, предназначенным для обработки “больших данных”. Для усиления компоненты машинного обучения компания передаст в свободное пользование свою технологию SystemML. Саму систему Apache Spark специалисты IBM провозглашают операционной системой для аналитики.

Сервис Apache Spark (sparc.apache.org) ставит целью превзойти популярную технологию MapReduce по скорости в десятки раз. На сайте демонстрируется 100-кратное превосходство над MapReduce при вычислении логистической регрессии на кластерах с использованием только оперативной памяти, и 10-кратное при использовании жестких дисков. В проекте участвует более 400 разработчиков из 50 компаний.

IBM намерена обучить еще тысячи специалистов из компаний-клиентов разрабатывать решения для обработки «больших данных», с прицелом на данные, поступающие от m2m (т. е. измеренные в реальном времени миллионами устройств, наподобие счетчиков горячей и холодной воды) на платформе Apache Spark. При этом компания будет взаимодействовать с Databrics – коммерческой структурой, уже внедряющей Apache Spark.

Смотреть все статьи по теме "Большие данные (Big data)"

Читайте также
Какие существуют типы стабилизаторов для защиты электроники от колебаний напряжения? Каковы критерии выбора стабилизатора? Расскажем о методах правильной установки и подключения стабилизатора для оптимальной защиты.

Источник: Пресс-служба IBM

Похожие статьи