Машинное обучение для не-программистов

Логотип компании
24.03.2015
Машинное обучение для не-программистов
Темы анализа данных затрагиваются на каждой ИТ-конференции. И если вы не используете эти технологии – значит, вы отстали от мировых тенденций.
В последнее время мы все чаще слышим слова «большие данные» и «машинное обучение». Компания Gartner в своем прогнозе на 2015 год обозначила всестороннюю аналитику как один из пяти ключевых ИТ-трендов года. Темы анализа данных затрагиваются на каждой ИТ-конференции. И если вы не используете эти технологии – значит, вы отстали от мировых тенденций. 

Но есть и другое мнение. Некоторые специалисты считают, что направлениям больших данных и машинного обучения уделяется незаслуженно чрезмерное внимание и многие компании в погоне за модой стремятся внедрить данные технологии, не до конца понимая, для чего они служат. При этом попытка обратиться к компании-нтегратору обычно приводит к получению коммерческих предложений с довольно крупными суммами и длительными сроками внедрения. 

Но как же быть, если вы хотите просто попробовать, чтобы понять, нужно ли вашей компании это пресловутое машинное обучение? Оказывается, для этих целей существуют готовые инструменты, позволяющие без навыков программирования строить модели и проводить эксперименты. Один из таких инструментов – онлайн-платформа Azure ML Studio от компании Microsoft. Она позволяет взять данные формате csv, загрузить в систему и в визуальном редакторе нарисовать нужную модель, выбрав необходимый алгоритм прогнозирования, а затем, опубликовав готовую модель, подключиться через обычный Excel к полученной системе. Алгоритм работы выглядит следующим образом:

Машинное обучение для не-программистов. Рис. 1

Пример того, как выглядит проект в визуальном редакторе:

Машинное обучение для не-программистов. Рис. 2
Как можно увидеть, ничего сложного в работе с данной системой нет. Единственное, что требуется, это знание основ статистики и понимание алгоритмов работы машинного обучения. Но даже если вы не владеете такими знаниями, получить базовые понятия довольно просто, в Интернете достаточно курсов – начиная от школы данных «Яндекса» до знаменитого портала Courcera. Открыв сохраненный проект в Excel, вы можете вводить данные и получать прогнозы прямо в таблице. Вот как это выглядит на примере:
 Слева – блок параметров, в который вы заносите ваши исходные данные. Справа зеленым – блок предсказанных значений. Он повторяет введенные вами данные и в зависимости от типа алгоритма отображает прогноз. В данном случае модель предсказывает количество проданного товара в зависимости от цены, процента скидки, дня недели и времени дня. В результате мы получаем два предсказанных результата: среднее значение объема продаж и отклонение от среднего. 

Таким образом, инструменты типа Azure ML Studio позволяют специалистам по анализу данных в ваших компаниях попробовать на практике данные технологии и решить, насколько целесообразно внедрение того же машинного обучения для вашего бизнеса. 

Мой практический опыт при использовании технологий машинного обучения для анализа данных на проекте 2for1.pro показал, что даже такой вопрос, как выбор исходных данных для моделирования, не так прост, как кажется на первый взгляд. А инструмент от Microsoft можно использовать совершенно бесплатно, если для вас некритично время обработки запросов. При этом даже если у вас нет исходных данных, вы можете посмотреть более 20 готовых примеров, которые позволят расширить знания в области машинного обучения не в теории, а на практике. 

Машинное обучение для не-программистов. Рис. 3
Похожие статьи