Microsoft Research: в будущее по новостям СМИ
Ученые из Microsoft Research, исследовательского подразделения компании Microsoft, и израильского университета Technion-Israel Institute of Technology работают над системой, задачей которой является предсказание событий будущего по новостям, публикуемым СМИ.
Ожидается, что система станет предсказывать события точнее, чем человек, вооруженный знаниями, опытом и интуицией. Указывается, что основной целью предсказаний в настоящее время являются вспышки болезней и насилия. В качестве источника данных используются материалы газеты Нью-Йорк Таймс за 22 года – с 1986 по 2007 год, а также некоторые другие данные из сети, в частности, информация портала dbpedia.org (этот проект направлен на извлечение структурированной информации из данных, собранных в рамках проекта «Википедия»). Общее число источников составляет около 90.
Что ведет к вспышкам насилия или болезней? В каком регионе это произойдет и когда? Как заметить надвигающееся неблагополучие, используя материалы СМИ? Почему далекие признаки приближающихся проблем не замечают люди, но есть надежда, что заметит ПО?
С одной стороны, бывают очевидные связи – засухи в Африке часто приводят к вспышкам холеры. С другой – созданное ПО может наткнуться в ходе исследований архивов на самые невероятные логические цепочки, которые кажутся неразумными человеческому разуму, но они работают. Другими словами, исследователей интересует не столько причинно-следственная связь, сколько автоматическое обнаружение высокой корреляции между явлениями без объяснения механизма таких связей.
Исследователь из Technion-Israel Institute Кира Радински (Kira Radinsky) говорит, что в настоящее время созданная система «угадывает» будущие события с точностью 70-90%.
Комментаторы указывают, что проводимая израильскими учеными и Microsoft Research работа была ранее описана в фантастических произведениях, например, в качестве науки психоистории, изобретенной писателем Айзеком Азимовым. Некоторые эксперты уже отнеслись к затее скептически, отметив, что даже прогнозирование погоды является в настоящее время занятием с недостаточно точным результатом – а уж сбор данных для прогноза погоды и соответствующие алгоритмы оттачиваются уже не один десяток лет.
Исследователи из Microsoft Research, работающие над проектом, не планируют коммерциализировать разработки. В их ближайших планах – расширение источников информации для системы.
Интересно, что существует еще один проект такого же рода – портал Recorded Future, который действует под девизом «Откройте предсказательную силу сети». В частности, указано, что портал якобы дает возможность прогнозировать цены на нефть. Звучит увлекательно, но при ближайшем рассмотрении оказывается, что портал в основном фокусируется на новостях типа «Встреча Ивана Ивановича с Джоном Смитом пройдет летом 2012 года» и делается попытка угадать, каким образом эта встреча повлияет на цены.