Выжать экстракт из поиска
Как правило, рядовой пользователь вводит поисковый запрос и получает релевантные результаты. Однако организациям нужно гораздо больше. Так, для поиска конкретной информации о какой-либо компании или ее работе приходится задавать десятки разных запросов и просматривать тысячи результатов.
С целью сбора и выдачи только подходящей бизнес-информации Yandex Data Factory, подразделение «Яндекса», тестирует сервис под названием «Экстракт». Он работает по принципу подбора релевантных страниц.
Как это выглядит на практике? Сначала пользователь вручную отмечает образцы релевантных страниц, а затем машинная технология показывает похожие страницы, постепенно добавляя свежие результаты. Шанс найти больше подходящих страниц возрастает, если юзером размечено больше страниц, причем как релевантных, так и нерелевантных.