Как запретить использование данных сайта для обучения ИИ?
В четверг компания Google объявила о выпуске нового инструмента под названием Google-Extended, который позволит индексировать сайты сканерам (или боту, создающему записи для поисковых систем), одновременно не имея доступа к их данным для обучения будущих моделей искусственного интеллекта.
Для администраторов веб-сайтов это будет простым решением, доступным через robots.txt – или текстовый файл, который позволяет веб-сканерам получать доступ к сайтам. В своем заявлении вице-президент компании по доверию Даниэль Ромен (Danielle Romain) заявила, что Google узнала от веб-издателей, «что они хотят большего выбора и контроля над тем, как их контент используется для новых сценариев использования генеративного ИИ».
«Используя Google-Extended для контроля доступа к контенту на сайте, администратор веб-сайта может решить, стоит ли помогать этим моделям искусственного интеллекта со временем становиться более точными и функциональными», — добавил она.