Cайты теперь могут запретить Google использовать свой контент для обучения нейросетей

29.09.2023 11:59, Владимир Фетисов

Не секрет, что крупные технологические компании используют для обучения своих нейросетей интернет-контент. На этом фоне компания Google объявила о запуске нового элемента управления под названием Google-Extended. С его помощью администраторы веб-сайтов могут запретить поисковому гиганту использовать размещаемый на подконтрольных им ресурсах контент для обучения алгоритмов Bard и Vertex.

Источник изображения: ElisaRiva / Pixabay

«Сегодня мы анонсируем Google-Extended — новый элемент управления, с помощью которого веб-издатели могут управлять тем, помогают ли их веб-сайты улучшить работу генеративных API-интерфейсов Bard и Vertex <…> Используя Google-Extended для контроля доступа к контенту на сайте, администратор может решить, помогать ли этим моделям искусственного интеллекта со временем становиться более точными и функциональными», — говорится в сообщении Google.

Элемент управления Google-Extended работает как токен, который можно добавить в файл robot.txt веб-сайта. Этот файл используется для того, чтобы сообщить поисковым алгоритмам, какой контент на площадке не нужно индексировать. Владельцы сайтов уже могут добавить соответствующий токен, чтобы заблокировать сканер компании OpenAI, которая является создателем популярного ИИ-бота ChatGPT и других алгоритмов на основе нейросетей.

Однако в случае с Google ситуация иная, поскольку компания владеет крупнейшей поисковой системой. Преимущество нового токена заключается в том, что даже в случае ограничения использования контента сайта для обучения нейросетей индексация не будет остановлена, поэтому рейтинг сайта в поисковике не снизится. При этом владельцам сайтов не надо будет беспокоиться о том, что их контент используется для обучения ИИ-алгоритмов.