реклама
Новости Software

Cloudflare натравила ИИ на ботов, которые собирают данные для ИИ

Cloudflare развернула систему искусственного интеллекта, предназначенную для перехвата ботов, которые сканируют общедоступные страницы и собирают данные с целью обучения других моделей ИИ.

 Источник изображения: cloudflare.com

Источник изображения: cloudflare.com

Владельцы сайтов теоретически могут попытаться отбиться от сканеров страниц при помощи файлов robots.txt с директивами для ботов, изменения настроек веб-серверов, проверок CAPTCHA и полной блокировки ботов. В действительности операторы роботов-сканеров зачастую игнорируют директивы robots.txt, обходят как тесты CAPTCHA, так и настройки серверов. В результате на ресурсах растёт объём нежелательного трафика, а данные сайтов попадают в массивы для обучения ИИ без разрешения правообладателей — однозначного ответа на вопрос о законности такой практики пока нет.

Cloudflare предложила не блокировать сканеры, а запускать их в систему, только показывать им созданный ИИ бесполезный контент, который они будут потреблять, попав в «ИИ-лабиринт». Обнаружив несанкционированное сканирование материалов, система не блокирует запрос, а выдаёт ряд ссылок на созданные ИИ страницы, достаточно убедительные, чтобы увести на них сканер. Такой контент выглядит как настоящий, но это уже не материалы, которые система пытается защитить — в результате сканер тратит время и ресурсы. Сами по себе генерируемые ИИ материалы реальны и связаны с научными фактами, потому что дезинформацию в Cloudflare плодить не намерены, а откровенно мусорный контент может навредить репутации сайта и поисковой оптимизации.

Система окажется сдерживающим фактором для сканеров веб-контента, чьи ресурсы начнут использоваться впустую, а стоимость эксплуатации вырастет. Она будет полезным инструментом для обнаружения активности ботов; человек же не станет погружаться в такой «ИИ-лабиринт» на глубину более четырёх ссылок, уверены создатели системы. Но панацеей это решение не является: такие вещи обычно порождают гонку вооружений, и в Cloudflare уже задумываются о том, что делать дальше, чтобы оставаться впереди.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Funcom объявила полные системные требования Dune: Awakening и рассказала, как будет развивать игру 51 мин.
Боевой трейлер научно-фантастического шутера Metal Eden от создателей Ruiner раскрыл дату выхода демоверсии 2 ч.
Instagram начал наполняться комментариями, написанными искусственным интеллектом 2 ч.
Стартап Nerdio, развивающий систему управления VDI в Microsoft Azure, привлёк $500 млн, а его капитализация выросла до $1 млрд 3 ч.
Российская компания Operation Zero предложила до $4 млн за эксплойты для Telegram 3 ч.
В программу сохранения классических игр GOG вошли ещё 27 хитов, включая Silent Hill 4, Deus Ex и F.E.A.R. 3 ч.
Cloudflare натравила ИИ на ботов, которые собирают данные для ИИ 4 ч.
Роскомнадзор обяжет сервисы хранить данные о переписках россиян три года 5 ч.
Кооператив на пятерых, свобода выбора и непредсказуемая погода: анонсирован шутер про выживание на острове Lost Rift от авторов Bulletstorm и Outriders 6 ч.
С Google взыскали средства для уплаты части штрафов, назначенных в России 7 ч.
Парализованный пациент обрёл способность управлять роботизированной рукой силой мысли 5 мин.
Представлен планшет Honor Pad X9a с 11,5-дюймовым дисплеем и батареей на 8300 мА·ч 2 ч.
Bigscreen представила стограммовые VR-очки Beyond 2 с опциональным отслеживанием глаз 2 ч.
Intel покинула глава разработки технологий производства чипов — перед самым дебютом Intel 18A 4 ч.
Рынок VR-гарнитур упал в прошлом году — его почти целиком захватила Meta, а у Apple продажи скатились 4 ч.
Google отказалась от услуг Samsung и разработала чип Tensor G5 для Pixel 10 почти самостоятельно 5 ч.
Оценка капитализации CoreWeave прямо перед IPO снизилась до $26 млрд 6 ч.
iPhone стали самыми популярными смартфонами в России — Xiaomi упала на второе место 6 ч.
Фантастика получила техническое обоснование — учёные рассчитали, где и как строить сферу Дайсона 7 ч.
Установлен новый рекорд разгона памяти DDR5 — всё ближе к 13 000 МГц 7 ч.