реклама
Новости Software

Cloudflare натравила ИИ на ботов, которые собирают данные для ИИ

Cloudflare развернула систему искусственного интеллекта, предназначенную для перехвата ботов, которые сканируют общедоступные страницы и собирают данные с целью обучения других моделей ИИ.

 Источник изображения: cloudflare.com

Источник изображения: cloudflare.com

Владельцы сайтов теоретически могут попытаться отбиться от сканеров страниц при помощи файлов robots.txt с директивами для ботов, изменения настроек веб-серверов, проверок CAPTCHA и полной блокировки ботов. В действительности операторы роботов-сканеров зачастую игнорируют директивы robots.txt, обходят как тесты CAPTCHA, так и настройки серверов. В результате на ресурсах растёт объём нежелательного трафика, а данные сайтов попадают в массивы для обучения ИИ без разрешения правообладателей — однозначного ответа на вопрос о законности такой практики пока нет.

Cloudflare предложила не блокировать сканеры, а запускать их в систему, только показывать им созданный ИИ бесполезный контент, который они будут потреблять, попав в «ИИ-лабиринт». Обнаружив несанкционированное сканирование материалов, система не блокирует запрос, а выдаёт ряд ссылок на созданные ИИ страницы, достаточно убедительные, чтобы увести на них сканер. Такой контент выглядит как настоящий, но это уже не материалы, которые система пытается защитить — в результате сканер тратит время и ресурсы. Сами по себе генерируемые ИИ материалы реальны и связаны с научными фактами, потому что дезинформацию в Cloudflare плодить не намерены, а откровенно мусорный контент может навредить репутации сайта и поисковой оптимизации.

Система окажется сдерживающим фактором для сканеров веб-контента, чьи ресурсы начнут использоваться впустую, а стоимость эксплуатации вырастет. Она будет полезным инструментом для обнаружения активности ботов; человек же не станет погружаться в такой «ИИ-лабиринт» на глубину более четырёх ссылок, уверены создатели системы. Но панацеей это решение не является: такие вещи обычно порождают гонку вооружений, и в Cloudflare уже задумываются о том, что делать дальше, чтобы оставаться впереди.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
ИИ-поисковик Perplexity собрался купить TikTok, открыть его алгоритм и поменять его до неузнаваемости 3 ч.
Новая статья: Centum — компиляция ночных кошмаров. Рецензия 4 ч.
Отечественные решения серверной виртуализации захватили 60,2 % рынка РФ, но VMware не сдаётся 5 ч.
Microids запустила в Steam бесплатную раздачу Amerzone: The Explorer’s Legacy — первой игры создателя Syberia 6 ч.
Голливудские компании начали борьбу за право экранизировать Split Fiction 6 ч.
Funcom объявила полные системные требования Dune: Awakening и рассказала, как будет развивать игру 8 ч.
Боевой трейлер научно-фантастического шутера Metal Eden от создателей Ruiner раскрыл дату выхода демоверсии 8 ч.
Instagram начал наполняться комментариями, написанными искусственным интеллектом 9 ч.
Стартап Nerdio, развивающий систему управления VDI в Microsoft Azure, привлёк $500 млн, а его капитализация выросла до $1 млрд 9 ч.
Российская компания Operation Zero предложила до $4 млн за эксплойты для Telegram 10 ч.
Парализованный пациент обрёл способность управлять роботизированной рукой силой мысли 7 ч.
Представлен планшет Honor Pad X9a с 11,5-дюймовым дисплеем и батареей на 8300 мА·ч 8 ч.
Bigscreen представила стограммовые VR-очки Beyond 2 с опциональным отслеживанием глаз 8 ч.
Рынок VR-гарнитур упал в прошлом году — его почти целиком захватила Meta, а у Apple продажи скатились 11 ч.
Google отказалась от услуг Samsung и разработала чип Tensor G5 для Pixel 10 почти самостоятельно 11 ч.
Оценка капитализации CoreWeave прямо перед IPO снизилась до $26 млрд 13 ч.
iPhone стали самыми популярными смартфонами в России — Xiaomi упала на второе место 13 ч.
Фантастика получила техническое обоснование — учёные рассчитали, где и как строить сферу Дайсона 13 ч.
Установлен новый рекорд разгона памяти DDR5 — всё ближе к 13 000 МГц 14 ч.
MSI представила серверы на архитектуре NVIDIA MGX с процессорами Intel Xeon 6 14 ч.