реклама
Новости Software

Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проиндексированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
И для ИИ, и для HPC: первые европейские серверные Arm-процессоры SiPearl Rhea1 получат HBM-память 4 ч.
Новая статья: Обзор смартфона vivo X100 Pro: хищник в засаде 5 ч.
Intel переизобрела локальную сеть: два ПК теперь можно соединить через Thunderbolt 4 или 5 6 ч.
Китайские учёные создали прозрачный бамбук — огнеупорную и водонепроницаемую альтернативу стеклу 6 ч.
Учёные создали недорогой и нетоксичный аккумулятор, который сохранит 80 % ёмкости после 8000 циклов перезарядки 6 ч.
«Охотники за привидениями» в реальной жизни: британская полиция получит оружие против преступников на электросамокатах 8 ч.
Lenovo выпустила компактную мобильную рабочую станцию ThinkPad P14s Gen 5 на Ryzen Pro 8040HS 10 ч.
Nvidia подняла зарплату гендиректору Дженсену Хуангу на 60 % до $34 млн за год 13 ч.
Selectel увеличила в I квартале чистую прибыль в полтора раза 13 ч.
Tile выпустит Bluetooth-трекеры с подключением к спутникам — они будут гораздо лучше Apple AirTag 14 ч.