реклама
Новости Software

Крупнейшие сайты интернета запретили Apple собирать их данные для обучения ИИ

Одним из источников данных для обучения систем генеративного искусственного интеллекта являются общедоступные веб-ресурсы. Apple предоставила их владельцам возможность отказаться от сбора данных для обучения системы Apple Intelligence, и многие из крупнейших ресурсов этой возможностью воспользовались. Среди них значатся Facebook и Instagram, а также крупные новостные и медийные ресурсы, включая New York Times и The Atlantic.

В течение последних лет Apple применяла веб-сканер под названием AppleBot — собранные им данные использовались для обучения Siri и поисковой машины Spotlight. А совсем недавно компания подключила к AppleBot и Apple Intelligence. Это спорная практика, поскольку современный ИИ вольно обходится с защищёнными авторским правом материалами — в узких областях, где материалов вообще не так много, системы почти без изменений цитируют целые абзацы.

Apple уверяет, что производит сбор информации с учётом этических норм, отсеивая персональные данные, пользуясь только лицензированными материалами и общедоступными данными, которые поступают от сканера AppleBot. Чтобы дать веб-мастерам возможность отказаться от сбора информации только для обучения ИИ, компания использовала псевдоним Applebot-Extended — стандартная поисковая индексация при запрете этого псевдонима остаётся.

Отказ осуществляется внесением соответствующей директивы в общедоступный на веб-ресурсах файл robots.txt, а значит, у любого желающего есть возможность увидеть, кто из издателей заблокировал к себе доступ Apple Intelligence. Это сделали Facebook, Instagram, Craigslist, Tumblr, New York Times, Financial Times, The Atlantic, Vox Media, сеть USA Today и Condé Nast, установил журнал Wired. Чуть более четверти крупных американских новостных сайтов (294 из 1167) отказались пускать к себе ИИ от Apple, уточнил журналист Бен Уэлш (Ben Welsh).

По неподтверждённой информации, Apple заключила с некоторым медиакомпаниями сделки, заплатив им за право использовать их материалы для обучения ИИ. Вероятно, эти соображения сдерживают и остальные ресурсы — они просто ждут денег.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Новый партнёр Remedy поможет сделать Control 2 «такой, какой она всегда задумывалась» 16 мин.
Аудитория ChatGPT достигла 200 млн еженедельных пользователей — вдвое больше, чем год назад 23 мин.
Meta похвасталась ростом спроса на языковые модели Llama в 10 раз — всё благодаря их открытости 31 мин.
Анонсирована российская облачная платформа Astra Cloud для предприятий и госкомпаний 2 ч.
«Напоминает синематики старой Blizzard»: новый трейлер Warhammer 40,000: Space Marine 2 взбудоражил фанатов перед скорым релизом 2 ч.
AMD выпустила драйвер с поддержкой открытой «беты» Call of Duty: Black Ops 6, Star Wars Outlaws, Final Fantasy XVI и других игр 4 ч.
OpenAI и Anthropic согласились сдавать новейшие ИИ-модели на проверку властям США 4 ч.
Selfloss выйдет на ПК раньше обещанного — это меланхоличное приключение в мире славянских и исландских сказочных образов 4 ч.
«Словами не передать, как сильно я жду эту игру»: геймеров покорила геймплейная демонстрация Clair Obscur: Expedition 33 5 ч.
Крупнейшие сайты интернета запретили Apple собирать их данные для обучения ИИ 5 ч.