реклама
Новости Software

ChatGPT и другие ИИ-боты оказались ужасными пересказчиками новостей, показало исследование BBC

Четыре самых популярных в мире чат-бота с искусственным интеллектом допускают слишком много ошибок при подготовке сводок новостных материалов, показало исследование BBC. Неточности отмечены более чем в половине случаев.

 Источник изображения: Growtika / unsplash.com

Источник изображения: Growtika / unsplash.com

Журналисты BBC поставили эксперимент — они попросили чат-боты OpenAI ChatGPT, Microsoft Copilot, Google Gemini и Perplexity составить сводки по сотне новостных сюжетов агентства, а затем оценили ответы систем и определили, насколько точными они были. По итогам исследования «51 % всех ответов ИИ на связанные с новостями вопросы получили оценки как имеющие существенные проблемы в той или иной форме». Кроме того, «19 % ответов ИИ со ссылками на материалы BBC содержали фактические ошибки, такие как неверные фактические утверждения, числа и даты».

Чат-бот Google Gemini, в частности, радикально исказил заявление Национальной службы здравоохранения Великобритании, а ChatGPT и Copilot продолжали считать действующими вышедших в отставку политиков. Небрежное обращение ИИ с информацией носит системный характер, указывают британские журналисты: он «с трудом различал мнения и факты, разглагольствовал и зачастую пропускал существенный контекст». Ранее стало известно, что в iOS 18.3 была временно отключена входящая в пакет Apple Intelligence функция подготовки сводок по новостным материалам. Не все системы ИИ в ходе исследования показали себя одинаково: «у Microsoft Copilot и Google Gemini есть более существенные проблемы, чем у OpenAI ChatGPT и Perplexity», сделали вывод в BBC.

Эксперимент в очередной раз показал, что воспринимать информацию от чат-ботов с ИИ следует с долей скепсиса. ИИ развивается бурно, большие языковые модели выпускаются почти каждую неделю и ошибки в таком объёме данных неизбежны. С другой стороны, «галлюцинации», то есть заведомо неверные ответы у передовых систем теперь встречаются реже, чем раньше. ИИ прогрессирует быстрее, чем предполагает закон Мура, рассказал недавно в личном блоге глава OpenAI Сэм Альтман (Sam Altman). Но на данный момент излишне доверять чат-ботам всё-таки не стоит, особенно если речь идёт о новостных материалах.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Отечественная соцсеть «Россграм» тихо закрылась, но потом опять «ожила» 4 ч.
«Игра выглядит всё лучше и лучше»: геймеров впечатлил трейлер экспериментального оружия в ретрошутере Mouse: P.I. For Hire 10 ч.
OpenAI выпустила o3 и o4-mini — самые мощные рассуждающие модели, которые умеют «думать» картинками 10 ч.
Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming 11 ч.
«Ведьмаки в ловушки не попадаются»: CD Projekt Red предупредила игроков о мошенниках, которые приглашают на «бету» The Witcher 4 12 ч.
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 13 ч.
Grok получил функцию Studio для совместной работы ИИ и пользователя над документами и кодом 15 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 15 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 16 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 17 ч.
Эксперимент показал, что отключенные на годы SSD склонны к потере данных 45 мин.
AMD потеряет $800 млн из-за новейших ограничений на поставки ускорителей вычислений в Китай 4 ч.
Санкции не помеха: Huawei продолжает получать 7-нм чипы от TSMC через посредников 4 ч.
Новая статья: Обзор видеокарты MSI GeForce RTX 5080 Vanguard SOC, в котором она сравнивается с RTX 4080 SUPER в 20 популярных играх 5 ч.
Новая статья: Обзор ноутбука Digma Pro Pactos 16: дисплей, сборка, эффективность 7 ч.
Исследование Honor: из-за распространения дипфейков работодатели изменят способ проведения онлайн-собеседований 8 ч.
Суперускоритель Huawei CloudMatrix 384 оказалася быстрее NVIDIA GB200 NVL72, но значительно прожорливее 9 ч.
Новая статья: Расширяя границы возможностей: обзор российских студенческих разработок в сфере искусственного интеллекта 9 ч.
Microsoft выпустила «адские» контроллеры и чехол для Xbox Series X в стиле Doom: The Dark Ages 9 ч.
iPhone 6s официально стал винтажным 9 ч.