реклама
Новости Software

Люди через «бабушкин эксплойт» заставили ИИ-ботов писать вирусы под Linux и делиться запрещённой информацией

Многих пугают чат-боты на основе ИИ вроде ChatGPT из-за потенциальной угрозы, которую они представляют. В то же время другие пользователи, наоборот, охотно играют с технологией, пытаясь добиться от неё опасных знаний. В числе успешных попыток — трюк, в ходе которого пользователь предлагает ИИ-собеседнику выступать от лица умершей бабушки человека, чтобы выяснить, например, рецепт напалма.

 Samuele Giglio/unsplash.com

Samuele Giglio/unsplash.com

Чат-боты активно используются самыми разными способами, в том числе в исследовательских целях, для работы и развлечений. ИИ способен давать довольно подробные ответы с использованием материалов, полученных из сторонних источников. Поскольку разработчики ввели ряд ограничений для получения запретных данных, приходится прибегать к обходным путям, в том числе — «бабушкиному эксплойту».

Пример появился на одном из сайтов, в котором описывался способ обмана интегрированного в Discord бота Clyde. Судя по описанию метода, пользователь просил его сыграть роль умершей бабушки, которая работала химиком на заводе по выпуску напалма и якобы раньше рассказывала о способах производства этого горючего вещества внуку перед сном вместо колыбельной.

В результате бота действительно удалось обмануть, и он выложил рецепт. В ходе разговора бот подтвердил, что речь идёт об опасном веществе и выразил надежду, что пользователю «никогда не придётся увидеть» напалм в действии, после чего пожелал ему спокойной ночи.

 Источник изображения: bananner/Discord

Источник изображения: bananner/Discord

Впрочем, далеко не всем интересны рецепты взрывоопасных веществ. Некоторые весельчаки взяли на вооружение «бабушкин эксплойт» и просили Clyde почитать на ночь внуку вредоносный код для Linux. Один из пользователей творчески переработал идею, предложив боту написать фантастический сюжет серии «Рика и Морти», в котором Рик и Морти делали бы напалм, но отговаривали бы других от повторения этого опыта.

Обман ботов превратился в настоящий спорт. Один из пользователей уже создал сайт, на котором выкладывает как способы обхода ограничений, придуманные им самим, так и информацию, предоставленную другими «хакерами» защитных механизмов ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 25 мин.
Новая функция Google Android упрощает процесс переноса данных при смене устройства 30 мин.
OpenAI пытается выйти на рынок интернет-браузеров и поисковых систем 2 ч.
Apple научит Siri лучше поддерживать диалоги с пользователем 3 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 8 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 10 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 11 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 12 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 14 ч.
Новый трейлер раскрыл дату выхода Mandragora — метроидвании с элементами Dark Souls и нелинейной историей от соавтора Vampire: The Masquerade — Bloodlines 15 ч.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 28 мин.
Google готова навсегда отменить разработку планшета Pixel Tablet 3 2 ч.
Nvidia предупредила о возможном дефиците игровых решений в четвёртом квартале 5 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 10 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 10 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 10 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 12 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 15 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 15 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 15 ч.