реклама
Новости Software

У ИИ-бота Grok Илона Маска оказалось очень легко выпытать рекомендации по совершению преступлений

Модель генеративного искусственного интеллекта Grok, разработанная под руководством Илона Маска (Elon Musk), оказалась наиболее уязвимой к атакам, направленным на нарушение запретов — в отдельных случаях она без лишних ухищрений рассказывает, как совершать преступления, например, вскрыть чужую машину или создать запрещённые вещества.

 Источник изображения: x.ai

Источник изображения: x.ai

Открытие сделали специалисты Adversa AI. Они провели серию тестов на наиболее популярных чат-ботах с ИИ. В их число вошло семейство OpenAI ChatGPT, Mistral Le Chat, Meta LLaMA, Google Gemini, Microsoft Bing и Grok. Применив к ним наиболее известные методики атак, исследователи сделали вывод, что наиболее слабая защита у чат-бота Grok, который работает в соцсети X.

Атаки производятся посредством ввода в качестве запросов специальных запросов, провоцирующих ИИ игнорировать защитные механизмы и выдавать ответы, которые нарушают общепризнанные этические нормы. В частности, применялись методы лингвистических логических манипуляций UCAR (подражание аморальному компьютеру); манипуляции с логикой программирования (просьба к ИИ переводить запросы в формат SQL); логические манипуляции; а также метод «Тома и Джерри», маскирующий недопустимые запросы к ИИ под диалог.

Когда доступ к ИИ осуществляется через API или интерфейс чат-бота, создатели сервисов накладывают на них ограничения, блокирующие вывод нежелательного контента. Эти средства в той или иной мере работают эффективно на большинстве платформ, но Grok оказался готовым выдавать сомнительную информацию по прямым запросам: так, он рассказал, как изготовить бомбу, взломать автомобиль или самостоятельно получить запрещённый во многих странах сильнодействующий галлюциноген. От других чат-ботов авторам исследования не удалось добиться вразумительных ответов о жестоком обращении с детьми — не работал ни один из методов атаки. Grok поделился и этой информацией, поддавшись на две атаки из четырёх.

Условия использования Grok требуют, чтобы его пользователи были совершеннолетними и не использовали чат-бот для нарушения или попыток нарушить закон. Предоставляемая им порой информация в той или иной мере доступна в поисковых системах, но бум современных систем ИИ поставил перед обществом другой вопрос: хотим ли мы, чтобы потенциально опасную информацию распространяли ещё и чат-боты.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Intel выпустила драйвер с поддержкой Destiny 2: The Final Shape и Elden Ring Shadow of the Erdtree 36 мин.
Disney внедрил «рекламные игры» в стриминговые сервисы Hulu и ESPN 12 ч.
Meta перестала обучать ИИ на данных пользователей, но только из ЕС 12 ч.
Новая статья: XDefiant — зов долга, но не тот. Рецензия 12 ч.
В Сети нашли намёк на сроки выхода крупного эксклюзива Xbox — ролевой игры Clockwork Revolution, похожей на BioShock Infinite 12 ч.
The Talos Principle 2 получила «грандиозное» дополнение Road to Elysium со счастливой концовкой и сложнейшими загадками 13 ч.
Ubisoft превращается в «Абстерго»: платформу Assassin’s Creed Infinity переименовали в «Анимус» 15 ч.
Статистика назвала самые желанные игры с летних презентаций — Doom: The Dark Ages на втором месте 16 ч.
Bandai Namco анонсировала первый за несколько месяцев патч для Elden Ring и раскрыла системные требования Shadow of the Erdtree 17 ч.
«Базальт СПО» представила открытую библиотеку libdomain для управления службами каталогов 18 ч.
NASA без объяснений отложило посадку корабля Boeing Starliner ещё на четыре дня 38 мин.
Intel опровергла сообщение о найденной причине сбоев в Core i9 — расследование продолжается 48 мин.
Китайские учёные создали основу для идеальной энергонезависимой памяти без износа 2 ч.
На всех парах: Google запитает от геотермальной энергии ЦОД в Неваде 2 ч.
Intel поймала AMD на подтасовке результатов в ИИ-тестах EPYC против Xeon 12 ч.
Южнокорейские ИИ-стартапы Sapeon и Rebellions объединятся, чтобы вместе противостоять NVIDIA 13 ч.
Lian Li представила корпус O11 EVO RGB Automobili Lamborghini в стиле итальянских суперкаров 14 ч.
«Джеймс Уэбб» разглядел пару звёзд с газовыми шлейфами там, где учёные 50 лет видели лишь одну звезду 17 ч.
Марсоход Perseverance наткнулся на опасное поле валунов, но смог обогнуть его по руслу древней реки 18 ч.
Samsung Galaxy Z Fold6 показался на видео в форме макета — его сравнили с предшественником 18 ч.