реклама
Новости Software

Хакеры научились внедрять невидимые вредоносные запросы к ИИ в изображения

Атака с внедрением подсказок — это способ сделать инструкции для системы искусственного интеллекта невидимыми для оператора-человека. Исследователи из Trail of Bits обнаружили, что такие инструкции можно скрывать в изображениях, делая текст невидимым для человеческого глаза. При последующей загрузке изображения в систему ИИ и его сжатии нейросетью подсказка становится доступной для распознавания, расшифровывается и может быть выполнена — всё это абсолютно незаметно для человека.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Инструменты ИИ сегодня популярны даже среди пользователей, не слишком разбирающихся в традиционном ПО или вопросах безопасности, и это открывает множество новых возможностей для хакеров. Исследовательская группа Trail of Bits показала способ скрывать атаки с внедрением подсказок, используя сжатие изображений при их загрузке в систему ИИ. Хорошая аналогия — скрытый фишинг в электронном письме, где текст окрашен тем же цветом, что и фон: человек его не заметит, а нейросеть прочитает и, возможно, выполнит.

В примере, представленном Trail of Bits, при загрузке изображения с внедрённой подсказкой в Gemini бэкенд Google сжимает его для экономии пропускной способности и вычислительных ресурсов. В результате скрытый текст становится видимым для нейросети, и подсказка успешно внедряется, например сообщая Gemini о необходимости передать данные из личного календаря пользователя третьей стороне.

 Источник изображения: Trail of Bits

Источник изображения: Trail of Bits

Безусловно, такой метод требует значительных усилий ради получения относительно небольшого объёма персональных данных, причём и сама атака, и изображение должны быть адаптированы под конкретную систему ИИ. Пока нет доказательств того, что метод активно используется злоумышленниками. Но это показательный пример того, как на первый взгляд безобидное действие может превратиться в вектор атаки.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Google Meet опять «штормит» — россияне массово жалуются на сбои сервиса в России 57 мин.
Anthropic выпустила ИИ-агента Claude для Google Chrome — доступен он лишь 1000 человек в мире 58 мин.
Спустя год замедления YouTube наконец уступил «VK Видео» по месячной аудитории в России 3 ч.
«Алиса» стала ИИ-агентом в «Яндекс Браузере», но пока готова выполнять поручения не для всех 4 ч.
OpenAI решили засудить за самоубийство подростка — компания пообещала изменить ChatGPT 4 ч.
Anthropic увернулась от иска за обучение ИИ на электронных книгах с помощью «исторического соглашения» 5 ч.
Восставший из мёртвых легендарный издатель Acclaim анонсировал игровую презентацию, которую «вы не захотите пропускать» 5 ч.
Миллионные зарплаты не помогли: элитная лаборатория суперинтеллекта Meta стала терять сотрудников 5 ч.
Atari выкупила у Ubisoft права на пять игр, включая Cold Fear, I Am Alive и Grow Home 6 ч.
Google выпустила «ИИ-фотошоп» — в Gemini встроили модель nano-banana, которая может точно редактировать картинки 6 ч.
Sandisk выпустила быстрые SSD WD Blue SN5100 — до 4 Тбайт и до 44 % быстрее предшественников 48 мин.
Малайзия анонсировала первый собственный ИИ-ускоритель SkyeChip MARS1000 2 ч.
«Байкал Электроникс» готовит ИИ-чип BE-AI1000 с HBM3E и PCIe 5.0 3 ч.
Китай собрался утроить выпуск ИИ-чипов в следующем году, чтобы обеспечить развитие DeepSeek 3 ч.
Представлен вместительный корпус Eurocase M9 Plus с улучшенной вентиляцией 3 ч.
Учёные в США упростили 3D-печать сверхпроводников — новый шаг к квантовым технологиям и не только 4 ч.
В России может появиться больше Tesla Cybertruck — экстравагантный электромобиль дебютирует в Южной Корее 4 ч.
Humain начала строительство двух ИИ ЦОД в Саудовской Аравии 4 ч.
Летающие электромобили Alef получили базу для испытаний в Кремниевой долине — серийное производство не за горами 4 ч.
Проект одного из крупнейших в мире ЦОД Project Sale оказался под угрозой срыва 4 ч.