реклама
Новости Software

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

 Источник изображения: NTU

Источник изображения: NTU

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Спустя девять лет после релиза The Witcher 3: Wild Hunt на ПК получила редактор модов REDkit и поддержку «Мастерской Steam» 17 мин.
Авторы Norco выпустят «микроприключение» Silenus про андроида на населённом ИИ заводе — в Steam вышло необычное демо 49 мин.
Ethereum взлетел более чем на 20 % и продолжает расти на фоне слухов об одобрении спотовых Ethereum-ETF 2 ч.
Senua's Saga: Hellblade II не оставила критиков равнодушными — первые оценки одного из главных эксклюзивов Xbox в 2024 году 2 ч.
Скарлетт Йоханссон запретила использовать свой голос для ChatGPT — OpenAI не послушалась и пытается договориться 2 ч.
ИИ-помощник Copilot появится в Minecraft, а следом и в других играх на Xbox 4 ч.
Календарь релизов — 20–26 мая: Senua’s Saga: Hellblade II, Song of Conquest и Ships At Sea 4 ч.
Epic Games Store продолжает терять эксклюзивы — игры серии Kingdom Hearts всё-таки выйдут в Steam, причём совсем скоро 5 ч.
Apple исправила баг, из-за которого на iPhone появлялись давно удалённые фото 7 ч.
Paradox перенесла на неопределённый срок симулятор жизни Life by You от команды ветерана The Sims, но игроки даже рады 16 ч.
Китайские SMIC и CXMT активизировали работу по импортозамещению расходных материалов для выпуска чипов 46 мин.
Первый в мире коммерческий космический самолет Dream Chaser прибыл во Флориду для последних тестов перед полётом на МКС 48 мин.
HP перестанет выпускать компьютеры Spectre, Envy и Pavilion — их заменят Omni и Elite 2 ч.
Операционный директор Apple провёл тайные переговоры с TSMC по поводу выпуска ИИ-чипов 2 ч.
Neuralink разрешили вживить мозговой имплант в мозг второму пациенту 2 ч.
Samsung представила Arm-ноутбуки Galaxy Book4 Edge — их покупателям подарят 50" 4К-телевизоры 3 ч.
Google рассчитывает потратить €1 млрд на расширение основного ЦОД в Финляндии, который заодно обогреет дома местных жителей 3 ч.
SpaceX провела генеральную репетицию заправки Starship перед четвёртым тестовым запуском 3 ч.
LG не сработалась с Meta и ищет нового партнёра в сфере XR-гарнитур — им может стать Amazon 4 ч.
Samsung показала первый в мире дисплей QD-LED и другие инновационные панели 5 ч.