реклама
Новости Software

Microsoft представила ИИ-инструмент для защиты ИИ от галлюцинаций и ошибок

Microsoft представила новую функцию Content Safety в облачной инфраструктуре Azure — она направлена на борьбу со сбоями в работе генеративного искусственного интеллекта. Функция автоматически обнаруживает и даже исправляет ошибки в ответах моделей ИИ.

 Источник изображения: youtube.com/@MicrosoftAzure

Источник изображения: youtube.com/@MicrosoftAzure

Content Safety доступна в предварительной версии в пакете Azure AI Studio — это набор средств безопасности, предназначенных для обнаружения уязвимостей, поиска «галлюцинаций» у систем ИИ, а также блокировки недопустимых запросов от пользователей. Content Safety сканирует ответы ИИ и выявляет в них неточности, сравнивая выходные данные с исходными материалами клиента.

Обнаружив ошибку, система выделяет её, сопровождает сведениями, почему предоставленная информация неверна, и переписывает проблемный контент — всё это происходит ещё «до того, как пользователь сможет увидеть» неточность. Впрочем, гарантии надёжности эта функция не даёт. На корпоративной платформе Google Vertex AI тоже есть функция «заземления» моделей ИИ посредством сверки ответов по поисковой машине Google, собственным данным компании и в перспективе сторонним наборам данных.

Система Microsoft Content Safety осуществляет согласование ответов с базовыми документами при помощи больших и малых языковых моделей, рассказал представитель компании, но и она не застрахована от ошибок. «Важно отметить, что обнаружение [ошибок при помощи функции] "заземления" не решает проблему "точности", но помогает согласовывать ответы генеративного ИИ с базовыми документами», — пояснили в Microsoft.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
В России разработают софт для проектирования 28-нм чипов только после 2030 года 30 мин.
Анонсирована олдскульная ролевая игра Threads of Time с путешествиями во времени — фанаты Chrono Trigger в восторге 34 мин.
Почту из Gmail на VK Xmail за год перенесли 1,6 млн россиян 2 ч.
«Каждый заслуживает второй шанс»: разработчики провальной The Day Before вернулись и попросили денег на новую игру 3 ч.
Google запустила новую ИИ-функцию в NotebookLM для краткого пересказа видео на YouTube 8 ч.
По стопам Илона Маска: Сэм Альтман получит большой пакет акций OpenAI 8 ч.
Вперёд в прошлое: сюжетный трейлер Metal Gear Solid Delta: Snake Eater не раскрыл дату выхода игры 13 ч.
Из раннего доступа Steam вышла детективная песочница Shadows of Doubt, в которой убийцей может оказаться кто угодно 15 ч.
Защита от роботов перестала работать: ИИ научился идеально проходить проверку reCAPTCHAv2 17 ч.
Поддержка ультрашироких мониторов, калибровка «Ветерана» и поумневший ИИ: для Warhammer 40,000: Space Marine 2 вышел первый большой патч 18 ч.
Apple действительно сильно упростила ремонт iPhone 16 Pro и Pro Max, показала разборка iFixit 7 мин.
Apple через год выпустит второе поколение AR-гарнитуры Vision Pro на процессоре M5 — Мин-Чи Куо 25 мин.
Плата reServer Industrial J501 на базе NVIDIA Jetson AGX Orin предназначена для создания ИИ-устройств 31 мин.
В облаке Oracle можно объединить до 16 тыс. ускорителей AMD Instinct MI300X 39 мин.
Европейские астрономы создали самую подробную в истории инфракрасную карту Млечного Пути 40 мин.
ИИ-стартапы добиваются миллионной выручки гораздо быстрее прочих молодых компаний 52 мин.
Наблюдение за сверхкомпактными карликовыми галактиками опровергло популярные модели тёмной материи 2 ч.
SpaceX Starlink прибавил миллион пользователей всего за четыре месяца 2 ч.
PlayStation 5 Pro стала доступна для предзаказа в России — до 130 тыс. рублей 2 ч.
Intel намерена получить от властей США субсидии на $8,5 млрд до конца года 3 ч.