реклама
Новости Software

Новая модель OpenAI CriticGPT обучена «критиковать» результаты GPT-4

Компания OpenAI представила CriticGPT — новую модель искусственного интеллекта, предназначенную для выявления ошибок в коде, сгенерированном непосредственно ChatGPT. CriticGPT будет использоваться в качестве алгоритмического помощника для тестировщиков, которые проверяют программный код, выданный ChatGPT.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно новому исследованию «LLM Critics Help Catch LLM Bugs», опубликованному OpenAI, новая модель CriticGPT создана как ИИ-ассистент для экспертов-тестировщиков, проверяющих программный код, сгенерированный ChatGPT. CriticGPT, основанный на семействе большой языковой модели (LLM) GPT-4, анализирует код и указывает на потенциальные ошибки, облегчая специалистам обнаружение недочётов, которые в противном случае могли бы остаться незамеченными из-за человеческого фактора. Исследователи обучили CriticGPT на наборе данных с образцами кода, содержащими намеренно внесённые ошибки, научив его распознавать и отмечать различные погрешности.

Учёные обнаружили, что в 63-% случаев, связанных с естественно возникающими ошибками LLM, аннотаторы предпочитали критику CriticGPT человеческой. Кроме того, команды, использующие CriticGPT, писали более полные отзывы, чем люди, не использующие этого ИИ-помощника, при этом снижался уровень конфабуляций (ложных фактов и галлюцинаций).

Разработка автоматизированного «критика» включала обучение модели на большом количестве входных данных с намеренно внесёнными ошибками. Экспертов просили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять результат с якобы обнаруженными багами. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок в коде.

В экспериментах CriticGPT продемонстрировал способность улавливать как внесённые баги, так и естественно возникающие ошибки в результатах ответов ChatGPT. Исследователи также создали новый метод «Force Sampling Beam Search» (FSBS), который помогает CriticGPT писать более детальные обзоры кода, позволяя регулировать тщательность поиска проблем и одновременно контролируя частоту ложных срабатываний.

Интересно, что возможности CriticGPT выходят за рамки простой проверки кода. В экспериментах модель применили к множеству тренировочных данных ChatGPT, ранее оцененных людьми как безупречные. Удивительно, но CriticGPT выявил ошибки в 24-% случаев, которые впоследствии были подтверждены экспертами. OpenAI считает, что это демонстрирует потенциал модели не только для работы с техническими задачами, но и подчёркивает её способность улавливать тонкие ошибки, которые могут ускользнуть даже от тщательной проверки человеком.

Несмотря на многообещающие результаты, CriticGPT, как и все ИИ-модели, имеет ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может не полностью подготовить её к оценке более длинных и сложных задач, с которыми могут столкнуться будущие ИИ-системы. Команда исследователей признаёт, что модель наиболее эффективна в обнаружении ошибок, которые могут быть определены в одном конкретном, узком месте кода. Однако реальные ошибки в выводе AI могут часто быть разбросаны по нескольким частям ответа, что представляет собой вызов для будущих итераций модели.

Кроме того, хотя CriticGPT снижает уровень конфабуляций, он не устраняет их полностью, и люди-эксперты по-прежнему могут совершать ошибки на основе этих ложных данных.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Самая ожидаемая RPG десятилетия»: геймеры подарили право на жизнь амбициозной ролевой игре The Wayward Realms от отцов The Elder Scrolls 12 мин.
В России стали чаще обнаруживать и блокировать фишинговые сайты 2 ч.
«Яндекс Переводчик» получит поддержку более 20 языков народов России 2 ч.
Coffee Stain предупредила о скором подорожании Satisfactory и объяснила причину повышения цены 2 ч.
«Обновление TF2 где угодно, но не в TF2»: фанатов обескуражил анонс дополнения с персонажами Team Fortress 2 для другой игры 3 ч.
Google заплатит за найденные в гипервизоре KVM дыры до $250 тыс. 3 ч.
Apple разрешит альтернативные платёжные системы для AR-гарнитуры Vision Pro, но только в ЕС 4 ч.
Разработку Resident Evil 9 возглавил режиссёр Resident Evil 7 — Capcom подтвердила новую игру серии 4 ч.
Dead Rising Deluxe Remaster получит полный перевод на русский и новую графику — дата выхода ремейка культового зомби-экшена 5 ч.
Геймерский браузер Opera GX получил масштабное обновление встроенного ИИ Aria 6 ч.
Noctua выпустила NH-D15 G2 — флагманский кулер нового поколения за $150 23 мин.
В США создали бионический протез ноги с нейроинтерфейсом — с ним можно даже танцевать 60 мин.
Google купила долю в New Green Power, которая строит солнечные электростанции на Тайване 2 ч.
США запустили многомиллионную программу подготовки специалистов для полупроводниковой отрасли 2 ч.
К бесконтактным платежам через NFC могут добавить проверку документов и другие функции 2 ч.
Dell'Oro: продажи кампусных Ethernet-коммутаторов рухнули на 23 % 3 ч.
Изготовлен последний сегмент зеркала для самого большого телескопа в истории Земли 3 ч.
Panasonic призналась, что рекламировала камеры и оптику Lumix с помощью фальшивых фото 4 ч.
AST SpaceMobile пообещала стабильное подключение смартфонов к спутникам даже в помещениях 5 ч.
Высокая ставка рефинансирования тормозит запуск новых ЦОД в России, но госкорпораций это не касается 6 ч.