реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Бренды вернули рекламу в X с минимальными бюджетами, лишь бы не разгневать Илона Маска 2 мин.
Российский футбольный союз раскрыл, когда ждать релиз отечественного аналога FIFA и EA Sports FC 25 мин.
Apple добавит ИИ-врача в приложение «Здоровье» для iPhone 3 ч.
Изменения в лицензионной политике Broadcom VMware побуждают мелких и средних клиентов искать альтернативное решение 18 ч.
Google выпустила тестовую версии нейросети Gemini 2.5 Pro для всех пользователей 22 ч.
IBM сокращает персонал в США, но активно нанимает малоопытных сотрудников в Индии 30-03 01:58
Новая статья: Assassin’s Creed Shadows — мы ждали этого почти двадцать лет. Рецензия 30-03 00:03
Новая статья: Gamesblender № 719: «прощальная» Half-Life 3, сроки выхода The Witcher 4 и ИИ-ассистент от Nvidia 29-03 23:30
В RuStore появилась оплата ChatGPT и других ИИ-сервисов рублями, но с большой наценкой 29-03 19:20
Единственная доступная всем новинка Nvidia: в закусочных Denny's появился «завтрак гениев» Nvidia Breakfast Bytes 29-03 16:51
Японский консорциум предложил построить плавучий ЦОД с питанием от возобновляемых источников в Иокогаме 14 мин.
Новые нормы энергоэффективности ИИ-ускорителей угрожают бизнесу NVIDIA в Китае 24 мин.
Samsung представила холодильник, который поможет найти потерявшийся смартфон 40 мин.
XPeng: Рынок летающих электромобилей в два раза обойдёт по оборотам автомобильный, но не скоро 4 ч.
Японские власти решились выделить ещё $5,4 млрд поддержки для производителя 2-нм чипов Rapidus 5 ч.
Технически Intel готова упаковывать чипы для клиентов TSMC 7 ч.
Новая статья: Обзор моноблока MSI PRO AP242P 14M: для тех, кому нужны хороший экран и повышенный комфорт 12 ч.
Во второй половине 2025 года выйдет планшет Apple iPad Pro на чипе M5 16 ч.
Первый пуск немецкой ракеты-носителя Spectrum закончился её кувырком и крушением 18 ч.
AOC представила 27-дюймовый игровой монитор Q27G3H с 1440p и 200 Гц за $158 22 ч.