реклама
Новости Software

ChatGPT был близок к сдаче экзамена на получение лицензии врача в США

Алгоритм большой языковой модели (LLM) ChatGPT компании OpenAI почти сдал экзамен на получение лицензии врача в США. Это очень сложное испытание для кандидата-человека, но ИИ-бот оказался близок к сдаче экзамена без обучения с подтверждением — на базе одного лишь поиска информации в интернете. Впрочем, лечить людей с его помощью пока никто не собирается, хотя этому помешает скорее юридическая сторона проблемы, а не практическая.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Алгоритм ChatGPT уже удивил способностью писать программный код, сдачей экзамена в бизнес-школу и другими интеллектуальными штучками. Попытка сдать экзамен US Medical Licensing Exam (USMLE) стала очередным достижением машинного алгоритма. Человеку соискателю требуются от 300 до 400 часов подготовки для сдачи этого экзамена, фактически состоящего из трёх разделов. Способность ChatGPT научиться связно и по теме давать ответы на экзаменационные вопросы USMLE позволяет надеяться, что когда-нибудь ИИ сможет либо сам давать медицинские консультации, либо, что более вероятно, станет помощником врача для постановки более точных диагнозов.

«ChatGPT показал результаты на уровне или близком к порогу сдачи всех трёх экзаменов без какого-либо специального обучения или подкрепления, — пишут исследователи в опубликованной работе. — Кроме того, ChatGPT продемонстрировал высокий уровень согласованности и проницательности в своих объяснениях».

Исследование провели специалисты из стартапа Ansible Health. Предварительно было выяснено, что прямых ответов на вопросы USMLE в интернете нет. Таким образом, ChatGPT генерировал новые ответы на основе данных, полученных им по теме вопросов.

При проходном балле в районе 60 % правильных ответов на все вопросы, ChatGPT набрал от 52,4 % до 75 % по всем трём экзаменам. В 88,9 % ответов алгоритм выдавал как минимум один значимый ответ, который исследователи квалифицировали как «новый и неочевидный хотя клинически обоснованный».

«Достижение проходного балла на этом печально известном сложном экспертном экзамене, причём без какого-либо человеческого подкрепления, знаменует собой заметную веху в развитии клинического ИИ», — говорится в заявлении авторов исследования для прессы.

Более того, в точности ответов ChatGPT на 50,3 % обошёл специально обученного для ответов на такие вопросы медицинский ИИ PubMedGPT. Что же будет, если специалист-человек натаскает ChatGPT на медицинскую квалификацию?

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 9 мин.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 2 ч.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 2 ч.
OpenAI обдумывает создание собственного интернет-браузера и поисковых систем для противостояния Google 3 ч.
Apple разрабатывает LLM Siri — она будет больше похожа на человека и выйдет с iOS 19 4 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 9 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 11 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 12 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 13 ч.
Рекордная скидка и PvP-режим Versus обернулись для Warhammer: Vermintide 2 полумиллионом новых игроков за неделю 15 ч.
Oracle объявила о доступности облачного ИИ-суперкомпьютера на базе NVIDIA H200 10 мин.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 2 ч.
Google снова уходит с рынка планшетов, сворачивая разработку Pixel Tablet 2 3 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 11 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 11 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 11 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 13 ч.
Астрономы впервые сфотографировали умирающую звезду за пределами нашей галактики — она выглядит не так, как ожидалось 16 ч.
Представлена технология охлаждения чипов светом — секретная и только по предварительной записи 16 ч.
Японская Hokkaido Electric Power намерена перезапустить ядерный реактор для удовлетворения потребности ЦОД в энергии 16 ч.