реклама
Новости Software

Нейросети Chat GPT и Sage не смогли сдать «на отлично» российский университетский экзамен по истории

Историки Уральского федерального университета (УрФУ) провели эксперимент, который выявил слабости нейросетей Chat GPT и Sage, сообщает ТАСС со ссылкой на пресс-службу учебного заведения. По словам учёных, нейросети не могут сдать вузовский экзамен по истории «на отлично», поскольку не воспринимают нюансы языков разных эпох и к тому же заполняют пробелы в знаниях выдуманными фактами.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В вузе отметили, что нейросети проявили компетентность в ответах на вопросы, связанные с использованием устойчивой общей научной терминологии. Однако они владеют только современным русским языком и не воспринимают нюансы языков разных эпох. А ведь историку помимо современного русского языка приходится иметь дело с его версиями нескольких эпох, включая терминологию XVI века в нескольких вариантах (церковнославянский язык, язык деловой письменности, разговорный), XIX века, советско-марксистский язык XX века.

Принимавший «экзамен» доцент кафедры истории России УрФУ Михаил Киселев поставил нейросетям «тройку», назвав их «студентом-импровизатором». Преподаватель отметил, что «там, где материал имеет однозначные ответы, нейросеть отвечает нормально, адекватно, но в остальном она имитирует самостоятельные рассуждения, попросту выдумывая факты, несуществующие работы или авторов».

Например, на просьбу назвать историков, которые писали о завещании Василия III, обе нейросети сначала заявили, что об этом «писали многие историки», после чего назвали наиболее известных дореволюционных учёных, авторов обобщающих работ по истории России, хотя правильный ответ легко найти в поисковых системах.

«Примечательно, что нейросети наравне с реальными историками и их работами могут выдумывать как историков, так и книги. Sage назвала некоего Александра Васильевича Пильяра, а Chat GPT заявил, что Андрей Краевский якобы написал книгу “История Российского государства”. Если представить, что такая беседа велась на экзамене, то можно сказать, что студент “поплыл” из-за неглубокой проработки материала, хотя и старался держаться уверенно, пытаясь доказать противоположное», — рассказал Киселев.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Амбициозный тактический шутер Spectre Divide, где у каждого игрока в матче по два персонажа, получил дату выхода 2 ч.
Разработчик уличил Valve в нарушении правил Steam на странице Deadlock 3 ч.
AWS, Microsoft и Google лидируют на облачном рынке во всех регионах мира, кроме Китая 3 ч.
Сборник Tetris Forever объединит 15 классических версий «Тетриса», включая самую первую — для компьютера «Электроника-60» 4 ч.
Биткоин рухнул на 6 % за сутки, но ничего страшного в этом нет 5 ч.
Bandai Namco закроет онлайновый аниме-боевик Blue Protocol в Японии спустя полтора года после выхода — международный релиз отменён 5 ч.
Apple уволит 100 сотрудников успешного подразделения цифровых услуг 5 ч.
Google Meet запускает ИИ-функцию автоматического конспектирования совещаний и онлайн-встреч 8 ч.
Instagram научился накладывать текст и стикеры на фотографии 11 ч.
Castlevania: Dawn of Sorrow, Portrait of Ruin и Order of Ecclesia наконец выбрались с Nintendo DS — анонс и релиз Castlevania Dominus Collection 15 ч.
Meta будет снабжать свои ЦОД в США энергией из петротермальных источников 47 мин.
Электроника в России снова подорожает — банки ОАЭ блокируют платежи за китайскую технику 55 мин.
Продажи ПК в России взлетели на 46 % в первом полугодии — россияне распробовали отечественные марки 2 ч.
Realme намерена отгрузить 100 млн смартфонов с ИИ за три года и войти в тройку крупнейших поставщиков в Европе 2 ч.
Россияне стали намного чаще покупать Wi-Fi-роутеры с поддержкой 5 и 6 ГГц 2 ч.
SpaceX отложила запуск исторической миссии Polaris Dawn с космотуристами как минимум до 30 августа из-за непогоды 2 ч.
Tecno представила экспериментальный трёхстворчатый складной смартфон Phantom Ultimate 2 3 ч.
Sapphire Rapids Refresh для рабочих станций: Intel Xeon W-2500 и W-3500 получили до 60 ядер и до 112,5 Мбайт кеша 3 ч.
Silicon Power представила карту памяти со скоростью уровня SSD 3 ч.
Российские учёные укрепили графен наноалмазами — получился сверхпрочный материал для электроники и медицины будущего 4 ч.