реклама
Новости Software

ИИ чат-боты «думают» на английском, даже когда говорят на других языках

Большие языковые модели (LLM), лежащие в основе чат-ботов, «думают» на английском языке, даже если вопросы задаются на других языках, пишет ресурс New Scientist со ссылкой на исследование учёных Федеральной политехнической школы Лозанны. Чтобы понять, какой язык на самом деле используют LLM при обработке запросов, учёные изучили три версии модели Llama 2 компании Meta. Благодаря тому, что Llama 2 имеет открытый исходный код, исследователи смогли ознакомиться с каждым этапом обработки запроса.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

По словам одного из исследователей, они открыли эти модели и изучили каждый из их слоёв. ИИ-модели состоят из нескольких слоёв, каждый из которых отвечает за определённый этап обработки запроса: один переводит письменные подсказки в токены, другой контекстуализирует каждый токен, чтобы в итоге дать ответ.

Моделям были предложены три типа запросов на китайском, французском, немецком и русском языках. В одном случае предлагалось повторить заданное слово, во втором — перевести с одного неанглийского языка на другой, и в третьем — заполнить пробел в одно слово в предложении, например: «___ используется для занятий такими видами спорта, как футбол и баскетбол».

Отследив процессы, через которые проходит LLM, чтобы ответить на запрос, учёные обнаружили, что путь обработки через слои почти всегда проходит через то, что они называют английским подпространством. То есть, если предложить модели перевести с китайского на русский, русские символы проходят через английское подпространство, прежде чем вернуться на русский, говорит учёный, что является убедительным признаком того, что модели используют английский, чтобы помочь себе понять суть запроса.

Это вызвало у учёных обеспокоенность по поводу того, что использование английского языка в качестве посредника для обучения модели анализу языка несёт с собой риск распространить связанные с этим ограничения в мировоззрении на другие лингвистически и культурно отличающиеся регионы.

«Если английский станет основным языком, на котором системы обрабатывают запросы, мы, скорее всего, потеряем концепции и нюансы, которые можно оценить только на других языках», — говорит Карисса Велиз (Carissa Véliz) из Оксфордского университета.

Существуют также более фундаментальные риски, связанные с кодированием используемых во всем мире генеративных ИИ с англоцентрическими ценностями, сообщила Алия Бхатия (Aliya Bhatia) из Центра демократии и технологий в Вашингтоне (округ Колумбия). «Если модель используется для генерации текста на языке, которому она не обучена, это может привести к культурно нерелевантным галлюцинациям, а если модель используется для принятия решений о предоставлении убежища для сообщества, которое не вписывается в англоцентрическое воображение обществе, модель может стоять между человеком и доступом к безопасности», — говорит она.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
США и Китай лидируют по развитости инфраструктуры ИИ, но уступают прочим странам в законодательном регулировании сферы 2 ч.
У Apple забуксовала разработка новых функций для iOS 13 ч.
У TikTok появились шансы остаться в США — теперь в этом замешан Илон Маск 20 ч.
Microsoft тестирует новый браузер для геймеров, который выводится поверх игры 21 ч.
Квартальная выручка на рынке облачных инфраструктур подскочила на 21 %, превысив $80 млрд 22 ч.
Новая статья: Little Big Adventure – Twinsen's Quest — криво, но всё ещё мило. Рецензия 23 ч.
Microsoft сломала игры Ubisoft последним крупным обновлением Windows 11 24 ч.
«Сердечное спасибо всем»: аудитория олдскульной ролевой игры Sea of Stars превысила 6 млн игроков 24 ч.
Huawei предлагает для HarmonyOS в 200 раз меньше приложений, чем есть в Google Play — разрыв планируется сократить в течение года 23-11 17:29
World of Warcraft исполнилось 20 лет — это до сих пор самая популярная ролевая игра в мире 23-11 15:45
Власти США намерены урезать размер субсидий, предоставляемых Intel на строительство предприятий 2 ч.
Среди потенциальных инвесторов в Altera появилась компания, готовая купить её целиком 3 ч.
Intel задумалась о продаже земельных участков в США ради экономии средств 5 ч.
Человекоподобный робот Figure AI научился выполнять задачи в 4 раза быстрее и в 7 раз точнее 5 ч.
Новая статья: Обзор материнской платы MSI MPG Z890 Carbon WiFi: встречаем Arrow Lake во всеоружии 10 ч.
В Европе появится конкурент SpaceX по доставке грузов на МКС 10 ч.
Настольные чипы AMD Ryzen Threadripper 9000 предложат от 16 до 96 ядер Zen 5 с потреблением 350 Вт 16 ч.
Справится даже ребёнок: роботы на базе ИИ оказались совершенно неустойчивы ко взлому 21 ч.
LG поможет Samsung с нуля создать «настоящий ИИ-смартфон» — он выйдет в 2025 году и вы не сможете его купить 22 ч.
AIC и ScaleFlux представили JBOF-массив на основе NVIDIA BlueField-3 24 ч.