реклама
Новости Software

ИИ-модель OpenAI o1 иногда думает на китайском языке, и никто не знает почему

Рассуждающая ИИ-модель OpenAI o1 удивляет лингвистическими способностями, переключаясь в процессе решения задач на разные языки, в том числе на китайский, даже если запрос был сделан на английском. Эксперты теряются в догадках, а OpenAI не спешит с объяснениями.

 Источник изображения: hdhAI

Источник изображения: hdhAI

OpenAI в прошлом году представила свою первую модель искусственного интеллекта (ИИ) с функциями рассуждения — o1. Однако пользователи заметили любопытную особенность: модель иногда начинает размышлять на китайском, персидском или других языках, даже если вопрос был задан на английском. Например, при решении задачи «Сколько букв R в слове strawberry?» o1 может выполнить часть рассуждений на китайском, прежде чем выдать окончательный ответ на английском.

Эксперты выдвигают несколько теорий, объясняющих это явление. Одной из них является гипотеза о влиянии китайских данных, на которых обучалась модель. Клемент Деланж (Clement Delangue), генеральный директор компании Hugging Face, разрабатывающей инструменты для создания приложений с использованием машинного обучения, и Тед Сяо (Ted Xiao), исследователь из Google DeepMind, отмечают, что многие компании, включая OpenAI, используют услуги сторонних китайских компаний для разметки данных, необходимых для обучения моделей. Это, по их мнению, и может приводить к тому, что модель o1 в некоторых случаях предпочитает в своих рассуждениях китайский язык, как более эффективный для обработки информации.

Однако не все согласны с этой теорией. Некоторые специалисты указывают на то, что влияние китайских данных не подтверждено и модель на самом деле может переключаться на разные языки, включая хинди и тайский. Это может быть связано с тем, что o1 просто выбирает наиболее удобный для себя способ решения задачи. По словам Мэтью Гуздиала (Matthew Guzdial), исследователя ИИ из университета Альберты, модель o1 не воспринимает языки как отдельные сущности, для неё это обычный текст, состоящий из набора токенов, который она обрабатывает.

В конечном итоге, точные причины поведения модели, рассуждающей на разных языках остаются загадкой. Лука Солдаини (Luca Soldaini), научный сотрудник Allen Institute for AI, подчёркивает, что из-за «непрозрачности ИИ-моделей невозможно точно установить, что происходит внутри» и как это всё функционирует. Сама OpenAI пока отмалчивается.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming 33 мин.
«Ведьмаки в ловушки не попадаются»: CD Projekt Red предупредила игроков о мошенниках, которые приглашают на «бету» The Witcher 4 2 ч.
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 3 ч.
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 5 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 5 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 6 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 7 ч.
«Путешествие важнее конечной цели»: ведущий разработчик Skyblivion отреагировал на утечку The Elder Scrolls IV: Oblivion Remastered 9 ч.
Planescape: Torment могла получить сиквел — над ним работали бывшие сценаристы Dragon Age и Fallout: New Vegas 9 ч.
Opera Mini получила ИИ-помощника Aria AI 9 ч.
Голландцы установили мировой рекорд по скорости передачи данных по воздуху инфракрасным лучом 2 ч.
Будущая AR-гарнитура Apple Vision Air получит лёгкий титановый корпус 2 ч.
Kia представила конкурента Tesla Model 3 — электрический седан EV4 по цене $35 000 2 ч.
Представлен геймерский смартфон Nubia RedMagic 10 Air — со Snapdragon 8 Gen 3 и батареей на 6000 мА·ч за $475 4 ч.
Будущее OLED-мониторов за квантовыми точками — QD-OLED захватят 73 % рынка в этом году 4 ч.
GeForce RTX 5060 Ti поступили в продажу — в России карты за $429 оценили от 55 тыс. рублей 4 ч.
47 дней вместо 398: вскоре срок действия новых SSL/TLS-сертификатов заметно сократится 5 ч.
IBM развернула один из мощнейших в мире квантовых компьютеров — у него 156 кубитов 5 ч.
PQ.Domains от PQ.Hosting, выделенные серверы в Германии и 47-я локация со сверхскоростными VPS 7 ч.
Представлены доступные смартфоны Acer Super ZX и Super ZX Pro, которые на самом деле не Acer 7 ч.