реклама
Новости Software

Apple разработала ИИ, который понимает человека лучше GPT-4

Научные сотрудники Apple разработали систему искусственного интеллекта ReALM (Reference Resolution as Language Modeling), способную существенно улучшить понимание человека голосовыми помощниками и повысить эффективность их реакции на запросы.

В Apple описали систему как способ решить проблему разрешения ссылок большими языковыми моделями — она поможет ИИ интерпретировать описание пользователем объектов на экране и лучше понимать контекст разговора. В результате ReALM приведёт к более интуитивному и естественному взаимодействию с устройствами. Разрешение ссылок помогает системам лучше понимать естественную речь, позволяя пользователям в разговоре с ИИ пользоваться местоимениями и другими косвенными отсылками. Для голосовых помощников этот аспект взаимодействия с человеком традиционно представлял значительную проблему, и система ReALM сводит её к задаче, решаемой на уровне языковой модели. ИИ начинает адекватно воспринимать отсылки к визуальным элементам на экране и интегрирует эти понятия в поток разговора.

ReALM восстанавливает визуальный макет экрана при помощи текстовых представлений. Этот процесс включает в себя анализ экранных объектов и их местоположений с его переводом в текстовый формат, отражающий содержимое и структуру элементов на экране. Исследователи Apple обнаружили, что этот способ в сочетании с тонкой настройкой языковых моделей значительно превосходит традиционные методы, включая возможности нейросети OpenAI GPT-4. ReALM поможет пользователям предельно просто описывать элементы экрана, а ИИ-помощникам — понимать такие описания. Эти возможности окажутся полезными, например, при управлении информационно-развлекательными системами автомобилей с помощью голосовых команд и повысят эффективность голосового интерфейса для людей с ограниченными возможностями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
GTA V продолжает делать деньги — продажи игры достигли 200 млн копий 2 ч.
3Logic локализует в России китайскую платформу Gitee и перенесёт 100 тыс. open source проектов 11 ч.
Ghost of Tsushima наконец вышла на ПК, а оверлей PlayStation звёзд с неба не хватает 12 ч.
Microsoft PC Manager начал настоятельно рекомендовать поисковик Bing 13 ч.
В TikTok появились 60-минутные видео, но загружать их могут не все 13 ч.
Manor Lords превзошла «самые смелые» ожидания издателя — игра достигла новой вершины продаж 14 ч.
Датамайнер поделился подробностями следующей игры Valve — это героический PvP-шутер в мире фэнтезийного стимпанка 15 ч.
Ubisoft раскрыла стратегию на ближайшее будущее, но Watch Dogs в нём места не нашлось 16 ч.
Fallout 4 оказалась самой продаваемой игрой в Европе за апрель — спустя почти девять лет после релиза 17 ч.
Meta грозят огромные штрафы: ЕС расследует, как обеспечивается безопасность детей в Facebook и Instagram 19 ч.
«Джеймс Уэбб» засёк древнейшее в истории наблюдений столкновение сверхмассивных чёрных дыр, многое объясняющее в эволюции Вселенной 2 ч.
Половина пользователей PlayStation Network до сих пор не перешла на PS5 3 ч.
Энтузиазм инвесторов в отношении ИИ вызвал рост курса акций Apple 4 ч.
За пять лет TSMC увеличит объёмы выпуска продукции по зрелым техпроцессам на 50 % 4 ч.
Intel прекращает выпуск флагманского чипа Ponte Vecchio и «уходит» в ИИ 6 ч.
Со следующего года Qualcomm перестанет снабжать Huawei своими компонентами 6 ч.
Новая статья: Обзор 57-дюймового игрового Mini-LED VA-монитора Samsung Odyssey Neo G95NC: с запасом на будущее 11 ч.
Шестое поколение ускорителей Google TPU v6 готово к обучению ИИ-моделей следующего поколения 12 ч.
TSMC запустит массовое производство по оптимизированному 3-нм техпроцессу N3P уже в этом году 13 ч.
Palit представила белые видеокарты GeForce RTX 4070 White и RTX 4060 Ti White 16 ч.