реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Дракула и Доктор Дум против Фантастической четвёрки: первый сезон Marvel Rivals погрузит Нью-Йорк в вечную ночь 3 ч.
The Witcher 4 выйдет с поддержкой новейших RTX-технологий Nvidia 4 ч.
Valve рассказала, когда разрешит устанавливать SteamOS на консоли сторонних производителей 4 ч.
Sega показала первый геймплей Virtua Fighter 6 от создателей Yakuza, но он ненастоящий 5 ч.
Глава Nvidia пообещал, что отрисовка игр никогда полностью не отойдёт ИИ — в AMD не согласны 6 ч.
Цукерберг ослабил цензуру в Facebook и Instagram, потому что её стало «слишком много» 7 ч.
Разработчики Smite 2 подтвердили, когда игра станет бесплатной — объявлена дата старта открытой «беты» 7 ч.
Google формирует команду для «моделирования мира» на основе ИИ для игр и обучения роботов 12 ч.
Фотобанки Getty Images и Shutterstock объявили о слиянии для выживания в эпоху ИИ — сделка оценена в $3,7 млрд 19 ч.
Классическую Diablo добавят в Game Pass, причём совсем скоро 22 ч.
Дубайская DAMAC инвестирует $20 млрд в строительство дата-центров в США 2 ч.
Цены на ноутбуки и электронику взлетят на 26–68 % в США из-за действий Трампа 2 ч.
Donut Lab представила «лучшие в мире» колёса для электротранспорта — им не нужна трансмиссия 3 ч.
Baseus представила пауэрбанк, который сможет раздавать интернет в более чем 100 странах 3 ч.
Micron в следующем году начнёт собирать память HBM в Сингапуре — запущено строительство фабрики 3 ч.
Lenovo представила геймерский планшет Legion Tab (2025) — Snapdragon 8 Gen 3 и экран 2,5K за $500 4 ч.
PocketBook и Sharp представили цифровые картины на дисплеях E Ink, которые заряжают раз в год 4 ч.
Honda представила футуристические электромобили Zero с «мудрой» ОС, которая будет учиться у водителя 4 ч.
Nvidia уже запустила массовое производство ИИ-ускорителей Blackwell, хотя слухи говорили о задержках и проблемах 4 ч.
Apple представит iPhone SE 4 и новые доступные iPad к апрелю 5 ч.