реклама
Новости Software

ChatGPT обрёл зрение — бот научился на лету понимать видеопоток с камеры смартфона и экрана

OpenAI объявила о появлении у чат-бота ChatGPT на базе генеративного интеллекта способности обрабатывать видеопоток и говорить с пользователями о том, что он «наблюдает» с помощью камеры смартфона или компьютера, либо что видит на экране устройства. Новая функция доступна в расширенном голосовом режиме (Advanced Voice Mode).

 Источник изображения: OpenAI

Источник изображения: OpenAI

О том, что ChatGPT получит функцию компьютерного зрения, позволяющую ему «видеть» при помощи камеры смартфона пользователя или через трансляцию экрана, компания объявила в мае этого года. Теперь доступ к функции расширенного голосового режима ChatGPT с распознаванием видео получили владельцы платных подписок ChatGPT Plus, Team и Pro. По словам компании, подписчики ChatGPT Enterprise и Edu не получат эту функцию до января, и что пока нет графика по её запуску в ЕС, Швейцарии, Исландии, Норвегии и Лихтенштейне.

В недавней демонстрации в программе CNN «60 минут» президент OpenAI Грег Брокман (Greg Brockman) провел тестирование расширенного голосового режима с визуальным распознаванием с участием телеведущего Андерсона Купера (Anderson Cooper) на предмет анатомических навыков чат-бота. Когда Купер рисовал части тела на доске, ChatGPT «понимал», что тот рисует. Вместе с тем ChatGPT в этом режиме допустил ошибку в задаче по геометрии, что говорит о его склонности к галлюцинациям.

После анонса в мае компания несколько раз откладывала запуск расширенного голосового режима с визуальным распознаванием. В апреле OpenAI пообещала, что этот режим будет доступен для пользователей «в течение нескольких недель», но спустя несколько месяцев признала, что на это потребуется больше времени, чем планировалось. И когда расширенный голосовой режим запустили для некоторых пользователей в сентябре, у него не было функции компьютерного зрения.

Компании Google и Meta тоже работают над аналогичными возможностями для своих чат-ботов. На этой неделе Google сделала функцию ИИ для анализа видео в реальном времени Project Astra доступной для группы «доверенных тестировщиков» на платформе Android.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
В Windows 10 и 11 появилась загадочная пустая папка — Microsoft объяснила, зачем она нужна 2 ч.
«Игра выглядит всё лучше и лучше»: геймеров впечатлил трейлер экспериментального оружия в ретрошутере Mouse: P.I. For Hire 3 ч.
OpenAI выпустила o3 и o4-mini — самые мощные рассуждающие модели, которые умеют «думать» картинками 4 ч.
Игровой ИИ-помощник от Microsoft стал доступен сотрудникам Xbox — подробности тестовой версии Copilot for Gaming 5 ч.
«Ведьмаки в ловушки не попадаются»: CD Projekt Red предупредила игроков о мошенниках, которые приглашают на «бету» The Witcher 4 6 ч.
11 bit studios подтвердила разработку двух новых игр, включая следующую Frostpunk 7 ч.
«Станет тем, чем должна была быть The Callisto Protocol»: геймплейный трейлер Cronos: The New Dawn от авторов ремейка Silent Hill 2 заинтриговал игроков 9 ч.
Microsoft позволила Copilot Studio самостоятельно управлять компьютером по заданию пользователя 9 ч.
ИИ помог Google заблокировать более 39 млн подозрительных рекламных аккаунтов 10 ч.
В классическом Outlook обнаружилась ошибка — из-за неё нагрузка на процессор при наборе текста возрастает до 50 % 11 ч.
Новая статья: Обзор ноутбука Digma Pro Pactos 16: дисплей, сборка, эффективность 14 мин.
Исследование Honor: из-за распространения дипфейков работодатели изменят способ проведения онлайн-собеседований 60 мин.
Суперускоритель Huawei CloudMatrix 384 оказалася быстрее NVIDIA GB200 NVL72, но значительно прожорливее 2 ч.
Новая статья: Расширяя границы возможностей: обзор российских студенческих разработок в сфере искусственного интеллекта 2 ч.
Microsoft выпустила «адские» контроллеры и чехол для Xbox Series X в стиле Doom: The Dark Ages 3 ч.
iPhone 6s официально стал винтажным 3 ч.
Голландцы установили мировой рекорд по скорости передачи данных по воздуху инфракрасным лучом 5 ч.
Будущая AR-гарнитура Apple Vision Air получит лёгкий титановый корпус 6 ч.
Kia представила конкурента Tesla Model 3 — электрический седан EV4 по цене $35 000 6 ч.
Представлен геймерский смартфон Nubia RedMagic 10 Air — со Snapdragon 8 Gen 3 и батареей на 6000 мА·ч за $475 8 ч.