реклама
Новости Software

OpenAI представила ИИ-модель GPT-4o — она гораздо умнее старых версий и будет доступна бесплатно

OpenAI представила мощную мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o, которая будет внедрена в её решения для разработчиков и потребителей в течение следующих нескольких недель. Буква «о» в названии GPT-4o означает omni (всесторонний), что указывает на мультимодальность GPT-4o.

 Источник изображений: OpenAI

Источник изображений: OpenAI

Технический директор OpenAI Мира Мурати (Mira Murati) сообщила в ходе презентации продукта в офисе OpenAI в Сан-Франциско (США), что GPT-4o имеет интеллект «уровня GPT-4», но более высокие возможности в работе с текстом и изображениями, а также с аудио. «GPT-4o воспринимает голос, текст и визуальные образы, — сообщила Мурати. — И это невероятно важно, поскольку мы думаем о будущем взаимодействии между нами и машинами».

Её предшественница — GPT-4 Turbo — обучалась на сочетании изображений и текста. Она способна анализировать изображения и текст для выполнения таких задач, как извлечение текста из изображений и даже описание содержимого этих изображений. В свою очередь, в GPT-4o к этим возможностям добавили речь. GPT-4o получил контекстное окно в 128 тысяч токенов.

Сообщается, что GPT-4o позволит значительно улучшить работу ИИ-чат-бота ChatGPT. Последний уже давно поддерживает голосовой режим, в котором ответы чат-бота расшифровываются с использованием модели преобразования текста в речь, но GPT-4o усилит эту функцию, позволяя пользователям взаимодействовать с чат-ботом больше как с помощником. Например, ему можно будет задать вопрос и прервать его, когда он отвечает. По словам OpenAI, модель GPT-4o обеспечивает реагирование «в реальном времени» и может даже улавливать эмоции в голосе пользователя, генерируя в ответ голос «в различных эмоциональных стилях» в соответствии с текущей ситуацией.

GPT-4o также улучшит визуальные возможности ChatGPT. Исходя из предложенной фотографии или экрана рабочего стола, ChatGPT теперь сможет быстро отвечать на сопутствующие вопросы: от «Что происходит в этом программном коде» до «Какую рубашку какого бренда носит этот человек?».

В дальнейшем возможности модели будут расширяться. Если сейчас GPT-4o позволяет, например, переводить сфотографированное меню на другой язык, то в будущем с её помощью ChatGPT сможет «смотреть» спортивную игру в прямом эфире и объяснять вам правила, говорит Мурати.

Начиная с сегодняшнего дня GPT-4o доступна как платным, так и бесплатным пользователям ChatGPT, но для подписчиков платных тарифных планов ChatGPT Plus и Team ограничение на количество сообщений будет «в 5 раз выше». При превышении лимита ChatGPT автоматически переключится на GPT-3.5 у бесплатных пользователей и на GPT-4 у платных.

Бесплатным пользователям ChatGPT при взаимодействии с GPT-4o станут доступны некоторые функции, которые прежде были только у платных подписчиков. В частности, обновлённый чат-бот сможет искать информацию не только в своей ИИ-модели, но также в интернете; анализировать данные и создавать графики; работать с пользовательскими изображениями и файлами; а также лучше помнить прежние взаимодействия с пользователем. Также бесплатные пользователи получат доступ к GPT Store.

OpenAI сообщила, что GPT-4o поддерживает больше языков, с улучшенной производительностью на 50 различных языках. В API OpenAI GPT-4o в два раза быстрее, чем GPT-4 (в частности, GPT-4 Turbo), вдвое дешевле и имеет более высокие лимиты по скорости.

В настоящее время поддержка голосового общения не включена в API GPT-4o для всех клиентов. OpenAI пояснила, что из-за риска неправильного использования планирует впервые запустить в ближайшие недели поддержку новых аудиовозможностей GPT-4o для «небольшой группы доверенных партнёров».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Activision оставила Call of Duty: Black Ops 6 без русской озвучки, но это не точно 17 мин.
Авторы No Man’s Sky вернули «неповторимое ощущение одиночества во вселенной» из ранней версии — стартовала экспедиция Adrift 58 мин.
Activision отсудила у создателей читов для Call of Duty ещё 14 миллионов долларов, но не всё так просто 13 ч.
ЕС учредил орган, который будет следить за безопасным развитием ИИ 14 ч.
Кошачий ролевой экшен Kristala с духом Dark Souls ворвётся в ранний доступ Steam на следующей неделе — дата выхода и новый трейлер 14 ч.
Интернет-архив Wayback Machine подвергся мощной и продолжительной кибератаке 15 ч.
Sony всё-таки подтвердила майский выпуск State of Play — где и когда смотреть, что могут показать 15 ч.
PayPal добавила стейблкоин PYUSD в популярный среди мемкоинов блокчейн Solana 16 ч.
В Windows появится магазин Android-приложений от Tencent 17 ч.
В сентябре TikTok оспорит свою блокировку в суде США 18 ч.
Новинка Exell: мощный лазерный 3LCD-проектор EXL407Z 36 мин.
Samsung отобрала у Apple лидерства на мировом рынке смартфонов в прошлом квартале 53 мин.
Япония ужесточит контроль за экспортом важных для национальной экономики технологий 2 ч.
HP нарастила продажи ПК впервые с мая 2022 года благодаря корпоративному сегменту 3 ч.
Новая статья: Обзор ноутбука AORUS 16X 9KG: перед таким экраном играть — одно удовольствие 10 ч.
Cadillac представила Optiq — роскошный электрический кроссовер по цене от $54 000 11 ч.
TeamGroup представила модули памяти T-Create Expert AI LPDDR5X CAMM2 со скоростью до 7200 МТ/с 11 ч.
Конкурент Neuralink установил рекорд по числу электродов в мозге человека — 4096 штук на площади со спичечный коробок 12 ч.
Apple решит проблему конфиденциальности в облаке с помощью «Черного ящика» 12 ч.
Arm представила процессорные ядра Cortex-X925, Cortex-A725 и Cortex-A520, а также GPU Immortalis G925 — все для 3-нм чипов нового поколения 13 ч.