реклама
Новости Software

OpenAI открыла речевой ИИ из ChatGPT для сторонних разработчиков — ждём вала говорящих приложений

Компания OpenAI представила новые возможности для упрощения процесса создания приложений на основе искусственного интеллекта. Теперь разработчики могут задействовать работающий в режиме онлайн инструмент для создания голосовых программных решений на базе ИИ, используя единый набор инструкций.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Большую часть дохода OpenAI получает от предприятий, которые используют нейросети компании для создания собственных ИИ-приложений. Поэтому расширение возможностей по созданию таких продуктов является вполне оправданным шагом на фоне обостряющейся борьбы в сфере ИИ с такими компаниями, как Google, которая внедряет в свои продукты алгоритмы, способные обрабатывать разные типы информации, включая текст, изображения и видео.

Процесс создания голосовых помощников требует от разработчиков прохождения как минимум трёх этапов: преобразование аудио в текст, обработка запроса и генерация текстового ответа на него, а также преобразование полученного ответа в аудио. В рамках внедрения новых возможностей по созданию голосовых ИИ-приложений OpenAI представила инструмент тонкой настройки больших языковых моделей после завершения этапа обучения. Такой подход позволит повысить качество ответов, которые генерируют создаваемые разработчиками алгоритмы в ответы на запросы в текстовом формате и с использованием изображений. Этап точной настройки может сопровождаться обратной связью от людей, которые проводят оценку того, насколько качественные ответы даёт алгоритм.

В OpenAI считают, что использование изображений для точной настройки моделей даст разработчикам более широкие возможности для повышения качества понимания ИИ-алгоритмами того, что демонстрируется на изображениях. Созданные таким образом приложения могут выступать, например, в качестве расширенного поиска по визуальным элементам. В дополнение к этому OpenAI представила инструмент, который позволит меньшим ИИ-моделям учиться на более крупных моделях, а также «Быстрое кэширование», которое существенно сократит затраты на разработку благодаря повторному использованию фрагментов текста, ранее уже обработанных алгоритмом. Все представленные нововведения уже тестируются с привлечением ограниченного числа клиентов OpenAI.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
«Вы не хотите оскорбить Генри Кавилла»: авторы Warhammer 40,000: Space Marine 2 анонсировали набор 4K-текстур и пригрозили токсичным игрокам 5 мин.
После установки Windows 11 24H2 на компьютерах пропадают некоторые приложения — и это не баг, а фича 26 мин.
«Фанаты Skyrim и Fallout 76 почувствуют себя как дома»: хоррор-экшен The Axis Unseen от бывшего художника Bethesda получил демо и дату релиза 35 мин.
Microsoft выпустила Office 2024 для ПК и Mac, который работает без подписки 54 мин.
СК завёл уголовное дело на создателей криптобиржи Cryptex: 96 задержанных, 148 обысков 2 ч.
Представлено российское решение Astra Infrastructure Cloud для построения защищённых частных облаков 2 ч.
Adobe выпустила Photoshop и Premiere Elements 2025 с продвинутыми ИИ-функциями и ценой по $90 2 ч.
Nvidia выпустила мультимодальную модель ИИ с открытым исходным кодом, и она не уступает GPT-4 2 ч.
Банк России займётся «обследованием» криптовалютных платежей россиян 2 ч.
CI Games раскрыла, когда ждать анонс Lords of the Fallen 2 — новые детали будущего эксклюзива Epic Games Store на ПК 3 ч.
Смартфоны OnePlus снова запретили продавать в Германии 20 мин.
Sonos наметила план, как восстановить репутацию после выпуска катастрофически глючного приложения 40 мин.
Lian Li представила компактный, но вместительный корпус Lancool 207 2 ч.
В России стартовали продажи ноутбука Honor MagicBook Art 14 со съёмной ИИ-камерой, сенсорным OLED-экраном и процессором Intel Ultra 2 ч.
BT получит £105 млн от продажи медных кабелей — пока их не украли охотники за цветным металлом 3 ч.
Philips выпустила 27- и 31,5-дюймовые изогнутые игровые мониторы серии Evnia 5000 с QHD и 180 Гц 4 ч.
Google заменила на хромбуках кнопку Caps Lock на Quick Insert для быстрого доступа к ИИ-функциям 4 ч.
США впервые выделили средства на перезапуск остановленной АЭС и покупку её энергии 5 ч.
В Бразилии появился новый оператор ЦОД 247 Data Centers, ориентированный на гиперскейлеров 5 ч.
Материнские платы Asus Z890 для процессоров Intel Core Ultra 200K показались на изображениях 6 ч.