Сегодня 04 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ElevenLabs обучила ИИ создавать звуковые эффекты для видео

На минувшей неделе OpenAI представила модель искусственного интеллекта Sora, обученную генерировать реалистичные видеоролики по текстовому описанию. Стартап ElevenLabs предложил собственное решение Sound Effects для наложения звуковых эффектов на такие ролики.

 Источник изображения: youtube.com/@elevenlabsio

Источник изображения: youtube.com/@elevenlabsio

Компанию ElevenLabs основали в 2022 году бывший инженер Google по машинному обучению Пётр Дабковски (Piotr Dabkowski) и бывший специалист Palantir по стратегии внедрения Мати Станишевски (Mati Staniszewski). Компания выпустила модель по преобразованию текста в речь и дублированного перевода на 20 языков с сохранением оригинального тона и тембра голоса.

Новый проект ElevenLabs получил название Sound Effects — он предназначается для создания звуковых эффектов для лишённых звука видеороликов; звук генерируется по текстовому описанию. Работу очередной ИИ-модели компания продемонстрировала на примере роликов, созданных нейросетью OpenAI Sora. Для этого использовались простые описания вроде «шум волн», «звон металла», «чириканье птиц» и «двигатель гоночной машины».

ElevenLabs не раскрыла технических подробностей, касающихся работы ИИ-системы, но результаты работы новой модели вполне убедительны — фоновые звуки получились реалистичными: городской шум, шаги на оживлённой улице, сигналы человекоподобного робота и закадровый текст, который как будто читает голливудский актёр. Компании ещё предстоит рассказать, как она планирует защитить свой проект от попыток недобросовестного использования — ElevenLabs Sound Effects может заинтересовать мошенников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Mediascope: среднемесячный охват Telegram вырос в России до 73 % 2 ч.
Чат-бот Grok будет резюмировать новостную информацию для подписчиков социальной сети X 2 ч.
Создатель расширения подал в суд на Meta, чтобы получить право отключить ленту новостей 9 ч.
Hisense представила телевизор CanvasTV — аналог Samsung The Frame, но намного дешевле 9 ч.
Новая статья: Indika — во Царствии твоем меня помяни. Рецензия 9 ч.
Никакого PvP, офлайн-режим и неутомимый T-800: новые подробности Terminator: Survivors 12 ч.
Разработчики «Смуты» опубликовали план обновлений — улучшение основных механик и дополнение в жанре политического триллера 13 ч.
Microsoft объявила кибербезопасность абсолютным приоритетом — сработала серия хакерских атак 13 ч.
Новая платформа DevX Platform будет применяться при разработке всех ключевых продуктов МТС 13 ч.
Valve выпустила Proton 9.0 для запуска ПК-игр на Linux — улучшена работа с видеокартами Nvidia и многоядерными CPU 13 ч.
В первом квартале выручка от реализации смартфонов достигла сезонного максимума, объём поставок вырос на 6 % 3 ч.
В юбилейной публикации блога AMD слова «искусственный интеллект» упоминались 23 раза 4 ч.
Ученые создали светофильтр на 2D-полупроводнике, который прокачал недорогую камеру и открыл новый путь к оптическим компьютерам 11 ч.
Защищённые смартфоны «Ростеха» AYYA T1 начали собирать в России на предприятии «Ростелекома» 11 ч.
Смартфоны Sony Xperia 1 VI и Xperia 10 VI с олдскульным дизайном показались на изображениях в преддверии анонса 14 ч.
Mauritius Telecom проложит подводный кабель T4 из Африки в Азию — он заменит устаревшую систему SAFE 14 ч.
Microsoft инвестирует $2,2 млрд в облака и ИИ в Малайзии 14 ч.
GitHub удалил более 8500 копий эмулятора Switch от Yuzu по жалобе Nintendo 15 ч.
В июле в продажу поступит электролёт Helix за $190 000, для которого не нужна лицензия пилота 15 ч.
На строительство фабрики Intel в Аризоне привлекут $3,85 млрд через облигации 16 ч.