реклама
Новости Software

ElevenLabs обучила ИИ создавать звуковые эффекты для видео

На минувшей неделе OpenAI представила модель искусственного интеллекта Sora, обученную генерировать реалистичные видеоролики по текстовому описанию. Стартап ElevenLabs предложил собственное решение Sound Effects для наложения звуковых эффектов на такие ролики.

 Источник изображения: youtube.com/@elevenlabsio

Источник изображения: youtube.com/@elevenlabsio

Компанию ElevenLabs основали в 2022 году бывший инженер Google по машинному обучению Пётр Дабковски (Piotr Dabkowski) и бывший специалист Palantir по стратегии внедрения Мати Станишевски (Mati Staniszewski). Компания выпустила модель по преобразованию текста в речь и дублированного перевода на 20 языков с сохранением оригинального тона и тембра голоса.

Новый проект ElevenLabs получил название Sound Effects — он предназначается для создания звуковых эффектов для лишённых звука видеороликов; звук генерируется по текстовому описанию. Работу очередной ИИ-модели компания продемонстрировала на примере роликов, созданных нейросетью OpenAI Sora. Для этого использовались простые описания вроде «шум волн», «звон металла», «чириканье птиц» и «двигатель гоночной машины».

ElevenLabs не раскрыла технических подробностей, касающихся работы ИИ-системы, но результаты работы новой модели вполне убедительны — фоновые звуки получились реалистичными: городской шум, шаги на оживлённой улице, сигналы человекоподобного робота и закадровый текст, который как будто читает голливудский актёр. Компании ещё предстоит рассказать, как она планирует защитить свой проект от попыток недобросовестного использования — ElevenLabs Sound Effects может заинтересовать мошенников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
В Telegram добавили сообщения с анимированными эффектами, глобальные хештеги и другие нововведения 24 мин.
Anthropic позволит создавать персональных помощников на базе ИИ-чат-бота Claude 2 ч.
ElevenLabs запустила ИИ-генератор звуковых эффектов по текстовому описанию 3 ч.
Новая статья: Songs of Conquest — песнь величия. Рецензия 14 ч.
В ранний доступ Steam ворвался олдскульный шутер Selaco на движке классических Doom — с перестрелками и умными врагами в духе F.E.A.R. 16 ч.
Warhorse официально подтвердила перевод на русский язык в Kingdom Come: Deliverance 2 18 ч.
Perplexity AI превратит поисковую выдачу в веб-страницу, которой удобно делиться с другими 18 ч.
Google добавила редактирование RCS-сообщений и другие полезные функции в Android 19 ч.
Эндгейм подкрался незаметно: авторы перспективного «дьяблоида» Wolcen: Lords of Mayhem решили забросить разработку всего через четыре года после релиза 19 ч.
Глава Take-Two Interactive уклонился от ответа, выйдет ли GTA VI на ПК 20 ч.
Корейский профсоюз Samsung объявил забастовку, но на производство и поставки памяти это не повлияет 2 ч.
Последний «дружественный» поставщик VSAT-оборудования Gilat Satellite Networks приостановил работу в РФ 3 ч.
Samsung проиграла Huawei и больше не первая по продажам складных смартфонов в мире 3 ч.
Минцифры предлагает выдавать льготные кредиты для строительства ЦОД 3 ч.
Госархив РФ построит в Калужской области дата-центр за 1 млрд руб., оснастив его российскими серверами и СХД Depo 3 ч.
В метеорите с Марса учёные разглядели образ древней Земли 3 ч.
Blackview выпустила защищённый смартфон Oscal Pilot 2 с двумя экранами и мини-ПК MP100 с мощной начинкой 4 ч.
Робот-пылесос Dreame D9 Max и вертикальный беспроводной пылесос R20 обеспечат качественную и быструю уборку 5 ч.
Samsung будет выпускать для AMD передовые 3-нм чипы с GAA-транзисторами 5 ч.
Российский хоккеист Александр Овечкин стал лицом смартфонов Infinix 6 ч.