реклама
Теги → нейросеть

Google научила нейросеть писать 5-минутные песни по текстовому описанию, но вряд ли её когда-либо выпустят

В начале этого года Google представила MusicLM — модель искусственного интеллекта, способную создавать музыку в любом жанре. С тех пор разработчики продолжали развивать алгоритм и теперь он может создавать 5-минутные песни по небольшому текстовому описанию. Однако вероятные проблемы юридического характера вряд ли позволят компании когда-либо сделать этот инструмент общедоступным.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Взрывной рост популярности генеративных нейросетей наблюдается последние несколько месяцев. Однако алгоритмы вроде ChatGPT или DALL-E не являются первопроходцами. Так компания Open AI выпустила музыкальный ИИ-генератор Jukebox ещё в 2020 году. Возможности этого алгоритма были весьма ограничены, поэтому он не смог завоевать популярность.

Нейросеть Google MusicLM, вероятно, является значительно более продуктивной. Согласно имеющимся данным, алгоритм способен генерировать 5-минутные песни на основе текстового описания, причём конечный результат в значительно большей степени напоминает то, что мог бы написать человек. В процессе обучения алгоритма использовались 280 тыс. часов аудиозаписей.

На этапе оценки Google сравнивала MusicLM с другими музыкальными ИИ-генераторами Mubert и Riffusion, а также задействовала некоторое количество слушателей, которые оценивали качество звучания сгенерированных композиций. По данным источника, алгоритм MusicLM превзошёл аналоги по всем показателям. Несмотря на это, алгоритм всё ещё далёк от того, чтобы создавать полноценные песни, поскольку он не способен воспроизводить структуру привычных человеку музыкальных композиций, а генерируемый им вокал лишь отдалённо напоминает пение.

«Яндекс.Браузер» научился переводить видео с китайского языка

Новая функция представлена «Яндексом» в браузере собственной разработки. Теперь он получил возможность осуществлять перевод и закадровую озвучку видео с китайского языка на русский. Для обучения нейросеть использует огромный массив видео на китайском языке, анализируя полученные данные.

 Источник изображения: «Яндекс»

Источник изображения: «Яндекс»

Перевод осуществляется в несколько этапов. При этом нейросеть учитывает тон и контекст речи в видеопотоке. В компании подчеркнули, что ИИ способен различать четыре тона — данные фонетические особенности произношения способны значительно менять смысл почти любого высказывания в китайском языке. Кроме того, система «Яндекса» различает 6,5 тыс. иероглифов.

Как сообщают «Ведомости», для обучения ИИ компания использовала 100 тыс. видеоматериалов с субтитрами на севернокитайском языке, наиболее распространённом на территории Китая.

Для того, чтобы зритель мог воспользоваться переводом и озвучкой с китайского на русский язык, необходимо нажать кнопку «Перевести видео» в «Яндекс.Браузере». Сообщается, что технологией уже можно воспользоваться на YouTube.

Ранее сообщалось о том, что «Яндекс» внедрил многоголосый закадровый перевод видео и возможность синхронного перевода прямых трансляций.

В переводе видео принимают участие сразу четыре нейросети. Одна из них распознаёт речь с последующим преобразованием в текстовый формат, ещё одна идентифицирует пол говорящего по биометрическим данным, третья определяет, в каких местах необходимо расставлять знаки препинания и выделить смысловые фрагменты. Наконец, четвёртая переводит текст.

Meta✴ запустила ИИ-сервис Animated Drawing, который заставляет рисунки двигаться

Компания Meta Platforms сделала общедоступным сервис Animated Drawing, с помощью которого любой желающий может вдохнуть жизнь в свои рисунки. Данный инструмент построен на основе нейросетей и предназначен для того, чтобы превращать рисунки в анимированные изображения.

 Источник изображения: ***

Источник изображения: Meta

Первоначальная версия Animated Drawing была запущена командой разработчиков Fundamental AI Research в 2021 году. Теперь же проект с открытым исходным кодом продолжает развиваться, и в Meta считают, что сторонние разработчики помогут ускорить этот процесс. На данном этапе сервис способен генерировать разные анимации на основе исходного изображения, загруженного пользователем.

Для начала взаимодействия с Animated Drawing достаточно на стартовой странице сервиса загрузить собственный рисунок, на котором изображён какой-либо персонаж. Далее пользователю будет предложено изменить размер окна захвата изображения, а после обработки снимка можно скорректировать получившийся результат для достижения лучшего результата. В конечном итоге пользователь увидит анимированную версию своего персонажа, а также сможет выбирать разные варианты анимации, сгруппированные по нескольким категориям.

В работе Animated Drawing используются алгоритмы обнаружения объектов, оценки позы, сегментации на основе обработки изображений. В дополнение к этому используются традиционные методы компьютерной графики в процессе анимации. За несколько месяцев с момента запуска демо-версии сервиса Meta получила разрешение пользователей на использование более 1,6 млн изображений для обучения алгоритма.

Bloomberg создало свою нейросеть типа GPT, которая разбирается в финансах

Информационное агентство Bloomberg создало нейросеть BloombergGPT, которая способна отвечать на вопросы, связанные с финансами и бизнесом — основными темами данного издания. Новая технология способна писать заголовки на основе аннотаций и подсказывать журналистам, финансистам и другим заинтересованным лицам необходимую информацию.

 Источник изображения: Bloomberg

Источник изображения: Bloomberg

Агентство Bloomberg создало свою модель искусственного интеллекта на той же базовой технологией, что и GPT от OpenAI. Технология Bloomberg натренирована на большом количестве финансовых документов, собранных информагентством за последние 20 лет, которые включают в себя документы о ценных бумагах, пресс-релизы, новости и публикации других изданий. Примерно 50 % информации, содержащейся в нейросети от Bloomberg, было взято из GitHub, «Википедии» и субтитров YouTube.

Создавать чат-бота для конкуренции с ChatGPT агентство не планирует. На данный момент Bloomberg хочет расширить функциональность своего сервиса Terminal для изучения и анализа финансового рынка благодаря возможностям модели искусственного интеллекта.

window-new
Soft
Hard
Тренды 🔥
World of Goo 2 выйдет в Steam с меню настроек и новыми уровнями для самых хардкорных игроков — трейлер и дата релиза 3 мин.
«До чего же круто это выглядит»: взрывной геймплейный трейлер Into the Fire от создателей The Invincible впечатлил игроков 4 мин.
Microsoft наконец начала готовиться к запуску скандальной ИИ-функции Recall 2 ч.
Разработчики Mafia: The Old Country случайно «слили» дату выхода игры — утечка произошла в Steam 2 ч.
OpenAI готовится запустить ИИ-модель GPT-4.1, но возможны задержки 7 ч.
Исследование Microsoft показало, что ИИ пока «так себе» исправляет ошибки в программном коде 7 ч.
OpenAI прокачала память ChatGPT, чтобы бот мог ссылаться на прошлые диалоги 12 ч.
«То, что я ждал от The Movies 2»: голливудская стратегия Hollywood Animal от авторов This is the Police вышла в прокат раннего доступа Steam 13 ч.
Масштабное дополнение к Katana Zero вернулось из небытия с новым трейлером — оно всё ещё бесплатное и почти готово 14 ч.
В графическом онлайн-редакторе Canva появился ИИ для генерации изображений и создания приложений 14 ч.
Китай поднял пошлины на американские товары до 125 % и пообещал на этом остановиться 2 мин.
NERPA представила универсальные высокопроизводительные серверы NORD D5720 18 мин.
Tesla остановила приём заказов на дорогие модели в Китае и Японии, а в США её электромобили хлынули на вторичный рынок 40 мин.
NTT представила ИИ-чип для обработки видео на периферии 2 ч.
Нейтрино экспериментально ограничили по массе — неуловимая частица близка к раскрытию секретов Вселенной 2 ч.
Samsung опровергла слухи о прекращении выпуска чипов для китайских компаний 3 ч.
Конец «зелёной повестки»: Трамп поддержал угольный сектор в США ради удовлетворения спроса ИИ ЦОД на энергию 4 ч.
Tesla начала предлагать заднеприводный пикап Cybertruck, но он оказался дороже обещанного 4 ч.
Нынешний глава Intel вложил сотни миллионов долларов в китайские компании, включая конкурирующую SMIC 6 ч.
Новая статья: Обзор Nothing Phone (3a) Pro: самый нескучный смартфон 2025 года 11 ч.