реклама
Новости Software

Microsoft показала нейросеть, которая делает говорящие что угодно дипфейки по одному фото

За последние пару лет генеративные нейросети преодолели важный этап развития, став более мощными и способными создавать по текстовому описанию не только изображения, но и видео. Новый алгоритм VASA-1 от Microsoft, вероятно, сумеет удивить многих, поскольку для его работы вообще не нужно описание. Достаточно предоставить одно изображение человека и аудиодорожку, на основе которых нейросеть сгенерирует видео говорящего человека с широким спектром эмоций и естественной мимикой.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Результат работы VASA-1 выглядит очень естественно и правдоподобно. Всего из одного снимка лица и записи голоса алгоритм создаёт реалистичное видео, на котором запечатлённый на снимке человек буквально «оживает», а его мимика, движения губ и головы выглядят вполне натурально. Поскольку созданные с помощью VASA-1 видео с ходу сложно отличить от реальных, уже высказываются опасения по поводу того, что алгоритм может использоваться злоумышленниками для создания фейков.

Что касается самой нейросети, то главным её отличием от других подобных алгоритмов является наличие целостной модели генерации лицевой мимики и движений головы. Специалисты Microsoft провели обширную исследовательскую работу, включая оценку ряда новых метрик. В результате они установили, что новый алгоритм значительно превосходит представленные ранее аналоги по многим параметрам.

«Наш метод не только обеспечивает генерацию видео высокого качества с реалистичной мимикой лица и движениями головы, но также поддерживает функцию онлайн-генерации видео 512×512 точек с частотой 40 кадров в секунду с незначительной начальной задержкой. Это открывает путь к взаимодействию в реальном времени с реалистичными аватарами, имитирующими поведение человека во время разговора», — говорится в сообщении Microsoft.

Другими словами, нейросеть может создавать качественные фейковые видео на основе всего одного изображения. Поэтому не удивительно, что Microsoft называет VASA-1 «исследовательской демонстрацией» и не планирует выводить его на коммерческий рынок, по крайней мере, в ближайшее время.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...
window-new
Soft
Hard
Тренды 🔥
Для Starfield вышел крупнейший патч с релиза — стабильных 60 кадров/с на Xbox Series X нет 39 мин.
В iOS 18 появится управление взглядом и защита от укачивания 2 ч.
Ubisoft отменила The Division: Heartland ради более перспективных игр вроде XDefiant 2 ч.
В Android появится ИИ-защита от кражи — смартфон заблокируется, если его кто-то схватит и убежит 3 ч.
МТС запустила открытое бета-тестирование метавселенной МТС Verse 4 ч.
«С чем они никогда не портачат, так это трейлеры»: Assassin’s Creed Shadows наконец вышла из тени 4 ч.
Tango Gameworks попрощалась с игроками, а для Hi-Fi Rush вышел последний патч 5 ч.
Сооснователь Instagram Майк Кригер стал директором по продуктам в ИИ-стартапе Anthropic 6 ч.
Солнечный Souls-экшен в мире итальянских легенд Enotria: The Last Song всё-таки выйдет на Xbox — новая дата релиза, обширное демо и 15 минут геймплея 6 ч.
Google разберётся с OpenAI за использование YouTube для обучения ИИ 7 ч.
Новая статья: Обзор смартфона vivo X100 Pro: хищник в засаде 21 мин.
Intel переизобрела локальную сеть: два ПК теперь можно соединить через Thunderbolt 4 или 5 26 мин.
Китайские учёные создали прозрачный бамбук — огнеупорную и водонепроницаемую альтернативу стеклу 2 ч.
Учёные создали недорогой и нетоксичный аккумулятор, который сохранит 80 % ёмкости после 8000 циклов перезарядки 2 ч.
«Охотники за привидениями» в реальной жизни: британская полиция получит оружие против преступников на электросамокатах 4 ч.
Lenovo выпустила компактную мобильную рабочую станцию ThinkPad P14s Gen 5 на Ryzen Pro 8040HS 6 ч.
Nvidia подняла зарплату гендиректору Дженсену Хуангу на 60 % до $34 млн за год 8 ч.
Selectel увеличила в I квартале чистую прибыль в полтора раза 9 ч.
Tile выпустит Bluetooth-трекеры с подключением к спутникам — они будут гораздо лучше Apple AirTag 9 ч.
Проблемы с контактами у имплантов Neuralink наблюдались ещё во время экспериментов с животными 9 ч.