ИИ-стартап Synthesia разработал по-настоящему эмоциональные аватары, которые так и просятся в дипфейки

25.04.2024 20:28, Владимир Чижевский

Заключивший стратегическое партнёрство с Nvidia стартап Synthesia представил четвёртое поколение виртуальных персонажей Expressive Avatars под управлением ИИ-модели Express-1. Предполагается, что они найдут применение в видеопроизводстве как «реалистичные и динамичные цифровые личности, сочетающие лучшие возможности человеческого и искусственного интеллекта».

Источник изображения: Synthesia

Используемая для создания виртуальных персонажей ИИ-модель построена так, чтобы учитывать контекст написанного в сценарии и реалистично отображать соответствующие эмоции на лице аватара. Это заметный прогресс по сравнению с прошлыми поколениями, в которых аватары могли произносить слова совершенно безэмоционально. По словам компании, цифровые персонажи на основе новой модели «используют правильные интонации, язык тела, синхронизированную с движениями губ речь, и в целом выглядят как живые актёры».

Важнейшее отличие нового поколения ИИ-аватаров в том, что они больше не полагаются на заранее прописанную динамику — результаты генерируются на лету. Synthesia утверждает, что ИИ-модель «может генерировать совершенно новые и уникальные выступления с огромным разнообразием отображаемых эмоций и взаимодействий». В случае неудачи можно легко повторить попытку и получить другой результат.

Компания при этом признаёт, что её технологией могут воспользоваться злоумышленники, поэтому «исследует способы раннего обнаружения злонамеренных действий, расширяет команды разработчиков средств безопасности ИИ и экспериментирует с технологиями обнаружения ИИ-контента, такими как C2PA».