ИИ-стартап Synthesia разработал по-настоящему эмоциональные аватары, которые так и просятся в дипфейки
Читать в полной версииЗаключивший стратегическое партнёрство с Nvidia стартап Synthesia представил четвёртое поколение виртуальных персонажей Expressive Avatars под управлением ИИ-модели Express-1. Предполагается, что они найдут применение в видеопроизводстве как «реалистичные и динамичные цифровые личности, сочетающие лучшие возможности человеческого и искусственного интеллекта».
Используемая для создания виртуальных персонажей ИИ-модель построена так, чтобы учитывать контекст написанного в сценарии и реалистично отображать соответствующие эмоции на лице аватара. Это заметный прогресс по сравнению с прошлыми поколениями, в которых аватары могли произносить слова совершенно безэмоционально. По словам компании, цифровые персонажи на основе новой модели «используют правильные интонации, язык тела, синхронизированную с движениями губ речь, и в целом выглядят как живые актёры».
Важнейшее отличие нового поколения ИИ-аватаров в том, что они больше не полагаются на заранее прописанную динамику — результаты генерируются на лету. Synthesia утверждает, что ИИ-модель «может генерировать совершенно новые и уникальные выступления с огромным разнообразием отображаемых эмоций и взаимодействий». В случае неудачи можно легко повторить попытку и получить другой результат.
Компания при этом признаёт, что её технологией могут воспользоваться злоумышленники, поэтому «исследует способы раннего обнаружения злонамеренных действий, расширяет команды разработчиков средств безопасности ИИ и экспериментирует с технологиями обнаружения ИИ-контента, такими как C2PA».