реклама
Новости Software

Google DeepMind представила ИИ-генератор видео Veo 2, который создаёт двухминутные ролики в 4K

Подразделение Google DeepMind представило Veo 2 — основанный на искусственном интеллекте генератор видео нового поколения. Он создаёт видеоролики в разрешении 4K (4096 × 2160 пикселей) продолжительностью до двух минут. Таким образом, он в 4 раза превосходит OpenAI Sora по разрешению и в 6 раз — по продолжительности видео.

 Источник изображений: Google DeepMind

Источник изображений: Google DeepMind

На данный момент это преимущество, однако, носит лишь теоретический характер: испробовать Veo 2 можно лишь на экспериментальной площадке VideoFX, где разрешение ограничено 720p, а длина видео — 8 секундами. Для сравнения, доступная для пользователей версия генератора OpenAI Sora предлагает 1080p и 20 секунд. Чтобы начать работу с VideoFX, придётся записаться в список ожидания, хотя Google пообещала на этой неделе расширить аудиторию. В перспективе Veo 2 появится на платформе для бизнес-пользователей Vertex AI, но точные сроки в Google не указали.

Veo 2, как и её предшественница, генерирует видео по текстовым подсказкам, которые можно сопровождать изображениями. По сравнению с Veo первого поколения, новая модель лучше «понимает» физику, изображение отличается повышенной чёткостью, усовершенствованы механизмы движения виртуальной камеры. Veo 2 более реалистично моделирует движение (например, изображает наливаемый в кружку кофе) и свойства света (тени и отражения); правдоподобно имитируются разные линзы на виртуальной камере и кинематографические эффекты.

Разработчик также уверяет, что у новой модели с меньшей вероятностью проявляются галлюцинации: дополнительные пальцы или «неожиданные объекты»; при этом, как показала практика, от эффекта «зловещей долины» избавиться не удалось. А на видео с движущимся автомобилем дорога при ближайшем рассмотрении оказывается чрезвычайно гладкой, пешеходы сливаются друг с другом, а некоторые фасады домов имеют вид, который противоречит законам физики.

Новый генератор видео был обучен на большом числе роликов; в DeepMind не уточнили, какие источники для этого использовались, но одним из них, вероятно, является принадлежащая Google платформа YouTube. Чтобы снизить риск возникновения дипфейков, в Veo 2 встроили систему SynthID — невидимую маркировку генерируемых моделью видео.

В DeepMind также сообщили, что улучшили работу генератора статических изображений Imagen 3 — созданные с его помощью картинки стали более яркими, детализированными, а сама модель теперь более точно следует запросам пользователя. В пользовательском интерфейсе ImageFX, где доступен генератор изображений, появились выпадающие списки, которые появляются прямо в поле запроса и помогают добиться более точного результата.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
МТС выделит облачные сервисы, ИИ-технологии и большие данные в самостоятельную компанию 13 мин.
Вместе с Apple Intelligence на старые iPhone пришёл перегрев 22 мин.
Участники рынка выступили за доработку законопроекта по регулированию индустрии игр в России, а в Минцифры подготовили альтернативный акт 3 ч.
Американские военные проверят Маска на предмет угроз нацбезопасности 3 ч.
45 тонн пауков из WoW, более 1,7 триллиона демонов в Diablo IV и другие итоги 2024 года для Blizzard 4 ч.
Анимационный сериал Secret Level от авторов «Любовь, смерть и роботы» установил рекорд для Prime Video и уже заслужил продолжение 5 ч.
Аналогам — нет: Минцифры РФ ужесточит требования для включения софта в реестр отечественного ПО 16 ч.
Консольные эксклюзивы Xbox уйдут в прошлое — Microsoft переосмысливает, «что значит быть фанатом Xbox» 18 ч.
«Эта игра нужна мне вчера, сегодня и завтра»: первый геймплейный трейлер ролевого экшена Exodus в духе Mass Effect привёл фанатов в восторг 19 ч.
«По-настоящему незабываемый опыт»: CD Projekt Red в честь 10-летия The Witcher 3: Wild Hunt устроит концертный тур с музыкой из игры 20 ч.
МТС соберёт все свои IT-подразделения в самостоятельную компанию 11 мин.
Чёрные дыры оказались безопаснее, чем считали учёные — рядом с ними могут стабильно «жить» звёзды и планеты 23 мин.
Microsoft купила как минимум вдвое больше ускорителей NVIDIA, чем любой из конкурентов 28 мин.
Huawei обогнала Apple и стала крупнейшим в мире поставщиком носимой на запястье электроники 43 мин.
За первые три квартала 2024 года инвестиции в ИИ достигли $89 млрд, но прибыль венчурных инвесторов оставляет желать лучшего 2 ч.
Индонезия предложила Илону Маску разместить в стране дата-центры xAI 3 ч.
SpaceX разрешили запустить Starship в седьмой раз, но пока неизвестно когда 3 ч.
Verne планирует построить в Финляндии кампус ЦОД на 70+ МВт 3 ч.
Застрявшим в космосе астронавтам NASA продлили срок пребывания на станции 4 ч.
Seagate начала продажи первых в мире HDD с технологией HAMR — дисков Exos M на 32 Тбайт 4 ч.