реклама
Новости Software

OpenAI представила ИИ-генератор видео Sora, который выдаёт впечатляющие результаты

OpenAI представила новую нейросеть Sora для генерации видео. Компания утверждает, что Sora «может создавать реалистичные и фантазийные сцены по текстовым инструкциям». Модель преобразования текста в видео позволяет пользователям создавать на базе текстовых описаний фотореалистичные видео длиной до минуты с разрешением Full HD (1920 × 1080 точек).

 Источник изображения: OpenAI

Источник изображения: OpenAI

Sora способна создавать «сложные сцены с несколькими персонажами, определенными типами движения и точной детализацией объекта и фона», говорится в блоге OpenAI. Компания также отмечает, что нейросеть может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции».

Модель может генерировать видео на основе неподвижного изображения, заполнять недостающие кадры в существующем видео или расширять его. Среди демонстрационных роликов, созданных с помощью Sora и показанных в блоге OpenAI, сцена Калифорнии времен золотой лихорадки, видео, снятое как будто изнутри токийского поезда, и другие. Многие из них имеют некоторые артефакты, указывающие на работу искусственного интеллекта. Например, подозрительно движущийся пол в видеоролике о музее. Сама OpenAI говорит, что модель «может испытывать трудности с точным моделированием физики сложной сцены», но в целом результаты довольно впечатляющие.

Пару лет назад именно генераторы текста в изображение, такие как Midjourney, лучше всего демонстрировали способности ИИ превращать слова в изображения. Но в последнее время генеративное видео стало улучшаться заметными темпами: такие компании, как Runway и Pika, продемонстрировали впечатляющие модели преобразования текста в видео, а Lumiere от Google, похоже, станет одним из главных конкурентов OpenAI в этой области. Как и Sora, Lumiere предоставляет пользователям инструменты для преобразования текста в видео, а также позволяет создавать видео из неподвижного изображения.

В настоящее время Sora доступна только отдельным тестировщикам, которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также предлагает доступ по запросу отдельным художникам, дизайнерам и кинематографистам, чтобы получить обратную связь. Компания отмечает, что существующая модель может неточно имитировать физику сложной сцены и неправильно интерпретировать некоторые случаи причинно-следственных связей.

Ранее в этом месяце OpenAI объявила, что добавляет маркировку в свой инструмент преобразования текста в изображение DALL-E 3, но отмечает, что их можно легко удалить. Как и в случае с другими продуктами на базе ИИ, компании OpenAI придется бороться с последствиями того, что поддельные фотореалистичные видео, созданные ИИ, будут выдавать за настоящие.

Больше видео, сгенерированных Sora, можно найти здесь.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
OpenAI обновила интерфейс ChatGPT — теперь это чёрная дыра 4 ч.
В описании первого трейлера Assassin’s Creed Codename: Red засветилась дата выхода игры — она получила название Assassin’s Creed Shadows 11 ч.
Датамайнер нашёл в коде сайта Rockstar рекламу ПК-версии Red Dead Redemption 13 ч.
Календарь релизов — 13–19 мая: Homeworld 3, Men of War II и Ghost of Tsushima на ПК 13 ч.
Забытая демоверсия классической Fallout снова привлекла внимание фанатов из-за контента, которого нет в полной игре 13 ч.
MaxPatrol EDR получил сертификат соответствия ФСТЭК России 15 ч.
The Rogue Prince of Persia получила новую дату выхода, а разработчики подготовились к неожиданному релизу Hollow Knight: Silksong 15 ч.
Военная стратегия Men of War II потребует постоянное подключение к интернету, но у разработчиков есть план 17 ч.
Steam и Epic Games Store начали выдавать автоматический возврат средств предзаказавшим Ghost of Tsushima в странах без доступа к PSN 19 ч.
ЕС обвинил Microsoft в монополизме из-за приложения Teams 19 ч.
Google выпустит комплекс 3D-видеосвязи Project Starline в 2025 году 17 мин.
К 2027 году Китай будет контролировать до 45 % всех мощностей по выпуску чипов с использованием зрелой литографии 22 мин.
У VR-гарнитур Meta Quest 2 и Quest 3 появился режим «Путешествие» для использования в транспорте 2 ч.
Власти рекомендовали китайским техногигантам отдавать предпочтение ускорителям вычислений местной разработки 2 ч.
Apple и Google начали борьбу со слежкой через популярные Bluetooth-трекеры 2 ч.
Apple готовится выпустить Vision Pro на рынки за пределами США 3 ч.
Apple выпустила iOS 17.5 с поддержкой оповещений о наличии поблизости устройств слежения 4 ч.
Бизнесом Intel по контрактному производству чипов будет руководить Кевин О’Бакли 4 ч.
Microsoft потратит €4 млрд на ЦОД для ИИ и облаков во Франции, а AWS постарается не отстать 9 ч.
Новая статья: Обзор Ryzen 5 8600G: новый король бюджетных сборок (нет) 9 ч.