Сегодня 09 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Runway AI создала ИИ для генерации видео по текстовому описанию, но у него «иногда машины могут улететь»

Разработчики генеративных нейросетей добились значительного успеха в создании статических изображений, подтверждением чему служат набравшие популярность модели, такие как Dall-E и Stable Diffusion. Теперь же стартап Runway AI представил нейросеть, способную генерировать по текстовому описанию короткие видеоролики.

 Источник изображения: Runway AI

Источник изображения: Runway AI

Генеративная нейросеть Gen 2 от Runway AI способна создавать короткие видео, опираясь на текстовое описание всего из нескольких слов. Достаточно написать, например, «кошка, идущая под дождём», после чего ИИ-алгоритм сгенерирует 3-секундное видео, демонстрирующее именно это или что-то очень похожее. В дополнение к этому пользователь может загрузить изображение, которое станет для алгоритма своеобразной подсказкой.

Сейчас нейросеть Runway AI доступна не всем. На данном этапе желающим испытать нейросеть в деле необходимо зарегистрироваться на сайте разработчиков и добавить себя в лист ожидания. Отметим, что Runway AI занимается разработкой инструментов на основе искусственного интеллекта с 2018 года и в прошлом году компания сумела привлечь $50 млн инвестиций. Стартап помогал в разработке оригинальной версии Stable Diffusion, которая способна генерировать изображения по текстовому описанию.

Во время демонстрации возможностей ИИ попросили создать видео «съёмки пустынного пейзажа с дрона». Несколько минут нейросеть обрабатывала запрос, но в конечном счёте ей удалось создать ролик, который соответствует предложенному описанию. Несколько других роликов раскрывают сильные и слабые стороны ИИ-алгоритма. Разработчики отмечают, что модель ещё не до конца «разобралась», как более точно изображать движущиеся объекты. «Вы можете сгенерировать автомобильную погоню, но иногда машины могут улететь», — отметили в Runway AI.

Также Gen 2 способна менять уже готовые видео, накладывая маски, добавлять стилизацию или даже полностью перестраивая картинку. Например, с помощью масок получились заменить на видео лабрадора на далматинца. Также ИИ смог превратить несколько поставленных на ребро блокнотов в ночной мегаполис. Либо из очень упрощенной 3D-модели сделать почти что кинематографическую картинку. Ещё ИИ способен анимировать фотографии.

Представленный алгоритм Gen 2 является логическим продолжением созданной ранее нейросети Gen 1. Тестирование алгоритма с привлечением небольшого числа пользователей началось в феврале. В настоящее время к этому процессу привлечены тысячи пользователей. Согласно имеющимся данным, в разработчики изучают возможность добавления к генерируемым видео звука, поскольку на данном этапе ИИ-алгоритм создаёт видео без звука.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Capcom уже седьмой год подряд бьёт рекорды продаж — на этот раз благодаря ремейку Resident Evil 4, Street Fighter 6 и Dragon’s Dogma 2 29 мин.
Стартап в сфере облачной безопасности Wiz привлёк $1 млрд, получив оценку в $12 млрд 39 мин.
Минцифры РФ на законодательном уровне определит понятия IaaS и SaaS 43 мин.
«Самая жуткая реклама Apple»: ролик о новом iPad Pro взбесил и огорчил пользователей 50 мин.
OpenAI представила основные правила поведения для ИИ-моделей 60 мин.
Игроки нашли остроумный способ отомстить Филу Спенсеру за закрытие студий Bethesda — ядерный удар по его лагерю в Fallout 76 2 ч.
Disney и Warner Bros. запустят общую подписку на стриминговые сервисы Disney Plus, Hulu и Max 3 ч.
Google представила мощную нейросеть AlphaFold 3 для предсказания структуры белков — её может опробовать каждый 3 ч.
Ирония судьбы: Microsoft нуждается в играх вроде Hi-Fi Rush и не уверена насчёт Call of Duty в Game Pass 3 ч.
Microsoft лишила игроков новой Dishonored и Hi-Fi Rush 2, закрыв Arkane Austin и Tango Gameworks 5 ч.
Sharp представила неубиваемые смартфоны Aquos R9 и Aquos Wise4 с минималистичным дизайном 6 мин.
Nvidia стала крупнейшим разработчиком чипов в мире по объёму выручки 42 мин.
Ippon представила однофазные ИБП серии Novus мощностью до 10 кВт 2 ч.
Военные США начали тестировать робопсов, оснащённых стрелковым оружием 2 ч.
Против «дочки» HPE в России поданы новые иски на десятки миллионов рублей 2 ч.
Samsung всего за год стала крупнейшим производителем OLED-мониторов в мире 3 ч.
Sabrent выпустила компактный SSD Rocket Nano 2242 Gen4 для портативных игровых консолей, ноутбуков и ПК 3 ч.
Зонд «Чанъэ-6» для первого в истории забора грунта с обратной стороны Луны вышел на орбиту спутника 5 ч.
Внутри смартфона Huawei Pura 70 Pro нашли больше китайский компонентов — и даже флеш-память с контроллером HiSilicon 6 ч.
Следствие подозревает Tesla в обмане инвесторов, манипуляциях с ценными бумагами и подлоге данных о FSD 6 ч.