реклама
Новости Software

ИИ-модель DragGAN способна поворачивать головы и менять позы людей и животных на фото, словно в 3D

Исследователи из Института Макса Планка представили ИИ-модель DragGAN, которая позволяет манипулировать изображениями практически в режиме реального времени. Инструмент похож на функцию «Искривление» в Photoshop, но гораздо мощнее, так как пользователь не просто перемещает пиксели, а использует искусственный интеллект для повторного создания базового объекта. Более того он позволяет вращать изображения, как если бы они были в 3D-формате.

 Источник изображения: arxiv.org / Drag Your GAN

Источник изображения: arxiv.org / Drag Your GAN

DragGAN может не только изменять размеры объекта на изображении или превращать улыбку в хмурое выражение лица простым щелчком мыши, но и поворачивать его таким образом, как если бы это была 3D-модель. Например, можно изменить направление лица человека. Приведённые ниже видео взяты с сайта исследовательской группы. Полный текст исследовательской работы можно прочитать на сайте arXiv.

Как отмечает команда разработчиков, то, что действительно интересно в этой работе, это не манипуляция изображениями как таковая, а пользовательский интерфейс. Мы уже давно можем использовать инструменты ИИ, такие как GANs, для создания реалистичных изображений, но большинству методов не хватает гибкости и точности. Вы можете сказать генератору изображений ИИ: «Сделай изображение льва, наблюдающего за саванной», и получите его, но может оказаться, что лев сидит не совсем в той позе, которая вам нужна.

DragGAN предлагает решение этой проблемы. Интерфейс точно такой же, как и в традиционных редакторах изображений, но вместо того, чтобы просто размазывать существующие пиксели, модель создаёт объект заново. Исследователи пишут: «Наш подход не только может создавать окклюзию объектов, но и может деформировать их в соответствии с жёсткостью, например, при сгибании ноги лошади».

Пока это только демонстрация, которая не даёт оценить технологию полностью, но это ещё один пример того, как сделать манипуляции с изображениями с помощью ИИ более доступными.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Microsoft PC Manager начал настоятельно рекомендовать поисковик Bing 29 мин.
В TikTok появились 60-минутные видео, но загружать их могут не все 47 мин.
Масштабная мегараспродажа Epic Games Store началась с раздачи полного издания Dragon Age: Inquisition 59 мин.
Manor Lords превзошла «самые смелые» ожидания издателя — игра достигла новой вершины продаж 2 ч.
Датамайнер поделился подробностями следующей игры Valve — это героический PvP-шутер в мире фэнтезийного стимпанка 3 ч.
Ubisoft раскрыла стратегию на ближайшее будущее, но Watch Dogs в нём места не нашлось 4 ч.
Fallout 4 оказалась самой продаваемой игрой в Европе за апрель — спустя почти девять лет после релиза 5 ч.
Meta грозят огромные штрафы: ЕС расследует, как обеспечивается безопасность детей в Facebook и Instagram 7 ч.
МТС запустит цифрового ассистента для борьбы с телефонными мошенниками 7 ч.
Низкие доходы от рекламы подорвали темпы роста выручки Baidu 8 ч.
TSMC запустит массовое производство по оптимизированному 3-нм техпроцессу N3P уже в этом году 31 мин.
В Индии испытали напечатанный на 3D-принтере ракетный двигатель 4 ч.
Сверхпрочный смартфон IIIF150 Air2 Ultra получил тонкий корпус, чип Dimensity 7050 и 64-Мп камеру с ночным видением 4 ч.
Чип Apple M4 в iPad Pro протестировали под жидким азотом — на 28 % быстрее M3 Max, но только в одноядерном тесте 4 ч.
«Хаббл» сфотографировал космический невод — линзовидную галактику NGC 4753 5 ч.
Представлен смартфон Meizu 21 Note с чипом Snapdragon 8 Gen 2, Wi-Fi 7 и ценой $360 5 ч.
Fujifilm представила GFX 100S II — среднеформатную беззеркалку с ИИ за $4999 5 ч.
G.Skill представила комплекты памяти Ripjaws M5 RGB со скоростью до 6400 МТ/с и объёмом до 96 Гбайт 6 ч.
Не было бы счастья: квартальная выручка Cisco показала самое большое за 15 лет падение, но акции компании выросли 6 ч.
Renault отказалась внедрять автопилот в автомобили и анонсировала беспилотный электрический микроавтобус miniBus 7 ч.