реклама
Теги → imagen

Google анонсировала свой самый мощный ИИ-генератор изображений Imagen 3

В рамках проходящей в эти дни в Маунтин-Вью конференции Google I/O состоялся анонс новой версии генеративной нейросети семейства Imagen. Речь идёт об алгоритме Imagen 3 — самом продвинутом генераторе изображений от Google на данный момент.

 Источник изображения: Google

Источник изображения: Google

Глава исследовательского ИИ-подразделения Google Deep Mind Демис Хассабис (Demis Hassabis) во время презентации заявил, что Imagen 3 более точно понимает тестовые запросы, на основе которых он создаёт изображения, чем модель Imagen 2. Он отметил, что алгоритм работает более «креативно и детализировано», а также реже ошибается и создаёт меньше «отвлекающих артефактов».

Вместе с этим Google попыталась развеять опасения по поводу того, что Imagen 3 будет использоваться для создания дипфейков. В процессе генерации изображений будет задействована технология SynthID, посредством которой на медиафайлы наносятся невидимые криптографические водяные знаки. Предполагается, что такой подход сделает бесполезными попытки использовать ИИ-генератор Google для создания фейкового контента.

Частные пользователи могут оформить подписку на Imagen 3 через сервис Google ImageFX. Разработчики и корпоративные клиенты получат доступ к ИИ-генератору через платформу машинного обучения Vertex AI. Как и в прошлом, в этот раз Google не поделилась подробностями касательно того, какие данные использовались для обучения нового алгоритма.

ИИ-генератор Google Imagen 2 научился создавать 4-секундные анимированные изображения

Google сообщила, что генератор изображений Imagen 2 получил с очередным обновлением возможность создавать анимированные 4-секундные ролики. Модель также научилась по текстовым запросам редактировать готовые изображения, добавляя на них новые объекты или убирая их; а все новые картинки помечаются невидимыми цифровыми водяными знаками.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

На мероприятии Google Cloud Next разработчик сообщил, что Imagen 2 теперь генерирует 4-секундные анимированные ролики с разрешением 360 × 640 пикселей и частотой 24 кадра в секунду. Google также пообещала в этом направлении «постоянные усовершенствования». «Если взглянуть, вместо картинки объекта, например, статического изображения автомобиля, можно увидеть короткий ролик, например, движущейся машины. Многим организациям, особенно в таких областях как СМИ и реклама, это интересно, потому что это улучшает взаимодействие с пользователем», — пояснил гендиректор Google Cloud Томас Куриан (Thomas Kurian).

Генератор Imagen 2 создаёт изображения, используя различные ракурсы и движения камеры, «при этом сохраняя согласованность всей последовательности». Модель предлагает фильтры безопасности, которые предотвращают создание недопустимых материалов, и цифровые водяные знаки SynthID, позволяющие отслеживать созданные ИИ произведения. Imagen 2 также научился редактировать изображения, добавляя или удаляя элементы по текстовому запросу, и расширять границы изображения для увеличения обзора. Все эти возможности доступны на облачной платформе Vertex AI.

В популярных материалах для обучения нейросетей нашли изображения сексуального насилия над детьми

Исследователи из Стэнфорда обнаружили, что популярный набор данных LAION-5B, используемый для обучения моделей генеративного искусственного интеллекта, и применявшийся для Stable Diffusion и Google Imagen, включает в себя сотни ссылок на материалы сексуального насилия над детьми (Child Sexual Abuse Material — CSAM). Установлено, что LAION-5B включал по меньшей мере 1679 нелегальных изображений, взятых из постов в социальных сетях и популярных сайтов для взрослых.

 Источник изображения: LAION

Источник изображения: LAION

Исследователи начали изучение набора данных LAION в сентябре 2023 года, стремясь выяснить, используются ли там материалы с сексуальным насилием над детьми. С этой целью хеши или идентификаторы изображений отправлялись на платформы обнаружения CSAM, такие как PhotoDNA, и в Канадский центр защиты детей.

Исследователи из Стэнфорда отметили, что наличие CSAM в наборе данных для обучения ИИ не обязательно негативно повлияет на результаты обученных моделей. Тем не менее, всегда есть вероятность, что модель использует что-то из незаконных материалов при генерации изображений. «Наличие повторяющихся идентичных случаев CSAM также является проблематичным, особенно из-за увеличения вероятности получения изображений конкретных жертв», — говорится в отчёте.

LAION, некоммерческая организация, которая управляет набором данных, сообщила, что придерживается политики «нулевой терпимости» к вредоносному контенту и временно удалит наборы данных из Сети. Согласно сайту LAION, набор данных не является непосредственно репозиторием изображений. Он представляет собой результат индексирования ресурсов интернета и содержит ссылки на изображения и замещающий текст.

Stability AI сообщила, что внутренние правила компании запрещают неправомерное использование её платформ. Компания утверждает, что при обучении своих моделей на наборе данных LAION-5B, она использовала лишь часть материалов, которые отбирались в том числе и с учётом безопасности.

Эксперты полагают, что будет сложно полностью удалить проблемный контент из моделей ИИ, обученных на нём. Они рекомендуют подождать, чтобы модели, обученные на LAION-5B, такие как Stable Diffusion 1.5, «устарели, а распространение прекратилось там, где это возможно». Google выпустила новую версию Imagen, но не раскрыла, на каком наборе данных она обучалась.

Генеральные прокуроры США призвали Конгресс создать комитет для расследования влияния ИИ на эксплуатацию детей и запретить создание CSAM, генерируемого ИИ.

Google откроет доступ к своей нейросети Imagen для генерации картинок по описанию, но с ограничениями

Компания Google не спешит делать общедоступной свою новую нейросеть Imagen, которая позволяет создавать изображения по текстовому описанию, несмотря на то, что она работает не хуже аналогов, таких как DALL-E 2 от OpenAI или Stability от Stable Diffusion. Однако теперь Imagen станет доступна ограниченному числу пользователей приложения AI Test Kitchen, за счёт чего компания рассчитывает получить отзывы о работе нейросети.

 Источник изображений: Google

Источник изображений: Google

Напомним, Google запустила приложение AI Test Kitchen в начале этого года, чтобы с его помощью тестировать разные алгоритмы на базе нейросетей. В настоящее время пользователи приложения могут взаимодействовать с продвинутым чатботом, который построен на базе языковой модели LaMDA 2. В скором времени разработчики откроют доступ к Imagen, благодаря чему пользователи AI Test Kitchen смогут генерировать изображения по текстовому описанию.

Согласно имеющимся данным, Google предоставит два режима взаимодействия с нейросетью Imagen. Первый носит название City Dreamer и позволяет сгенерировать элементы города, созданного на выбранную пользователем тему. Исходя из заданной темы, Imagen воссоздаст здания, городские кварталы, аэропорты и другие объекты в виде изометрических моделей, подобных тем, что можно увидеть в игре SimCity.

В режиме Wobble пользователю предложат создать забавного монстра. Нужно выбрать из чего он состоит, например, из резины или глины, в затем придумать для него одежду. Imagen сформирует виртуального монстра по описанию пользователя и даст ему имя, после чего с ним можно будет взаимодействовать, заставляя танцевать.

Источник отмечает, что в нынешнем виде варианты взаимодействия с алгоритмом Imagen сильно ограничены, что особенно заметно на фоне некоторых других аналогов. Пользователи не смогут создавать какие угодно изображения. Однако сейчас цель Google в том, чтобы собрать первые отзывы о работе системы и том, каким образом пользователи её задействуют. Google также не раскрывает количество пользователей приложения AI Test Kitchen и не говорит ничего касательно будущего алгоритма Imagen и его возможной интеграции в какие-то общедоступные продукты компании.

window-new
Soft
Hard
Тренды 🔥
Электромобильный стартап Fisker объявил о банкротстве — поставки машин он начал всего год назад 20 мин.
Представлена плёночная полуформатная камера Pentax 17 в стиле «ретро» за $500 27 мин.
NASA сфотографировало китайский посадочный модуль «Чанъэ-6» на обратной стороне Луны 2 ч.
Motorola подтвердила скорый анонс раскладушек нового поколения — Razr 50 выйдут 25 июня 2 ч.
Спутник-инспектор космического мусора Astroscale нашёл отработанную ступень ракеты 2 ч.
Анонсирован аксессуар SwitchLens, который превратит любой смартфон в камеру Micro 4/3 4 ч.
Tesla подала иск на $1 млрд к поставщику за незаконное использование ноу-хау, связанных с производством батарей 4 ч.
Canon создала покрытие, которое вдвое повысит долговечность солнечных панелей 4 ч.
В подмосковной Дубне начали строительство 8-МВт ЦОД 4 ч.
Квантовые вычисления в массы: D-Wave представила гибридную систему, которую смогут использовать даже неспециалисты 4 ч.