реклама
Теги → imagen

Google анонсировала свой самый мощный ИИ-генератор изображений Imagen 3

В рамках проходящей в эти дни в Маунтин-Вью конференции Google I/O состоялся анонс новой версии генеративной нейросети семейства Imagen. Речь идёт об алгоритме Imagen 3 — самом продвинутом генераторе изображений от Google на данный момент.

 Источник изображения: Google

Источник изображения: Google

Глава исследовательского ИИ-подразделения Google Deep Mind Демис Хассабис (Demis Hassabis) во время презентации заявил, что Imagen 3 более точно понимает тестовые запросы, на основе которых он создаёт изображения, чем модель Imagen 2. Он отметил, что алгоритм работает более «креативно и детализировано», а также реже ошибается и создаёт меньше «отвлекающих артефактов».

Вместе с этим Google попыталась развеять опасения по поводу того, что Imagen 3 будет использоваться для создания дипфейков. В процессе генерации изображений будет задействована технология SynthID, посредством которой на медиафайлы наносятся невидимые криптографические водяные знаки. Предполагается, что такой подход сделает бесполезными попытки использовать ИИ-генератор Google для создания фейкового контента.

Частные пользователи могут оформить подписку на Imagen 3 через сервис Google ImageFX. Разработчики и корпоративные клиенты получат доступ к ИИ-генератору через платформу машинного обучения Vertex AI. Как и в прошлом, в этот раз Google не поделилась подробностями касательно того, какие данные использовались для обучения нового алгоритма.

ИИ-генератор Google Imagen 2 научился создавать 4-секундные анимированные изображения

Google сообщила, что генератор изображений Imagen 2 получил с очередным обновлением возможность создавать анимированные 4-секундные ролики. Модель также научилась по текстовым запросам редактировать готовые изображения, добавляя на них новые объекты или убирая их; а все новые картинки помечаются невидимыми цифровыми водяными знаками.

 Источник изображения: deepmind.google

Источник изображения: deepmind.google

На мероприятии Google Cloud Next разработчик сообщил, что Imagen 2 теперь генерирует 4-секундные анимированные ролики с разрешением 360 × 640 пикселей и частотой 24 кадра в секунду. Google также пообещала в этом направлении «постоянные усовершенствования». «Если взглянуть, вместо картинки объекта, например, статического изображения автомобиля, можно увидеть короткий ролик, например, движущейся машины. Многим организациям, особенно в таких областях как СМИ и реклама, это интересно, потому что это улучшает взаимодействие с пользователем», — пояснил гендиректор Google Cloud Томас Куриан (Thomas Kurian).

Генератор Imagen 2 создаёт изображения, используя различные ракурсы и движения камеры, «при этом сохраняя согласованность всей последовательности». Модель предлагает фильтры безопасности, которые предотвращают создание недопустимых материалов, и цифровые водяные знаки SynthID, позволяющие отслеживать созданные ИИ произведения. Imagen 2 также научился редактировать изображения, добавляя или удаляя элементы по текстовому запросу, и расширять границы изображения для увеличения обзора. Все эти возможности доступны на облачной платформе Vertex AI.

В популярных материалах для обучения нейросетей нашли изображения сексуального насилия над детьми

Исследователи из Стэнфорда обнаружили, что популярный набор данных LAION-5B, используемый для обучения моделей генеративного искусственного интеллекта, и применявшийся для Stable Diffusion и Google Imagen, включает в себя сотни ссылок на материалы сексуального насилия над детьми (Child Sexual Abuse Material — CSAM). Установлено, что LAION-5B включал по меньшей мере 1679 нелегальных изображений, взятых из постов в социальных сетях и популярных сайтов для взрослых.

 Источник изображения: LAION

Источник изображения: LAION

Исследователи начали изучение набора данных LAION в сентябре 2023 года, стремясь выяснить, используются ли там материалы с сексуальным насилием над детьми. С этой целью хеши или идентификаторы изображений отправлялись на платформы обнаружения CSAM, такие как PhotoDNA, и в Канадский центр защиты детей.

Исследователи из Стэнфорда отметили, что наличие CSAM в наборе данных для обучения ИИ не обязательно негативно повлияет на результаты обученных моделей. Тем не менее, всегда есть вероятность, что модель использует что-то из незаконных материалов при генерации изображений. «Наличие повторяющихся идентичных случаев CSAM также является проблематичным, особенно из-за увеличения вероятности получения изображений конкретных жертв», — говорится в отчёте.

LAION, некоммерческая организация, которая управляет набором данных, сообщила, что придерживается политики «нулевой терпимости» к вредоносному контенту и временно удалит наборы данных из Сети. Согласно сайту LAION, набор данных не является непосредственно репозиторием изображений. Он представляет собой результат индексирования ресурсов интернета и содержит ссылки на изображения и замещающий текст.

Stability AI сообщила, что внутренние правила компании запрещают неправомерное использование её платформ. Компания утверждает, что при обучении своих моделей на наборе данных LAION-5B, она использовала лишь часть материалов, которые отбирались в том числе и с учётом безопасности.

Эксперты полагают, что будет сложно полностью удалить проблемный контент из моделей ИИ, обученных на нём. Они рекомендуют подождать, чтобы модели, обученные на LAION-5B, такие как Stable Diffusion 1.5, «устарели, а распространение прекратилось там, где это возможно». Google выпустила новую версию Imagen, но не раскрыла, на каком наборе данных она обучалась.

Генеральные прокуроры США призвали Конгресс создать комитет для расследования влияния ИИ на эксплуатацию детей и запретить создание CSAM, генерируемого ИИ.

Google откроет доступ к своей нейросети Imagen для генерации картинок по описанию, но с ограничениями

Компания Google не спешит делать общедоступной свою новую нейросеть Imagen, которая позволяет создавать изображения по текстовому описанию, несмотря на то, что она работает не хуже аналогов, таких как DALL-E 2 от OpenAI или Stability от Stable Diffusion. Однако теперь Imagen станет доступна ограниченному числу пользователей приложения AI Test Kitchen, за счёт чего компания рассчитывает получить отзывы о работе нейросети.

 Источник изображений: Google

Источник изображений: Google

Напомним, Google запустила приложение AI Test Kitchen в начале этого года, чтобы с его помощью тестировать разные алгоритмы на базе нейросетей. В настоящее время пользователи приложения могут взаимодействовать с продвинутым чатботом, который построен на базе языковой модели LaMDA 2. В скором времени разработчики откроют доступ к Imagen, благодаря чему пользователи AI Test Kitchen смогут генерировать изображения по текстовому описанию.

Согласно имеющимся данным, Google предоставит два режима взаимодействия с нейросетью Imagen. Первый носит название City Dreamer и позволяет сгенерировать элементы города, созданного на выбранную пользователем тему. Исходя из заданной темы, Imagen воссоздаст здания, городские кварталы, аэропорты и другие объекты в виде изометрических моделей, подобных тем, что можно увидеть в игре SimCity.

В режиме Wobble пользователю предложат создать забавного монстра. Нужно выбрать из чего он состоит, например, из резины или глины, в затем придумать для него одежду. Imagen сформирует виртуального монстра по описанию пользователя и даст ему имя, после чего с ним можно будет взаимодействовать, заставляя танцевать.

Источник отмечает, что в нынешнем виде варианты взаимодействия с алгоритмом Imagen сильно ограничены, что особенно заметно на фоне некоторых других аналогов. Пользователи не смогут создавать какие угодно изображения. Однако сейчас цель Google в том, чтобы собрать первые отзывы о работе системы и том, каким образом пользователи её задействуют. Google также не раскрывает количество пользователей приложения AI Test Kitchen и не говорит ничего касательно будущего алгоритма Imagen и его возможной интеграции в какие-то общедоступные продукты компании.

window-new
Soft
Hard
Тренды 🔥
Путин запретил пользоваться услугами в сфере кибербезопасности из недружественных стран с 2025 года 29 мин.
Microsoft задержит выпуск ИИ-функции Recall, которая записывает все действия пользователя 2 ч.
Beyond Good and Evil 20th Anniversary Edition ещё никогда не была так близка к релизу — для переиздания уже выпускают патчи 2 ч.
Президент России запретил ИБ-сервисы и услуги из недружественных стран 3 ч.
В «Рувики» появятся ИИ-алгоритмы уже в этом году 3 ч.
«Самое хардкорное "Диско" со времён Disco»: сотрудники ZA/UM рассказали об отменённой игре во вселенной Disco Elysium, которая могла спасти студию 3 ч.
AWS выделит $230 млн на поддержку стартапов в области генеративного ИИ, но деньги они вряд ли увидят 4 ч.
Акции Adobe взлетели на 17 % на фоне успешного квартального отчёта 5 ч.
Глава FromSoftware: Bloodborne заслуживает выйти на ПК 5 ч.
Инсайдер уточнил, когда выйдут Fable и Gears of War: E-Day 6 ч.
Спрос на ЦОД в Азиатско-Тихоокеанском регионе значительно превышает предложение 33 мин.
Суд взыскал с производителя электроники «Ангстрем» более €1 млрд в пользу «ВЭБ.РФ» 40 мин.
Глобальный рынок смартфонов столкнулся с перенасыщением 46 мин.
«Ростех» разработал компактный модуль Com Express Type 6 Compact на процессоре «Эльбрус-2С3» 2 ч.
«Ростех» представил самый маленький компьютер на «Эльбрусе» — как два Raspberry Pi 3 ч.
AWS, но в космосе: Phantom Space и Assured Space Access создадут космическое облако Phantom Cloud 3 ч.
MSI представила корпус MAG PANO 100 PZ с панорамным обзором и поддержкой плат с тыльными разъёмами 3 ч.
Срок эксплуатации суперкомпьютеров растёт, несмотря на прекращение поддержки оборудования 3 ч.
Tesla устроит на свои заводы более 1000 роботов-гуманоидов Optimus в следующем году, пообещал Илон Маск 4 ч.
Western Digital создала самый ёмкий в мире кристалл 3D QLC NAND — на 2 Тбит 5 ч.