реклама
Теги → изображение
Быстрый переход

Google так и не решила проблемы с расовой инклюзивностью у генератора изображений Gemini

В феврале Google приостановила работу основанного на искусственном интеллекте генератора изображений Gemini, который допускал оскорбляющие общественность исторические неточности. К примеру, расовое разнообразие солдат по запросу «римский легион» — явный анахронизм — и стереотипно чёрные мужчины по запросу «зулусские воины». Кажется, ничего не изменилось до сих пор.

 Источник изображения: blog.google

Источник изображения: blog.google

Гендиректору Google Сундару Пичаи (Sundar Pichai) пришлось принести извинения за сбой в работе генератора изображений Gemini, а глава ответственного за проект профильного подразделения Google DeepMind Демис Хассабис (Demis Hassabis) пообещал, что ошибка будет исправлена в «кратчайшие сроки» — за несколько недель. Сейчас уже середина мая, а ошибка до сих пор не исправлена.

На этой неделе Google провела ежегодную конференцию I/O, на которой рассказала о множестве новых функций Gemini: модель ИИ сможет использоваться для создания собственных чат-ботов, планировки маршрутов, она будет интегрирована в Google Calendar, Keep и YouTube Music. Но генерация изображений до сих пор отключена в приложении Gemini и веб-интерфейсе, подтвердил ресурсу TechCrunch представитель Google.

Причин задержки он не пояснил. По одной из версий, при обучении ИИ используются наборы данных, в которых превалируют изображения белых людей, тогда как представители других рас и этнических групп составляют исключения, что формирует стереотипы. В попытке исправить этот перекос Google могла прибегнуть к кардинальной мере — жёсткому кодированию, при котором данные встраиваются непосредственно в исходный код. Исправить созданный таким образом алгоритм очень непросто.

Президент OpenAI опубликовал изображение, созданное GPT-4o — оно очень впечатляет

На этой неделе OpenAI представила модель искусственного интеллекта нового поколения GPT-4o. Буква «o» в её названии означает Omni, подразумевая, что она изначально поддерживает несколько форматов ввода — ранее мультимодальность предполагала преобразование всех нетекстовых форматов в текст. Президент и соучредитель OpenAI Грег Брокман (Greg Brockman) впервые опубликовал созданное GPT-4o изображение.

 Источник изображения: twitter.com/gdb

То самое сгенерированное GPT-4o изображение. Источник изображения: twitter.com/gdb

Поддержка текста, изображений и звука в качестве входных данных означает, что модель также способна их генерировать. Приведённая выше картинка — не фотография, а творение GPT-4o. На ней изображён мужчина в футболке с логотипом OpenAI, который пишет на доске. Сверху находится частично стёртая надпись «Перенос между модальностями». Далее следует текст: «Положим, мы напрямую моделируем P (текст, пиксели, звук) посредством одного авторегрессионного трансформера. Каковы за и против?».

Если присмотреться, можно разглядеть некоторые признаки того, что изображение было создано ИИ. Доска висит под неестественным углом, под ней непонятным образом находится ещё одна, рука мужчины имеет странную форму, а освещение неоднородно. Невероятной, вместе с тем, кажется способность ИИ генерировать длинные фрагменты связного текста — с этим с трудом справляется даже DALL-E 3. Генератор изображений GPT-4o широкой публике пока недоступен: пользователи ChatGPT с подключённой моделью нового поколения пока могут генерировать изображения лишь с DALL-E 3. Но президент OpenAI Грег Брокман уверяет, что компания прилагает значительные усилия, чтобы открыть к модели нового поколения полный доступ.

Браузер Mozilla Firefox получил поддержку ИИ-масштабирования видео Nvidia RTX Video

Технология масштабирования видео Nvidia RTX Video стала доступна в браузере Mozilla Firefox. Технология задействует мощности видеокарт Nvidia GeForce RTX и специальные ИИ-алгоритмы для повышения качества видеопотока, аналогично тому, как работает технология DLSS в играх.

 Источник изображений: Nvidia

Источник изображений: Nvidia

Очевидную пользу от технологии Nvidia RTX Video могут оценить, например, пользователи платных стриминговых сервисов. Технология масштабирует разрешение изображения видео до более высокого. При этом в данном случае нет необходимости платить за более высокое качество видеопотока. Алгоритмы RTX Video также устраняют артефакты сжатия, улучшают резкость и яркость цвета при использовании режима HDR.

Ранее технология Nvidia RTX Video была доступна только для браузеров Google Chrome и Microsoft Edge. Теперь она стала доступна и для Mozilla Firefox. Также следует отметить, что Nvidia RTX Video поддерживается медиапроигрывателем VLC Media Player.

А технология RTX Video HDR с помощью ИИ-алгоритма автоматически переводит транслируемый SDR-контент в расширенный динамический диапазон (HDR). Однако для оптимальной функциональности рекомендуется наличие монитора с сертификацией не ниже VESA DisplayHDR 600.

Согласно Nvidia, технология RTX Video поддерживается браузером Firefox версии 126 и новее. Для использования RTX Video в браузере Firefox необходимо выполнить следующие шаги:

  • установить последние версии драйвера GeForce RTX Game Ready Driver, Nvidia Studio или Nvidia RTX Enterprise;
  • убедиться, что в Windows включён режим HDR (Система → Дисплей → HDR);
  • открыть контрольную панель Nvidia, перейти в раздел «Регулировка параметров изображения для видео»;
  • в пункте «Улучшение видео RTX» включить Super Resolution и High Dynamic Range.

Google анонсировала свой самый мощный ИИ-генератор изображений Imagen 3

В рамках проходящей в эти дни в Маунтин-Вью конференции Google I/O состоялся анонс новой версии генеративной нейросети семейства Imagen. Речь идёт об алгоритме Imagen 3 — самом продвинутом генераторе изображений от Google на данный момент.

 Источник изображения: Google

Источник изображения: Google

Глава исследовательского ИИ-подразделения Google Deep Mind Демис Хассабис (Demis Hassabis) во время презентации заявил, что Imagen 3 более точно понимает тестовые запросы, на основе которых он создаёт изображения, чем модель Imagen 2. Он отметил, что алгоритм работает более «креативно и детализировано», а также реже ошибается и создаёт меньше «отвлекающих артефактов».

Вместе с этим Google попыталась развеять опасения по поводу того, что Imagen 3 будет использоваться для создания дипфейков. В процессе генерации изображений будет задействована технология SynthID, посредством которой на медиафайлы наносятся невидимые криптографические водяные знаки. Предполагается, что такой подход сделает бесполезными попытки использовать ИИ-генератор Google для создания фейкового контента.

Частные пользователи могут оформить подписку на Imagen 3 через сервис Google ImageFX. Разработчики и корпоративные клиенты получат доступ к ИИ-генератору через платформу машинного обучения Vertex AI. Как и в прошлом, в этот раз Google не поделилась подробностями касательно того, какие данные использовались для обучения нового алгоритма.

64 пикселя за 20 минут: на 40-летнем компьютере Commodore 64 запустили ИИ-генератор изображений

В августе 1982 года вышел компьютер Commodore 64, которому было суждено стать одним из самых продаваемых ПК всех времён. Как оказалось, оборудование той эпохи и может справляться и с современными алгоритмами искусственного интеллекта — конечно, с некоторыми оговорками.

 Источник изображения: github.com/nickbild

Источник изображения: github.com/nickbild

Энтузиаст Ник Бильд (Nick Bild) разработал для Commodore 64 систему генеративного ИИ, способную создавать изображения размером 8 × 8 пикселей, которые затем преобразуются в картинки 64 × 64 точки. Эти изображения призваны служить источником вдохновения при разработке концепций игрового дизайна. Как оказалось, современную модель генеративного ИИ действительно можно запускать на таком старом оборудовании. На выполнение 94 итерации для построения окончательного изображения у Commodore 64 ушли 20 минут — и это, пожалуй, совсем неплохо, учитывая возраст компьютера.

О проектах уровня OpenAI речи, конечно, не идёт, но и «вероятностный алгоритм PCA», запущенный на 40-летней машине, в реальности был обучен на современном компьютере. Таким образом, хотя модель и по-честному работала на Commodore 64, для её запуска всё равно оказался необходим современный ПК.

Изобразительная нейросеть Kandinsky 3.1 стала доступна для всех пользователей

«Сбер» объявил о доступности для всех пользователей без ограничений улучшенной модели генеративной нейросети Kandinsky 3.1, представленной ранее в этом месяце. ИИ-сервис позволяет создавать изображения по текстовому описанию на русском и английском языках. Сообщается, что обновлённая версия была дообучена на датасете эстетичных изображений, что позволило повысить качество генерации картинок.

 Источник изображения: «Сбер»

Источник изображения: «Сбер»

Кроме того, благодаря новому подходу к обучению и использованию качественного датасета значительно улучшилась функция Inpainting для редактирования отдельных фрагментов изображения.

Как сообщает «Сбер», у пользователей также появилась возможность воспользоваться в Telegram-боте в том числе быстрой моделью Kandinsky 3.1 Flash. Время генерации изображений с её помощью уменьшилось по сравнению с базовой версией более чем в 10 раз.

По словам разработчика, в ближайшее время будут добавлены инструменты создания изображений в формате 4K, функции создания вариаций изображения, смешивания нескольких графических файлов, смешивания картинок и текстов, генерации стикерпаков, а также возможность внесения локальных правок изображения без изменения всей композиции сцены (ControlNet). Кроме того, вскоре все пользователи смогут протестировать обновлённую версию модели генерации видео по тексту Kandinsky Video 1.1.

OpenAI отключила генератор изображений DALL-E 2 — его место займёт более продвинутый DALL-E 3

Компания OpenAI продолжает активно развивать свои генеративные алгоритмы, делая их более совершенными и удобными для пользователей. На этом фоне разработчики объявили о закрытии нейросети DALL-E 2, которая дебютировала в апреле 2022 года и позволяла создавать качественные изображения на основе текстовых описаний. Этого следовало ожидать, поскольку OpenAI уже выпустила более совершенный алгоритм DALL-E 3.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Алгоритм DALL-E 3 получил полную интеграцию с ИИ-ботом ChatGPT, что способствовало формированию более простого пользовательского интерфейса и созданию более качественных изображений. Начать взаимодействие с ChatGPT в DALL-E 3 можно буквально в пару кликов. Что же касается DALL-E 2, то очевидно, что нейросеть безвозвратно уходит в прошлое.

«Мы больше не допускаем новых пользователей к DALL-E 2. DALL-E 3 позволяет создавать изображения более высокого качества, лучше обрабатывает запросы, и мы начали внедрять в него функцию редактирования изображений. Он доступен пользователям ChatGPT Plus, Teams и Enterprise, а также через API OpenAI», — говорится в сообщении разработчиков на странице DALL-E 2.

Вместе с появлением сообщения от разработчиков со страницы исчезла форма для ввода текстовых описаний. Доступ к сгенерированным ранее изображениям на данный момент есть, но не исключено, что позднее это изменится. OpenAI предупреждала о предстоящем закрытии доступа к алгоритму ещё в начале года, поэтому для пользователей нейросети этот шаг не должен стать чем-то неожиданным.

Meta✴ добавила ИИ-генерацию изображений в реальном времени в WhatsApp — пока в тестовом режиме

Компания Meta начала тестировать в мессенджере WhatsApp генератор изображений Meta AI на базе искусственного интеллекта. Пока новая функция доступно только пользователям из США. Она работает в режиме реального времени: как только пользователь начинает добавлять в запрос детали для создания картинки, он сразу же видит, как изображение меняется в соответствии с указанными деталями.

 Источник изображения:  pexels.com

Источник изображения: pexels.com

В примере, предоставленном Meta, пользователь составляет запрос: «Представь игру в футбол на Марсе» (Imagine a soccer game on mars). С каждым написанным словом ИИ добавляет новые детали в генерируемое изображения, сначала показывая обычных игроков в футбол на обычном поле, а затем меняет его на пейзаж Марса. Пользователи, получившие доступ к бета-версии ИИ-генератора изображения в WhatsApp, могут попробовать новую функцию сами. Запрос необходимо делать на английском языке, начиная со слова «Imagine».

Компания Meta также сообщила, что её языковая модель Llama 3, на которой построен ИИ-генератор, способна создавать «более чёткие и качественные» изображения и лучше отображать текст. Пользователи также могут делать для Meta AI запрос для анимации любого предоставленного ими изображения. ИИ сгенерирует из статичной картинки GIF-изображение, которым можно будет поделиться с друзьями.

Помимо мобильного приложения WhatsApp, функция ИИ-генерации изображений в реальном времени также стала доступна для пользователей веб-версии платформы Meta AI, но пока тоже только из США.

Intel выпустила XeSS 1.3 — в ней пересмотрены уровни масштабирования изображения

Компания Intel выпустила новую версию своей технологии масштабирования изображения XeSS и сообщила, что поддержка XeSS теперь реализована в более чем 100 различных играх.

 Источник изображений: Intel

Источник изображений: Intel

Новейшая версия технологии масштабирования XeSS 1.3 обеспечивает более высокую производительность по сравнению с предыдущей версией. Однако следует уточнить, что в новой версии были изменены профили масштабирования изображения. Иными словами, хотя компания заявляет о повышении производительности у XeSS 1.3, этот прирост достигается за счёт меньшего разрешения (более высокого уровня масштабирования), а не благодаря той же оптимизации кода самой XeSS.

В новую версию XeSS 1.3 компания добавила алгоритм с новой ИИ-моделью, которая, как заявляется, обеспечивает отображение более визуально сложных элементов, лучшую реконструкцию изображения, улучшенное сглаживание, уменьшение ореолов вокруг объектов и повышенную временную стабильность.

В XeSS 1.3 также представлены два дополнительных профиля настроек масштабирования: Ultra Performance и Ultra Quality Plus. Первые максимально повышают производительность за счёт снижения качества изображения, а вторые призваны минимизировать снижение качества картинки за счёт снижения производительности. Кроме того, в XeSS 1.3 представлена технология Native Anti-Aliasing, являющаяся аналогом Nvidia DLAA и представляющая собой сглаживание без масштабирования.

Как уже говорилось выше, XeSS 1.3 использует иные уровни масштабирования. Настройки «Ultra Quality» теперь обеспечивают масштабирования в 1,5 раза вместо 1,3, в свою очередь настройки «Quality» предлагают масштабирование в 1,7 раза вместо 1,5. Настройки «Balanced» масштабируют картинку в 2,0x вместо 1,7x, «Performance» — 2,3x вместо 2,0x, а «Ultra Performance» масштабирует изображения в три раза.

Intel также приводит несколько сравнений технологий масштабирования XeSS 1.2 и XeSS 1.3. Однако учитывая, что каждый профиль настроек XeSS 1.3 был изменён просто за счёт изменения разрешения, это сравнение может показаться бессмысленным. И всё же окончательные выводы можно будет делать после того, как XeSS 1.3 станет доступна в играх, и можно будет сравнить эффективность профилей настроек обеих технологий, их производительность и, что важнее, обеспечиваемое ими качество изображения.

Intel сообщила, что выпустила новую версию SDK с поддержкой XeSS 1.3, поэтому игровые разработчики уже могут приступать к интеграции новой технологии в свои проекты.

ИИ Meta✴ оказался неспособен рисовать азиатов вместе с представителями других рас

Разработанный Meta генератор изображений на основе искусственного интеллекта вслед за Google Gemini продемонстрировал неожиданное отношение к расовому вопросу. Созданная гигантом соцсетей система оказалась почти неспособной изображать азиатов совместно с представителями других рас, обратила внимание журналистка The Verge Миа Сато (Mia Sato), которая сама является азиаткой.

 Источник изображений: ***

Источник изображений: Meta

Она несколько десятков раз обращалась к созданному Meta ИИ-генератору изображений, используя такие запросы как «мужчина-азиат и друг-европеец», «муж-азиат и жена с европейскими чертами лица», «азиатская женщина и муж-европеец». И лишь однажды система смогла точно изобразить предложенных ей представителей рас. Вариации запросов ситуацию не спасли. Команда «азиатский мужчина и белая женщина, улыбающиеся с собакой» привела к появлению трёх подряд изображений двух людей азиатской расы. Замена слова «белая» на «европейка» дала тот же результат. По запросу «мужчина-азиат и женщина-европейка в день свадьбы» ИИ предложил изображение мужчины-азиата в костюме и женщины-азиатки в традиционной одежде — причём это было нечто среднее между китайским платьем ципао и японским кимоно.

Перемены не наступили и с переходом в плоскость платонических отношений. По запросам «азиатский мужчина с европейским другом» и «азиатская женщина и белая подруга» генератор изображений Meta снова предложил одних азиатов. Двух азиатских женщин система предложила и по запросу «азиатская женщина с темнокожей подругой». Адекватный ответ появился лишь по запросу «женщина-азиатка с подругой-афроамериканкой». Не очень помогла и смена региона. По запросу «мужчина из Южной Азии с женой-европейкой» ИИ сначала представил корректное изображение, но за ним по тому же запросу последовала картинка с двумя представителями Южной Азии. Причём система обращался к стереотипам, украшая южноазиатских женщин бинди (красными точками на лбу) и сари (традиционной в Индии женской одеждой).

 Только одна попытка изобразить азиатку с подругой-афроамериканкой увенчалась успехом

Только одна попытка изобразить азиатку с подругой-афроамериканкой увенчалась успехом

Стоит отметить, что под «азиатскими женщинами» ИИ Meta понимает образы светлокожих женщин из Восточной Азии, хотя самой густонаселённой страной в Азии является Индия. Причём азиатские мужчины, принадлежащие, по мнению генератора изображений, к той же этнической группе, иногда оказываются пожилыми, зато женщины всегда изображаются молодыми.

Meta комментариев по данному вопросу пока не предоставила. К слову, жена главы компании Марка Цукерберга (Mark Zuckerberg), представителя европейской расы, — Присцила Чан (Priscilla Chan), по происхождению является китаянкой.

«Сбер» представил дообученный генератор изображений Kandinsky 3.1

«Сбер» официально представил усовершенствованную версию своей генеративной нейросети Kandinsky 3.1, которая позволяет создавать изображения по текстовому описанию на русском и английском языках. Обновлённый алгоритм дообучен на увеличенном наборе изображений, за счёт чего удалось повысить качество генераций.

 Источник изображения: sberbank.ru

Источник изображения: sberbank.ru

Одна из главных особенностей новой версии алгоритма заключается в повышении скорости генерации изображений. По данным компании, время создания одной картинки сократилось почти в 10 раз, а разрешение генераций можно повысить до формата 4K. В дополнение к этому пользователи теперь могут задействовать функцию улучшения текстового запроса с помощью языковой модели. Доступны функции создания разных вариантов изображений, смешивание картинок и текста, создание стикерпаков, а также возможность внесения локальных изменений на изображении без смены всей композиции.

Вместе с этим «Сбер» анонсировал скорое появление алгоритма Kandinsky Video 1.1, предназначенного для генерации видео по текстовому описанию. Разработчики сумели существенно повысить качество генераций благодаря увеличению объёма используемого для обучения датасета пар «текст-видео», а также изменениям в архитектуре модели. Внесённые изменения позволили повысить разрешение видео вдвое в сравнении с возможностями алгоритма Kandinsky 1.0. Модель разработана специалистами Sber AI совместно с учёными из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.

Nvidia и Shutterstock запустили ИИ-генератор 3D-моделей Edify

Архитектура визуального генеративного искусственного интеллекта Nvidia Edify вышла на новый уровень — она предложила генерацию 3D-объектов по текстовому описанию. Возможности платформы заинтересовали Shutterstock, Getty Images, Adobe, HP, Mattel и других партнёров Nvidia.

 Источник изображений: nvidia.com

Источник изображений: nvidia.com

Фотобанк Shutterstock открыл ранний доступ к API на основе архитектуры Edify — платформа позволяет художникам создавать трёхмерные объекты или целые сцены по текстовому описанию. Разработчики смогут протестировать возможности предварительно обученных моделей ИИ на архитектуре Edify с использованием данных Getty Images и Shutterstock по API через набор микросервисов Nvidia NIM. Обученная на лицензионном контенте Shutterstock модель обладает встроенными средствами фильтрации генерируемого контента; поддерживается экспорт в наиболее популярные 3D-форматы. Доступно также обучение и развёртывание специализированных моделей генеративного ИИ на архитектуре Edify при помощи платформы Nvidia Picasso на ресурсах Nvidia DGX Cloud.

Предложенный Shutterstock 3D-генератор заинтересовал компанию HP: созданные по текстовому описанию объекты можно преобразовывать в модели для 3D-принтеров HP с возможностью их последующего вывода на печать. Проект оказался полезным и компании Mattel: инструменты ИИ помогают дизайнерам визуализировать свои идеи для создания новых игрушек посредством текстовых команд, снижая тем самым технический барьер при разработке дизайна. На архитектуре Nvidia Edify также работает запущенный Adobe генератор 3D-изображений для пользователей сервисов Firefly и Creative Cloud.

Технологическая консалтинговая компания Accenture Song, которая уже развернула в работе платформу Nvidia Omniverse, также внедрила решения Edify для создания при помощи текстовых команд 3D-сцен в реалистичной среде для цифрового двойника автомобиля Land Rover Defender.

Фотобанк Getty Images на январской выставке CES анонсировал API на базе Nvidia Edify — этот инструмент позволяет добавлять, удалять или заменять объекты на изображениях, и теперь эти функции доступны на платформах Gettyimages.com и iStock.com. С мая Getty Images предложит услуги по индивидуальной настройке модели Edify Foundation в соответствии с брендом и визуальным стилем выступающей заказчиком компании. Эти сервисы работают без необходимости использовать программный код: клиент сможет загрузить собственный набор данных, свериться с автоматически генерируемыми тегами, сформировать задачи по тонкой настройке модели и просмотреть результаты перед их окончательным развёртыванием. Наконец, Getty Images предложит средства API для точного контроля над выводом изображений: платформа сможет генерировать изображения по эскизам, контролируя глубину цвета и сегментируя фрагменты изображения для работы с каждым объектом сцены в индивидуальном порядке.

Midjourney теперь можно показать персонажа, чтобы он повторял его на генерируемых изображениях

Основанный на искусственном интеллекте генератор изображений Midjourney 6, доступный сейчас только в рамках альфа-тестирования на платформе Discord, предложил новую функцию «образец персонажа» (Character Reference), позволяющую зафиксировать один образ на разных созданных платформой изображениях.

 Источник изображения: youtube.com/@curtispyketech

Источник изображения: youtube.com/@curtispyketech

Чтобы задать образец, пользователь Midjourney может указать одну или несколько ссылок на картинку с интересующим его персонажем или загрузить его на платформу, и генератор будет учитывать эти данные при получении команды. Администрация сервиса отметила, что новая функция предназначается в первую очередь для персонажей, созданных ИИ. «Для реальных людей/фотографий она не предназначена», — заявил администратор Midjourney Discord и добавил, что это, «скорее всего, исказит их, как это делают обычные запросы на изображения».

Но пользователи платформы, конечно, не смогли не попробовать. Один из них загрузил в качестве образца фотографию футбольной звезды Криштиану Роналду (Cristiano Ronaldo), и результаты действительно сильно напоминали известного спортсмена. Функция пока тестируется, но уже демонстрирует убедительные результаты: доступен также параметр «силы» (strength), то есть степени соответствия образца и результата генерации.

Новая функция вызывает два противоположных этических вопроса. С одной стороны, возможность задать образец персонажа облегчит недобросовестным пользователям создание убедительных дипфейков. С другой, исключение отсылок на работы художников может вызвать проблемы с авторскими правами, если пользователи захотят коммерциализировать или опубликовать творения Midjourney.

Один апскейлинг на всех: Microsoft анонсировала DirectSR для унификации подходов Nvidia, AMD и Intel

Несколько дней назад сообщалось, что компания Microsoft разрабатывает некую технологию под названием DirectSR. На тот момент было выдвинуто предположение, что речь идёт об универсальной технологии масштабирования изображения в играх, которая будет поддерживаться всеми производителями видеокарт. К сожалению, DirectSR не является универсальным апскейлером.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

В Microsoft объяснили, что DirectSR — это новый API, предназначенный для игровых разработчиков. Он призван упростить и сделать более универсальным процесс интеграции уже существующих и будущих технологий масштабирования в игровые проекты.

DirectSR был разработан при поддержке ведущих производителей видеокарт в лице NVIDIA и AMD. Новый API собираются представить на конференции GDC 2024 в марте. DirectSR охватывает ключевые функции и особенности, присущие всем технологиям временного масштабирования. В большинстве случаев речь здесь идёт о векторах движения, буферах глубины и цвета, метках реакции и экспозиции. Для эффективной работы апскейлера в игре эти переменные (в случае той же AMD FSR) должны быть распределены между игровыми кадрами. Судя по всему, другие существующие технологии временного масштабирования имеют аналогичные требования и ключевые особенности. DirectSR с одной стороны сделает процесс интеграции различных апскейлеров более универсальным, а с другой — позволит расширить количество переменных для их использования в составе других возможных будущих технологий масштабирования.

«Мы рады анонсировать DirectSR — наш новый API, разработанный при поддержке производителей GPU и предназначенный для упрощения процесса интеграции технологий масштабирования (Super Resolution, SR) в новое поколение игр. Масштабирование изображения является передовой технологией, которая не только увеличивает разрешение в играх, но также позволяет повысить их визуальное качество. DirectSR представляет собой то недостающее звено, которого не хватало разработчикам игр при интеграции апскейлеров для обеспечения наиболее эффективного и плавного игрового процесса независимо от того или иного аппаратного обеспечения. Этот API позволяет использовать технологии масштабирования от разных вендоров через общий набор входных и выходных данных и с помощью одного пути выполнения кода активировать в играх различные решения, включая NVIDIA DLSS Super Resolution, AMD FidelityFX Super Resolution и Intel XeSS. API DirectSR скоро станет доступен в качестве превью-версии в составе пакета Agility SDK для тестирования и отзывов со стороны разработчиков игр», — сообщила Microsoft на своём сайте.

На данный момент самыми популярными технологиями масштабирования являются NVIDIA DLSS2 и DLSS 3 (закрытые технологии, работающие только на видеокартах GeForce RTX), AMD FSR 2 и FSR 3 (обе являются открытыми технологиями), а также Intel XeSS (так и не стала открытой, несмотря на обещания Intel). Также можно выделить TSR в составе Unreal Engine, которая тоже может получить поддержку DirectSR.

Tecno представила систему обработки изображений PolarAce c сенсором Sony

Бренд смартфонов и умных устройств Tecno представил на выставке MWC 2024 новую технологию обработки изображений Tecno PolarAce, которая будет доступна в смартфоне Tecno Camon 30 Premier 5G во втором квартале 2024 года.

Tecno PolarAce использует возможности процессора обработки изображений Sony CXD5622GG на основе вычислений с плавающей запятой, датчики изображения Sony Lytia, технологию получения изображений с несколькими оттенками кожи Tecno Universal Tone, а также новейшие технологии ИИ-визуализации Tecno.

Процессор Sony CXD5622GG выполняет искусственное шумоподавление и оптимизацию качества изображения на каждом кадре видео, обеспечивая чёткость динамичных кадров, контрастность, восстановление точных оттенков цветов и повышение качества видеозаписи даже в условиях недостаточного освещения. Благодаря поддержке вычислений с плавающей запятой производительность процессора составляет 4,6 Тфлопс на вычислениях FP16.

Разработка Tecno PolarAce была бы невозможна без сотрудничества с Sony Lytia, чьи CMOS-датчики созданы специально для улучшения возможностей мобильной съёмки.

Tecno PolarAce оптимизирует цветопередачу благодаря новой технологии Tecno Universal Tone, осуществляющей мобильную обработку изображений на основе ИИ для улучшения передачи текстуры и цвета кожи, а также других особенностей различных национальностей по всему миру. В её усовершенствовании участвовали учёные-колористы из различных университетов мира, а недавно собранные и проанализированные данные были интегрированы в систему искусственного интеллекта Universal Tone.

Также Tecno PolarAce дополнена функциями на базе ИИ. Встроенный портретный модуль AIGC (AI Generated-Content), позволяет генерировать изображения в любом сеттинге без загрузки стороннего приложения. А AI One Click Erase от Tecno позволяет одним движением удалять лишние объекты на фото.

Система обработки изображений Tecno PolarAce будет доступна в смартфоне Tecno Camon 30 Premier 5G, выход которого запланирован на II квартал 2024 года.

Camon 30 Premier 5G оснащён перископическим телеобъективом с эквивалентным фокусным расстоянием 70 мм и гибридным 60х зумом, обеспечивающим передачу естественных света и тени без размытия или обрезки кадра, а также снижающим шумы при ночной съёмке.

Смартфон построен на восьмиядерном 4-нм процессоре MediaTek Dimensity 8200 Ultimate 5G с графическими ускорителями Arm Mali-G610 MC6 и Imagiq 785 AI. LTPO-экран с разрешением 1,5К с пиковой яркостью 1400 кд/м2 и цветопередачей миллиона цветов является самым продвинутым в серии Camon.

window-new
Soft
Hard
Тренды 🔥
Paradox перенесла на неопределённый срок симулятор жизни Life by You от команды ветерана The Sims, но игроки даже рады 7 ч.
Кибершпионаж на дне океана: США заподозрили Китай в краже данных через морские интернет-кабели 8 ч.
Microsoft представила Recall — функцию записи всех действий пользователя в Windows 11 8 ч.
Флибустьеры поневоле: в 2024 году почти три четверти российских игроков оказались пиратами 10 ч.
«Образ Джокера на Железном троне останется со мной навсегда»: релизный трейлер MultiVersus взбудоражил фанатов перед воскрешением игры 11 ч.
Подписка требует жертв: инсайдеры предупредили о подорожании Game Pass из-за Call of Duty 12 ч.
OpenAI отключила в ChatGPT голос Sky в из-за удивительного сходства с голосом Скарлетт Йоханссон 13 ч.
Google обвинила Microsoft в неспособности защитить клиентов от кибератак 13 ч.
Опубликованы первые тесты видеокарт в бенчмарке 3DMark Steel Nomad, который выйдет завтра 13 ч.
Гендиректор Take-Two: Rockstar постарается выпустить GTA VI без багов, но это не главное 16 ч.