реклама
Теги → directx 12

Microsoft придумала, как ускорить загрузку в играх до 10 раз — разработан новый метод компиляции шейдеров

Microsoft анонсировала новую функцию, которая сократит время начальной загрузки в играх, называемую Advanced Shader Delivery. Согласно блогу разработчиков DirectX, функция перенесёт компиляцию шейдеров с устройства пользователя в облако, что позволит загружать необходимые файлы непосредственно на устройство для кэширования.

 Источник изображений: Microsoft

Источник изображений: Microsoft

Помимо значительного ускорения запуска игры — Microsoft в качестве примера приводит игру Avowed, где время загрузки было сокращено на 85 % — функция Advanced Shader Delivery также экономит заряд батареи и вычислительную мощность ноутбуков и портативных игровых устройств, отмечает компания.

Компиляция шейдеров традиционно выполняется на устройстве, поскольку процесс учитывает настройки игры, а также видеокарту и версию драйвера, которые используются в системе. Это означает, что производительность компиляции шейдеров зависит от установленного на устройство пользователя программного и аппаратного обеспечения. Учитывая практически бесконечное количество вариаций систем, разработчикам было практически невозможно предварительно скомпилировать шейдеры для каждого устройства. Однако Microsoft изменила подход к компиляции шейдеров, создав новый формат под названием State Object Database (SODB).

Компания собирает данные шейдеров из игры и упаковывает их в SODB. Разработчики DirectX совместно с производителями видеокарт разработали метод разделения компилятора шейдеров от графического драйвера, что позволило объединить его с SODB и создать базу данных предкомпилированных шейдеров (PSDB). При загрузке игры через приложение Xbox PC приложение определит конфигурацию системы пользователя и подтянет соответствующую базу PSDB. Таким образом, при первом запуске игры приложение обнаружит предустановленные шейдеры и пропустит длительный процесс компиляции.

Предположительно, эта функция будет работать даже после обновления драйвера или при замене видеокарты, поскольку приложение Xbox PC должно отслеживать любые изменения на устройстве и загружать необходимую базу PSDB для той или иной игры. Но если система уникальна, и у Microsoft ещё нет PSDB для неё (например, используется бета-версия драйвера), компьютер будет компилировать шейдеры самостоятельно.

Функция Advanced Shader Delivery дебютирует на портативных консолях Asus ROG Xbox Ally и Ally X, выпуск которых запланирован на 16 октября. Microsoft намекает, что в будущем она появится и на других платформах. На данный момент Advanced Shader Delivery не требует дополнительных усилий от разработчиков игр, поскольку весь процесс компиляции выполняется на серверах Xbox. Тем не менее, Microsoft заявляет, что планирует сотрудничать с другими участниками игровой индустрии для интеграции передовых технологий доставки шейдеров непосредственно в игровые движки, что избавит геймеров от длительной загрузки, но также усилит зависимость пользователей от онлайн-сервисов Xbox.

AMD показала, насколько Work Graphs повысила производительность видеокарт Radeon

Ранняя версия новой технологии Work Graphs, представленной компанией Microsoft на прошлой неделе и входящей в состав DirectX 12, обеспечила значительную прибавку игровой производительности в системе с видеокартой Radeon RX 7900 XTX, сообщила компания AMD. Технология Work Graphs призвана оптимизировать взаимодействие CPU и GPU при выполнении различных задач.

 Источник изображений: AMD

Источник изображений: AMD

По словам AMD, в ранних испытаниях Work Graphs повысила игровую производительность ПК с видеокартой Radeon RX 7900 XTX на 39 %. Без технологии Work Graphs и при использовании традиционного метода выполнения операций ExecuteIndirect решение задачи потребовало на 64 % больше времени. Проверка проводилась на ПК с Ryzen 7 5800X, 32 Гбайт памяти DDR4 и видеокартой Radeon RX 7900 XTX.

Технология Work Graphs призвана разгрузить центральный процессор за счёт переноса планирования части задач на видеокарту. Иногда CPU не успевает подготовить задачи для расчёта на GPU, в результате видеокарта простаивает, ожидая новых указаний. Задача Work Graphs — сделать GPU более автономным. Для этого CPU будет создавать для GPU последовательность задач, которую необходимо исполнить. Такая оптимизация позволит увеличить производительность рендеринга.

Ниже на видео показана 3D-сцена без пользовательского интерфейса HUD и скайбокса, рендеринг которой осуществляется за одну последовательность задач с помощью Work Graphs.

Технологии Work Graphs и Mesh Nodes станут важными составляющими DirectX 12. Все ключевые производители видеокарт уже работают над их поддержкой на уровне драйверов для своих аппаратных средств.

Благодаря возможности графических процессоров самостоятельно планировать работу с помощью Work Graphs, между CPU и GPU будут передаваться меньше задач, что в конечном итоге освободит ресурсы центрального процессора и памяти, позволив разработчикам игр более эффективно использовать ресурсы GPU для создания ещё более впечатляющей картинки.

Microsoft выпустила технологию Work Graphs, которая ускорит ПК со слабыми CPU и современными GPU

Microsoft выпустила технологию Work Graphs, которая является частью последней версии DirectX 12. Данная технология позволит разгрузить центральный процессор за счёт переноса планирования задач на видеокарту, что теоретически даст прирост производительности системам с маломощными CPU.

Сейчас конечная картинка на экране формируется совместными усилиями CPU и GPU, но иногда CPU не успевает подготовить задачи для расчёта на GPU, в результате видеокарта простаивает, ожидая новых указаний. Технология Work Graphs призвана сделать GPU более автономным, чтобы он мог сам подавать себе рабочие задания и сократить количество обращений к CPU.

С помощью Work Graphs разработчики игр могут оптимизировать конвейеры производитель-потребитель, которые эффективно переносят тяжелые рабочие нагрузки с CPU на GPU. В этой системе поток, работающий на GPU (производитель), может зарегистрировать запрос на выполнение другой работы (потребитель). Работа будет запланирована GPU, как только появится свободное место, и при необходимости этот поток также может стать потребителем. Проще говоря, вместо ожидания выполнения каждого этапа расчётов, CPU может составить последовательность задач, которые GPU выполнит, не обращаясь каждый раз к CPU.

Дополнительно ускорить взаимодействие центрального и графического процессоров предполагается благодаря функции GPU Upload Heaps из Shader Model 6.8 — она позволяет CPU и GPU обмениваться данными заметно быстрее, за счёт отсутствия необходимости передавать данные из видеопамяти центральному процессору через шину PCI. Эта функция использует технологию ResizableBAR, позволяющую CPU с минимальными задержками записывать данные в видеопамять.

Work Graphs и Shader Model 6.8 стали доступны разработчикам игр через Agility SDK 1.613. Этот SDK уже можно использовать с новейшими драйверами AMD и NVIDIA. Технология Work Graphs поддерживается графическими процессорами NVIDIA Ampere и Ada Lovelace (GeForce RTX 3000 и RTX 4000) с установленными драйверами версии 551.76 или новее. Что касается AMD, то Work Graphs сейчас работает лишь на графических процессорах с архитектурой RDNA3 (видеокарты Radeon RX 7000). Обновлённые драйвера с поддержкой нового SDK от Intel пока не вышли.

Стоит отметить, что одним лишь обновлением видеодрайвера производительность не поднять — технология Work Graphs должна быть реализована в играх, а значит инициативу должны поддержать и игровые разработчики.

Компания NVIDIA также опубликовала техническую демонстрацию, позволяющую оценить работу Work Graphs. В видео выше показана её работа — примерно в на 1:20 можно увидеть заметный прирост производительности за счёт новой технологии. В тесте использовалась видеокарты GeForce RTX 4090 и процессор Ryzen 7 7700X.

window-new
Soft
Hard
Тренды 🔥
Автосохранение в Microsoft Word теперь включено по умолчанию — но копии сохраняются не на ПК 21 мин.
В Elden Ring Nightreign скоро появятся экспедиции повышенной сложности — анонсирован режим Deep of Night для самых смелых 49 мин.
Нелинейный шутер Judas от создателя BioShock вернулся из небытия с новыми подробностями и ключевой иллюстрацией 2 ч.
Xiaomi представила HyperOS 3 — углубленная совместимость с Apple, редизайн, Super Island и многое другое 2 ч.
«Яндекс» оштрафовали за отказ предоставить ФСБ доступ к «Умному дому с Алисой» 3 ч.
Apple добилась удаления приложение iTorrent из альтернативного магазина AltStore PAL 3 ч.
Представлен Avanpost CA — российский аналог Microsoft Certificate Authority 4 ч.
Новые меры по борьбе с киберпреступниками могут ударить по «белым хакерам» в России 6 ч.
Разработчик Dread Delusion анонсировал Entropy — олдскульную пошаговую ролевую игру про актёра театра, на мир которого напали демоны 7 ч.
«Яндекс» запустил новую ИИ-модель YandexGPT 5.1 Pro, но доступна она пока лишь бизнесу 8 ч.
Honor представила глобальную версию тончайшего складного смартфона Magic V5 — от €1999 в Европе 59 мин.
xMEMS Labs показала прототип умных очков с ультратонким динамиком и твердотельным кулером 3 ч.
Foxconn инвестировала более $200 млн в производство в Мексике, вероятно — для выпуска ИИ-серверов 3 ч.
В России стартовали продажи крайне доступного смартфона Infinix Smart 10 3 ч.
Tokyo Electron открестилась от участия в краже секретных разработок TSMC 3 ч.
AMD прекратила выпуск коробочных кулеров Wraith Prism и Wraith Spire для Ryzen 5000, 7000 и 8000G 3 ч.
В России обвалились продажи ноутбуков — россияне выбирают дешёвые модели и всё чаще предпочитают маркетплейсы 3 ч.
OKO Phone 5 для российских госслужащих поступил в продажу с устаревшей начинкой и свежей ОС «Аврора» 3 ч.
Можно пожёстче: российские производители предложили усложнить госзакупки иностранной электроники 4 ч.
Самолёт SolarStratos побил рекорд высоты полёта на солнечной тяге 6 ч.