Оригинал материала: https://3dnews.kz/983690

Включаем DLSS в Battlefield V, Final Fantasy XV и Metro Exodus: качество картинки и быстродействие

Как работает DLSS. Качество изображения: DLSS vs TAA

Среди новых возможностей, которыми обладают видеокарты семейства GeForce RTX, первое место по праву занимает трассировка лучей в реальном времени. Но у чипов архитектуры Turing есть не менее важная функция — масштабирование изображения с помощью «искусственного интеллекта», которое позволяет снизить нагрузку на GPU и увеличить частоту смены кадров, причем в теории это должно происходить без видимых потерь в качестве изображения.

Когда NVIDIA представила первые модели GeForce RTX, о поддержке DLSS объявили не менее двадцати игровых проектов. В теории разработчикам проще внедрить в код графического движка этот метод, чем добавить трассировку лучей в реальном времени. Но пока только три игры продемонстрировали DLSS в деле — сперва Final Fantasy XV, затем Metro Exodus, а недавно и для Battlefield V вышел соответствующий патч. Кроме того, в 3DMark появился специализированный тест, который позволяет напрямую сравнить частоту смены кадров при рендеринге с DLSS и полноэкранном сглаживании по алгоритму TAA. Для каждого из этих приложений мы подробно проанализировали качество изображения и оценили быстродействие DLSS с различными настройками разрешения и трассировки лучей.

#Что такое DLSS и как это работает

Перед тем как мы приступим к анализу качества и производительности DLSS, нужно пояснить, что же представляет собой новая инициатива NVIDIA и чем она ни в коем случае не является. Аббревиатура DLSS означает Deep Learning Super Sampling, то есть рендеринг с избыточной выборкой при помощи глубинного обучения, но это название может ввести в заблуждение, если не знать, как технология работает в действительности.

Задача DLSS состоит в том, чтобы взять изображение с условно низким разрешением и увеличить его до целевого размера (например, из 1440p в 2160p), но вместо простой аппроксимации цвета промежуточных пикселов GPU восстанавливает информацию, которая отсутствует в исходном кадре. Таким образом DLSS позволяет снизить нагрузку на графический процессор при рендеринге ресурсоемких сцен, особенно в сочетании с трассировкой лучей. В некотором смысле DLSS — это суперсемплинг наоборот: в то время как полноэкранное сглаживание методом SSAA заставляет GPU выполнить рендеринг с повышенным разрешением и потом сжимает исходный кадр, DLSS действует в противоположном направлении, увеличивая разрешение исходного кадра. Удаление лесенок с краев полигонов в данном случае является лишь побочным эффектом масштабирования картинки, а не основной задачей, как в SSAA и современных облегченных алгоритмах вроде вездесущего метода временнóго сглаживания TAA.

В основе DLSS лежит «искусственный интеллект» — нейронная сеть, которая обнаруживает паттерны внутри изображения и пытается воссоздать его в большем разрешении. Такой подход уже давно применятся для обработки статичных фотографий, но у подвижного видеоряда, тем более в различных играх, есть индивидуальная специфика. Поэтому для каждой игры нужно тренировать собственную вычислительную модель: в ходе множества итераций она пытается увеличить изображение таким образом, чтобы результат приблизился к «золотому стандарту» — кадру в целевом разрешении, который дополнительно облагорожен 64-кратным суперсемплингом. В этом вторая часть словосочетания Deep Learning Super Sampling соответствует действительности. Но кроме того, существует вариант технологии под названием DLSS 2x: здесь GPU сразу выполняет рендеринг в полном разрешении, а нейронная сеть нужна именно для полноэкранного сглаживания, которое в теории достигает качества, сравнимого с тем, что может предложить алгоритм SSAA 64x. Однако это пока задел на будущее — DLSS 2x еще не поддерживается ни в одной игре.

Тренировкой нейросетей для DLSS занимаются собственные серверы NVIDIA, и если судить по тому, как мало проектов на данный момент приобрели совместимость с новой технологией, это длительный процесс. Впрочем, чем больше игр с поддержкой DLSS выйдет в будущем, тем проще будет адаптировать нейросеть для новых, основываясь на прежних наработках.

С клиентской стороны DLSS опирается на тензорные ядра, которые появились в графических процессорах архитектуры Volta и Turing. Эти компоненты обладают высочайшей пропускной способностью в основном типе операций, которые применяются при обработке данных нейронными сетями (inference), — умножении-сложении матриц, состоящих из вещественных чисел сниженной разрядности (FP8 и FP16). Без тензорных ядер DLSS не имеет никакого смысла, иначе у GPU просто не хватит свободных ресурсов для рендеринга 3D-графики и одновременной работы нейросети. Поэтому DLSS — это эксклюзивная технология для ускорителей семейства GeForce RTX. Игровым видеокартам NVIDIA прошлого поколения на основе архитектуры Pascal такие возможности недоступны из-за чрезвычайно низкого быстродействия в расчетах FP16.

Впрочем, пользователю о тонкостях работы DLSS знать не обязательно. Нужно лишь своевременно обновлять игры и драйвер видеокарты, а свежие версии нейронных сетей ПО NVIDIA загружает самостоятельно — для этого даже не требуется утилита GeForce Experience, на которую производитель поначалу хотел возложить эту функцию.

#Влияние DLSS на качество изображения

#3DMark

Тест DLSS в составе 3DMark основан на бенчмарке Port Royal и задействует DXR для рендеринга освещения, теней и отражений. Но то, что Port Royal показывает на экране, имеет весьма отдаленное отношение к первым играм, которые освоили Ray Tracing. Ни в Battlefield V, ни в Metro Exodus нет настолько обильной трассировки лучей, а рендеринг такого изображения при играбельной частоте смены кадров с трудом дается даже GeForce RTX 2080 Ti.

Что касается DLSS, то повторяемая сцена обеспечивает идеальные условия для тренировки нейросети (впрочем, через какое-то время в тесте может появиться функция свободной камеры). Изображение, масштабированное при помощи DLSS, здесь выглядит не хуже, чем тот же кадр, честно прорисованный в целевом разрешении экрана, а во многих отношениях даже лучше. При рендеринге в нативном разрешении отдельные участки кадра сильно размыты — это особенно выражено в отражениях зеркальных поверхностей, где к тому же бросаются в глаза ступенчатые края полигонов. По всей видимости, 3DMark экономит количество лучей в этой чрезвычайно ресурсоемкой сцене и активно пользуется шумоподавлением, чтобы аппроксимировать цвет промежуточных пикселов. DLSS, в свою очередь, восстанавливает пропавшие детали, убирает «лесенки» и повышает локальный контраст.

TAA

DLSS

TAA

DLSS

TAA

DLSS

На другом скриншоте можно увидеть, как DLSS устраняет грубый шум трассировки лучей в отражении на полу комнаты и делает резче материалы, не отражающие свет. Впрочем, на темных поверхностях можно разглядеть «грязные» артефакты, когда нейросеть увеличивает локальный контраст в участках с низким динамическим диапазоном.

TAA

DLSS

TAA

DLSS

TAA

DLSS

Но это единственный изъян реализации DLSS, который мы смогли обнаружить, пока в этом тесте не появилась свободная камера. В остальном 3DMark демонстрирует эталонное качество масштабирования. Жаль, что в реальных играх все совсем не так просто.

#Battlefield V

В Battlefield V, помимо DLSS и рендеринга в полном размере со сглаживанием TAA, есть возможность просто уменьшить разрешение viewport’а, а игра растянет его на полный экран. Масштабированный кадр дополнительно проходит через фильтр, увеличивающий локальный контраст, — наподобие Unsharp Mask в «Фотошопе». В результате получается довольно резкое и шумное изображение, но по крайне мере лучше так, чем установить разрешение 1440p на 4К-матрице, поручив масштабирование электронике монитора, а главное, для этого не нужна видеокарта серии GeForce RTX.

DLSS же в Battlefield V, напротив, никак не влияет на локальный контраст, а нейросеть сама по себе еще не настолько хорошо тренирована, чтобы волшебным образом восстановить информацию из кадра с пониженным разрешением, как это происходит в 3DMark. Потеря резкости в DLSS по сравнению с тем, что можно видеть при рендеринге в полном разрешении, хорошо заметна на первом скриншоте, где масса мелких деталей на земле и в листве деревьев сливается с туманом. Простое масштабирование c разрешением viewport’а 67 % (что эквивалентно 1440p при целевом разрешении 2160p) в этой сцене дает зернистую и грубую, зато не настолько размытую картинку.

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

На поверхностях с однородной текстурой мягкое размытие DLSS не бросается в глаза. О такой же четкости, как при рендеринге в нативном разрешении с TAA, по-прежнему не идет никакой речи, но уже можно рассуждать, что лучше — DLSS или масштабирование из разрешения 67 %. Однако во второй сцене Battlefield V можно заметить проблемы иного рода: DLSS удалило «лишние» детали пятен на броне танка (подходящая аналогия из инструментов фоторетуши — это Healing Brush в Photoshop). Зато по этому признаку видно, что DLSS — это не просто растянутая картинка низкого разрешения. Нейронная сеть пытается обнаружить паттерны в изображении, но иногда принимает ошибочные решения.

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

Лучше всего DLSS справляется с простыми контрастными текстурами и тонкой геометрией. В последнем случае нейросеть усиливает детали, которые полностью теряются при сниженном разрешении viewport’а и почти сливаются с фоном в «честном» 4К.

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

TAA

DLSS

TAA, разр-е 67 %

Но самую большую разницу между TAA и DLSS обнаруживают кадры в динамике. В движущемся изображении TAA вызывает сильнейший муар на текстурах с повторяющимся рисунком, «лесенки» и грубые артефакты на краях полигонов. На кадрах с DLSS ничего подобного нет.

TAA (статика)

DLSS (статика)

TAA, разр-е 67 % (статика)

TAA (статика)

DLSS (статика)

TAA, разр-е 67 % (статика)

TAA (статика)

DLSS (статика)

TAA, разр-е 67 % (статика)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 67 % (в движении)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 67 % (в движении)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 67 % (в движении)

Прим.: все скриншоты сделаны с отключенным размытием в движении (Motion Blur).

#Final Fantasy XV

Final Fantasy XV обзавелась поддержкой DLSS раньше остальных игр, а специальную версию бенчмарка с этой функцией мы получили еще к выходу GeForce RTX 2080 Ti, в августе прошлого года. У серверов NVIDIA было полно времени для оптимизации DLSS под Final Fantasy XV, и это заметно.

В отличие от Battlefield V, эталонное изображение для тренировки нейросети в Final Fantasy XV пропущено через фильтр четкости, усиливающий локальный контраст, — взгляните на лицо персонажа с первого кадра. Здесь же можно заметить не вполне удачную попытку DLSS восстановить детали отдаленного здания. Но в остальном статичная картинка мало отличается от рендеринга в нативном разрешении, а в иных случаях лучший результат дает именно DLSS — посмотрите на кабели ЛЭП в приближении.

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

В Final Fantasy XV тоже есть возможность уменьшить разрешение viewport’a, но игра даже не пытается облагородить растянутую картинку фильтром постобработки — ни в какое сравнение с DLSS этот способ повысить FPS не идет.

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

Впрочем, определенное снижение четкости по сравнению с рендерингом в полном разрешении на кадрах с DLSS все-таки есть. Кроме того, изменения локального контраста конфликтуют с Ambient Occlusion, размывая тени в углах и нишах. А вот сглаживание краев полигонов нейросеть выполняет с образцовым качеством.

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

TAA

DLSS

TAA, разр-е 75 %

Хотя DLSS в этой игре хорошо справляется со статичными кадрами (по крайней мере намного лучше, чем в Battlefield V), у нейросети есть проблемы с обработкой динамического изображения: такие объекты, как забор на автостоянке или оконные жалюзи, сильно размыты и постоянно мерцают. Зато нет никакого муара, как в случае с TAA или рендерингом в пониженном до 75 % разрешении viewport’a (установить масштаб в 67 %, эквивалентный разрешению 1440p, игра не позволяет).

TAA (статика)

DLSS (статика)

TAA, разр-е 75 % (статика)

TAA (статика)

DLSS (статика)

TAA, разр-е 75 % (статика)

TAA (статика)

DLSS (статика)

TAA, разр-е 75 % (статика)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 75 % (в движении)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 75 % (в движении)

TAA (в движении)

DLSS (в движении)

TAA, разр-е 75 % (в движении)

Прим.: все скриншоты сделаны с отключенным размытием в движении (Motion Blur).

#Metro Exodus

В Metro Exodus с самого начала была поддержка DLSS, но в первую неделю после выхода игры эта функция была практически бесполезной из-за нечеткого и размытого изображения. NVIDIA еще работает над следующей версией нейросети для Metro Exodus, но уже вышло промежуточное обновление, которое повышает локальный контраст итоговой картинки за счет фильтра постобработки. Четкости DLSS по-прежнему недостает, но прогресс налицо, особенно в простых контрастных текстурах.

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS

TAA, Shading Rate 70 %

Metro Exodus не позволяет установить сниженное разрешение viewport’а, как Battlefield V и Final Fantasy XV. Вместо этого есть опция Shading Rate, которая регулирует размер выборки шейдеров на каждый пиксел кадра. Результат рендеринга с Shading Rate на уровне 70 % трудно отличить от DLSS: последний дает более контрастное изображение, но в плавных градиентах заметны пикселы исходного кадра, который нейросеть увеличивает до целевого размера.

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS

TAA, Shading Rate 70 %

Как и в предыдущих играх, DLSS хорошо справляется с рендерингом мелкой геометрии отдаленных объектов, которая при сниженной выборке шейдеров просто растворяется на фоне неба.

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS

TAA, Shading Rate 70 %

TAA

DLSS


TAA, Shading Rate 70 %

В динамике DLSS не обнаруживает никаких преимуществ перед TAA: временнóе полноэкранное сглаживание в Metro Exodus отличается высоким качеством и не вызывает таких артефактов, как в Battlefield V.

TAA (статика)

DLSS (статика)

TAA, Shading Rate 70 % (статика)

TAA (статика)

DLSS (статика)

TAA, Shading Rate 70 % (статика)

TAA (в движении)

DLSS (в движении)

TAA, Shading Rate 70 % (в движении)

TAA (в движении)

DLSS (в движении)

TAA, Shading Rate 70 % (в движении)

Прим.: все скриншоты сделаны с отключенным размытием в движении (Motion Blur).

Методика тестирования. Тестирование производительности: 3DMark, Battlefield V

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2019 Edition 19.2.3
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 419.17

Для измерения производительности в играх Metro Exodus и Final Fantasy XV был использован встроенный бенчмарк. В Battlefield V тестирование проводилось в однопользовательской кампании на старте миссии Leberte. Показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает бенчмарк (3DMark, Metro Exodus) или утилита OCAT (Battlefield V, Final Fantasy XV).

Средняя частота смены кадров на диаграммах игровых тестов является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения.

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#DLSS в 3DMark

Тест DLSS в 3DMark демонстрирует идеальное масштабирование результатов в соответствии с вычислительной мощностью GPU и разрешением экрана. В режиме 1080p рендеринг с DLSS увеличивает частоту смены кадров на 35–45 %, в 1440p — на 43–44 %.

При разрешении 2160p быстродействие трех старших видеокарт на чипах Turing за счет DLSS выросло на 91–94 %. Младший «Тьюринг» — особенный случай. Рендеринг в полном разрешении 2160p исчерпывает 6 Гбайт оперативной памяти GPU. DLSS, в свою очередь, экономит RAM за счет рендеринга кадра в пониженном исходном разрешении, и в результате быстродействие RTX 2060 оказывается на 150 % выше.

1920 × 1080
TAA DLSS
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +35%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +42%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +45%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +45%
2560 × 1440
TAA DLSS
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +43%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +46%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +46%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +44%
3840 × 2160
TAA DLSS
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +94%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +92%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +91%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +150%

#DLSS в Battlefield V

DLSS в Battlefield V можно включить только в сочетании с трассировкой лучей, а отдельным видеокартам серии GeForce RTX доступны не все разрешения экрана, причем GPU с наиболее высоким быстродействием ограничены «снизу». GeForce RTX 2080 Ti может воспользоваться DLSS только в режиме 2160p, RTX 2080 — в 1440p и 2160p, и только на двух младших моделях разрешено активировать DLSS при разрешении 1080p.

Это неспроста: при достаточно низкой вычислительной нагрузке DLSS уже не дает никакого прироста частоты смены кадров. Так, GeForce RTX 2070 в режиме 1080p за счет DLSS набирает не больше 8 % FPS, а RTX 2060 — не больше 16 %. Лучше просто снизить разрешение viewport’а до 67 % — и быстродействие в результате увеличивается на 24–43 %.

1920 × 1080
DXR Medium DXR Ultra
TAA DLSS Разр-е 67 % TAA DLSS Разр-е 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% НД НД 100% НД НД
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% НД НД 100% НД НД
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +3% +24% 100% +8% +31%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +16% +43% 100% +12% +37%

При разрешении 1440p DLSS тоже не слишком помогает. Даже при максимальном качестве трассировки лучей частота смены кадров благодаря нейросети возрастает всего лишь на 12–14 %. При DXR на среднем уровне качества GeForce RTX 2070 и RTX 2080 выиграли не больше 5 %, а для RTX 2060 эта технология практически бесполезна при таких настройках. В теории именно младшая видеокарта должна выйти вперед по приросту FPS, но по каким-то причинам, связанным с конфигурацией GPU, подобное соотношение результатов между RTX 2060 и RTX 2070 при установке DXR Medium повторяется и в режиме 2160p.

В то же время рендеринг в сниженном разрешении увеличивает частоту смены кадров на 29–60 % — в зависимости от интенсивности трассировки лучей и мощности GPU.

2560 × 1440
DXR Medium DXR Ultra
TAA DLSS Разр-е 67 % TAA DLSS Разр-е 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% НД НД 100% НД НД
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +4% +29% 100% +12% +38%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +5% +32% 100% +13% +41%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% −1% +50% 100% +14% +60%

DLSS наиболее эффективен при разрешении 2160p — в этом режиме масштабирование с помощью машинного обучения доступно всем видеокартам серии GeForce RTX. При среднем качестве трассировки лучей быстродействие возрастает на 17–36 %, а при максимальном — уже на 34–53 %. Тем не менее рендеринг в разрешении, сниженном до 67 %, влияет на результаты бенчмарка намного сильнее: бонус достигает 67 % при низком качестве трассировки. При максимальном качестве DXR таким образом можно практически удвоить FPS (+90 % на GeForce RTX 2060).

3840 × 2160
DXR Medium DXR Ultra
TAA DLSS Разр-е 67 % TAA DLSS Разр-е 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +17% +47% 100% +34% +60%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +23% +53% 100% +45% +73%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +36% +67% 100% +46% +73%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +20% +64% 100% +53% +90%

Тестирование производительности: Final Fantasy XV, Metro Exodus. Выводы

#DLSS в Final Fantasy XV

DLSS в Final Fantasy XV работает только при разрешении 2160p, а трассировки лучей в этой игре нет, так что тестирование в FFXV не дало столь же развернутых результатов, как в Battlefield V. Как бы то ни было, в 4К масштабирование картинки с помощью машинного обучения существенно повышает частоту смены кадров — на 28–32 %. Как обычно, DLSS наиболее полезен для младших видеокарт семейства GeForce RTX, хотя разница со старшими «Тьюрингами» в данном случае совсем невелика.

В Final Fantasy XV тоже есть возможность просто уменьшить разрешение viewport’а вместо включения DLSS, но во встроенном бенчмарке она недоступна. Соответственно, данных о быстродействии с ее использованием мы не приводим. Во всяком случае, качество изображения с этой опцией снижается настолько сильно, что рассматривать ее как полноценную альтернативу DLSS совершенно невозможно.

3840 × 2160
TAA DLSS
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +28%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +28%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +33%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +32%

#DLSS в Metro Exodus

Набор разрешений экрана, вместе с которыми можно активировать DLSS, в Metro Exodus тоже ограничен в соответствии с быстродействием того или иного ускорителя серии GeForce RTX. Но по сравнению с Battlefield V здесь есть определенные послабления. К примеру, все модели на чипах Turing с тензорными ядрами могут задействовать нейросеть при разрешении 1440p одновременно с трассировкой лучей, а трем старшим видеокартам DLSS доступен в режиме 2160p независимо от DXR. При разрешении 1080p масштабирование с помощью машинного обучения предлагается только для GeForce RTX 2060 и RTX 2070 и только совместно с DXR.

Metro Exodus с трассировкой лучей и прочими настройками детализации на уровне Ultra — весьма «тяжелая» игра даже в режиме 1080p. Как следствие, RTX 2060 и RTX 2070 за счет DLSS могут нарастить частоту смены кадров на 14–18 % при минимальном качестве трассировки лучей и на 19–24 % при максимальном.

Сниженная выборка шейдеров, которая в Metro Exodus заменяет рендеринг с уменьшенным разрешением viewport’а, мало отличается от DLSS не только по качеству изображения, но и по воздействию на производительность. Так, при минимальном качестве трассировки лучей она увеличивает FPS на 17–20 %, а при максимальном — на 21–23 %.

1920 × 1080
RT High RT Ultra
TAA DLSS Shading Rate 67 % TAA DLSS Shading Rate 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% НД НД 100% НД НД
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% НД НД 100% НД НД
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +14% +17% 100% +19% +21%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +18% +20% 100% +24% +23%

В режиме 1440p машинное обучение уже сильнее влияет на частоту смены кадров: при минимальном качестве трассировки лучей DLSS позволяет выиграть 18–25 % FPS, а при максимальном — 23–30 %. При этом разрешении мы можем сравнить DLSS со сниженной выборкой шейдеров на всем диапазоне графических карт GeForce RTX. Так вот, при трассировке лучей на минимальном уровне именно сниженная выборка шейдеров обеспечивает наибольший рост кадровой частоты. При максимальной интенсивности Ray Tracing в большинстве случаев нет никакой разницы между двумя решениями.

2560 × 1440
RT High RT Ultra
TAA DLSS Shading Rate 67 % TAA DLSS Shading Rate 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +18% +24% 100% +23% +28%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +22% +27% 100% +28% +29%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +22% +25% 100% +28% +28%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% +25% +27% 100% +30% +30%

DLSS при разрешении 2160p недоступен лишь младшей видеокарте серии GeForce RTX, а остальные модели позволяют включить нейросеть даже отдельно от DXR. В таком случае DLSS увеличивает быстродействие на 25–27 %, но сниженная выборка шейдеров по-прежнему более эффективна (+28–29 %).

Потенциал DLSS лучше всего раскрывается в режиме 2160p совместно с трассировкой лучей. Уже при минимальном качестве трассировки DLSS добавляет 48–52 % к частоте смены кадров, а при максимальном — 59–60 %. Сниженная выборка шейдеров уже не дает такого эффекта и предлагает лишь 35–36 или 37–38 % кадровой частоты в зависимости от интенсивности трассировки лучей.

3840 × 2160
RT Off RT High RT Ultra
TAA DLSS Shading Rate 67 % TAA DLSS Shading Rate 67 % TAA DLSS Shading Rate 67 %
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% +25% +28% 100% +48% +36% 100% +59% +38%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% +25% +29% 100% +53% +34% 100% +62% +37%
ASUS ROG Strix GeForce RTX 2070 OC (8 Гбайт) 100% +27% +29% 100% +52% +35% 100% +60% +38%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% НД НД 100% НД НД 100% НД НД

#Выводы

Что можно сказать про Deep Learning Super Sampling на примере немногочисленных игр, которые уже приобрели совместимость с этой технологией? Если резюмировать наши эксперименты в Battlefield V, Final Fantasy XV и Metro Exodus, то на данном этапе инициатива NVIDIA производит неоднозначное впечатление, и пока преждевременно решать, что такое DLSS — успех или провал.

Самую удачную реализацию DLSS из трех проектов предлагает Final Fantasy XV. Нейросеть, которая масштабирует изображение в этой игре, имеет специфические недостатки — она плохо справляется с движущимися объектами. Но в целом NVIDIA и Square Enix выполнили поставленную задачу: изображение, обработанное DLSS, похоже на картинку в честном 4К, и ради прироста быстродействия на 28–32 % можно закрыть глаза на отдельные недоработки. Тем более что Final Fantasy XV на «максималках» — это весьма ресурсоемкая игра, а если просто снизить внутреннее разрешение рендеринга, то результат не идет ни в какое сравнение с DLSS.

В Metro Exodus разработчики вообще не обещали поддержки DLSS, пока игра не ушла на золото. Хорошо заметно, что эту опцию добавили в последний момент, и нейросеть для Metro Exodus еще очень сырая. Недавнее обновление благотворно повлияло на четкость изображения, и теперь DLSS работает весьма недурно, пусть и не так хорошо, как в Final Fantasy XV. Но проблема в том, что Metro Exodus позволяет снизить нагрузку на графический процессор альтернативным способом, который никак привязан к видеокартам серии GeForce RTX (за счет сниженной выборки шейдеров). Качество рендеринга в таком случае практически не отличается от того, что можно видеть при включенном DLSS, а преимущество по быстродействию у технологии NVIDIA есть только в режиме 2160p c трассировкой лучей. Как бы то ни было, DLSS в Metro Exodus сильно экономит ресурсы GPU и при благоприятных условиях позволяет увеличить частоту смены кадров на 48–60 %. Нужно только дождаться, когда на серверах NVIDIA созреет финальная версия нейросети.

А вот DLSS в Battlefield V — это, как ни крути, полнейшее разочарование. Здесь технология работает очень лениво: размывает картинку, а в отдельных случаях съедает мелкие детали из-за некорректного распознавания паттернов внутри нейронной сети. Кроме того, DLSS не слишком сильно влияет на частоту смены кадров, и только при разрешении 2160p c максимальным качеством трассировки лучей позволяет выиграть 34–53 % FPS. А главное, в Battlefield V можно просто уменьшить внутреннее разрешение рендеринга — в таком случае и качество изображения, и быстродействие только увеличивается по сравнению с тем, что можно получить при активации DLSS. Единственное преимущество у DLSS есть в рендеринге движущегося изображения, где сглаживание методом TAA вызывает массу артефактов, особенно заметных при сниженном разрешении.

У технологии DLSS по-прежнему есть нераскрытый потенциал. Достаточно посмотреть на 3DMark, где сцена, обработанная нейросетью, выглядит даже лучше, чем при рендеринге в целевом разрешении. Кроме того, мы еще не увидели ни одного проекта с поддержкой DLSS 2x, который сулит качество полноэкранного сглаживания на уровне 64-кратного суперсемплинга. Но пока нужно признать, что внедрение DLSS в играх происходит медленно и проблематично. И хотя есть такие успешные примеры, как Final Fantasy XV, пока что масштабирование кадра с помощью нейросети даже близко не похоже на универсальный способ бесплатно увеличить разрешение, каким оно выглядит в теории и синтетических тестах. Все зависит от того, сколько времени потребуется фермам машинного обучения в ЦОДах NVIDIA, чтобы новые игры получали собственные профили DLSS оперативно и сразу с высоким качеством рендеринга. Ну а мы еще не раз вернемся к этой теме в будущем.



Оригинал материала: https://3dnews.kz/983690