реклама
Видеокарты

GeForce RTX больше не нужен? Тесты трассировки лучей на ускорителях GeForce GTX 10 и 16

⇣ Содержание

После того как NVIDIA продемонстрировала трассировку лучей в реальном времени на видеокартах серии GeForce RTX, трудно сомневаться в том, что именно за этой технологией (в разумном сочетании с алгоритмом растеризации) будущее компьютерных игр. Однако графические процессоры на основе архитектуры Turing со специализированными RT-ядрами до недавнего времени считались единственной категорией дискретных GPU, которая располагает подходящей для этого вычислительной мощностью.

Как показали тесты первых игр, освоивших Ray Tracing (Battlefield V, Metro Exodus и Shadow of the Tomb Raider), даже ускорители GeForce RTX (особенно младший из них — RTX 2060) испытывают существенное падение частоты смены кадров в задачах гибридного рендеринга. Несмотря на первые успехи, трассировку лучей в реальном времени еще нельзя считать зрелой технологией. Лишь тогда, когда не только самые передовые и дорогостоящие устройства, но и графические карты среднего ценового уровня достигнут прежних стандартов быстродействия в играх новой волны, можно будет объявить, что смена парадигм, запущенная компанией Дженсена Хуанга, наконец, совершилась.

Трассировка лучей на «Паскалях» — за и против

Но уже сейчас, пока еще не сказано ни слова о будущем преемнике архитектуры Turing, NVIDIA решила подстегнуть прогресс. На мероприятии GPU Technology Conference в прошлом месяце зеленая команда сообщила, что ускорители на чипах Pascal, а также младшие представители семейства Turing (серия GeForce GTX 16) приобретут функцию трассировки лучей в реальном времени наравне с продуктами под маркой RTX. Сегодня обещанный драйвер уже можно скачать на официальном сайте NVIDIA, а список устройств включает модели семейства GeForce 10, начиная с GeForce GTX 1060 (версия 6 Гбайт), профессиональный ускоритель TITAN V на чипе Volta, и, разумеется, новоприбывшие модели средней ценовой категории на чипе TU116 — GeForce GTX 1660 и GTX 1660 Ti. Обновление коснулось и ноутбуков с соответствующими GPU.

С технической точки зрения здесь нет ничего сверхъестественного. Графические процессоры с унифицированными шейдерными блоками могли выполнять Ray Tracing задолго до появления архитектуры Turing, хотя в то время не располагали достаточным быстродействием для того, чтобы эта возможность была востребована в играх. Кроме того, отсутствовал единый стандарт программных методов, помимо закрытых API наподобие фирменного NVIDIA OptiX. Теперь, когда существует расширение DXR для Direct3D 12 и аналогичные библиотеки в интерфейсе программирования Vulkan, игровой движок может обращаться к ним вне зависимости от того, оснащен ли графический процессор специализированной логикой — лишь бы драйвер давал такую возможность. У чипов Turing для этой цели есть отдельные RT-ядра, а в GPU архитектуры Pascal и процессоре TU116 трассировка лучей реализована в формате вычислений общего назначения на массиве шейдерных ALU.

Однако все, что нам известно об архитектуре Turing со слов самой NVIDIA, говорит о том, что Pascal не годится для приложений с поддержкой DXR. В прошлогодней презентации, посвященной флагманским моделям семейства Turing — GeForce RTX 2080 и RTX 2080 Ti — инженеры приводили следующие выкладки. Если бросить все ресурсы лучшей из потребительских видеокарт прошлого поколения — GeForce GTX 1080 Ti — на вычисления трассировки лучей, то итоговая производительность не превысит 11 % от того, на что в теории способен RTX 2080 Ti. Не менее важно и то, что свободные CUDA-ядра чипа Turing в то же время можно использовать для параллельной обработки других компонентов изображения — выполнения шейдерных программ, очереди неграфических расчетов Direct3D при асинхронном исполнении и так далее.

В реальных играх ситуация сложнее, ведь на существующем железе разработчики дозированно пользуются функциями DXR, а львиную долю вычислительной нагрузки по-прежнему занимает растеризация и шейдерные инструкции. К тому же часть различных эффектов, которые создаются при помощи трассировки лучей, неплохо исполняются и на CUDA-ядрах чипов Pascal. К примеру, зеркальные поверхности в Battlefield V не подразумевают вторичного отражения лучей, а следовательно, являются посильной нагрузкой для мощных видеокарт прошлого поколения. То же относится и к теням в Shadow of the Tomb Raider, хотя рендеринг сложных теней, сформированных несколькими источниками света, уже представляет собой более трудную задачу. А вот глобальное освещение в Metro Exodus с трудом дается даже «Тьюрингу», и от Pascal нельзя ожидать в какой-либо степени сопоставимых результатов.

Как ни крути, речь идет о многократной разнице в теоретическом быстродействии между представителями архитектуры Turing и их ближайшими аналогами на кремнии Pascal. Причем в пользу Turing играет не только присутствие RT-ядер, но и многочисленные усовершенствования общего характера, свойственные ускорителям нового поколения. Так, чипы Turing умеют параллельно выполнять операции над вещественными (FP32) и целочисленными (INT) данными, несут большой объем локальной кеш-памяти и отдельные CUDA-ядра для расчетов сниженной точности (FP16). Все это значит, что Turing не только лучше справляется с шейдерными программами, но и может сравнительно эффективно обсчитывать трассировку лучей без специализированных блоков. Ведь настолько ресурсоемким рендеринг при помощи Ray Tracing делает не только и не столько поиск пересечений между лучами и элементами геометрии (которым занимаются RT-ядра), сколько вычисление цвета в точке пересечения (shading). И между прочим, перечисленные достоинства архитектуры Turing в полной мере относятся к GeForce GTX 1660 и GTX 1660 Ti, хотя в чипе TU116 нет RT-ядер, поэтому тесты этих видеокарт с программной трассировкой лучей представляют отдельный интерес.

Но довольно теории, ведь мы уже собрали данные о производительности «Паскалей» (а также младших «Тьюрингов») в Battlefield V, Metro Exodus и Shadow of the Tomb Raider на основе собственных измерений. Заметим, что ни драйвер, ни сами игры не регулируют количество лучей для того, чтобы снизить нагрузку на GPU без RT-ядер, а значит, качество эффектов на GeForce GTX и GeForce RTX должно быть одинаковым.

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU NVIDIA
NVIDIA GeForce RTX 20 NVIDIA GeForce Game Ready Driver 419.67
NVIDIA GeForce GTX 10/16 NVIDIA GeForce Game Ready Driver 425.31
Игровые тесты
Игра API Настройки, метод тестирования Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
Battlefield V DirectX 12 OCAT, миссия Liberte. Макс. качество графики TAA High TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк. Профиль качества графики Ultra TAA TAA
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк. Макс. качество графики SMAA 4x Выкл.

Показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (Metro Exodus, Shadow of the Tomb Raider) или утилита OCAT, если в игре его нет (Battlefield V).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения.

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

Battlefield V

Благодаря тому, что Battlefield V сама по себе является довольно нетребовательной игрой (особенно в режимах 1080p и 1440p), а трассировка лучей в ней применяется фрагментарно, испытание GeForce 10-й серии с опцией DXR принесло обнадеживающие результаты. Впрочем, из всех моделей без поддержки Ray Tracing на уровне кремния нам пришлось ограничиться моделями GTX 1070/1070 Ti и GTX 1080/1080 Ti. Игры Electronic Arts с подозрением реагируют на частую смену конфигурации железа и блокируют пользователя на период в одни или несколько суток. Поэтому замеры производительности GeForce GTX 1060 и двух устройств серии GeForce GTX 16 появятся в этой статье позже, как только Battlefield V снимет ограничения с нашей тестовой машины.

В процентном выражении любой из участников тестирования испытывает примерно одинаковое падение быстродействия при различных установках качества трассировки лучей вне зависимости от разрешения экрана. Так, быстродействие видеокарт под маркой GeForce RTX 20 снижается на 28–43 % при низком и среднем качестве эффектов DXR, а при высоком и максимальном — на 37–53 %.

Если речь идет о старших моделях семейства GeForce 10, то на уровнях трассировки лучей Low и Medium игра теряет от 36 до 42 % FPS, а при высоком качестве (настройки High и Ultra) DXR съедает уже 54–67 % частоты смены кадров. Заметим, что во многих, если не в большинстве игровых сцен Battlefield V нет выраженной разницы между настройками Low и Medium, а также между High и Ultra — ни по четкости изображения, ни по быстродействию. В надежде на то, что графические процессоры Pascal окажутся более чувствительными к этому параметру, мы провели тесты при всех четырех настройках. И действительно, проявились определенные различия, но только при разрешении 2160p и в пределах 6% FPS.

В абсолютных показателях любой из старших ускорителей на чипах Pascal может поддерживать кадровую частоту выше 60 FPS в режиме 1080p при сниженном качестве отражений, а GeForce GTX 1080 Ti претендует на аналогичный результат даже при трассировке на уровне High. Но стоит перейти к разрешению 1440p, и уже лишь GeForce GTX 1080 и GTX 1080 Ti обеспечивают комфортный фреймрейт на уровне 60 FPS и выше при качестве трассировки лучей Low или Medium, а в режиме 4К ни одна из карт прошлого поколения не обладает подходящей вычислительной мощностью (как, впрочем, и любой Turing за исключением флагманского GeForce RTX 2080 Ti).

Если искать параллели между конкретными ускорителями под маркой GeForce GTX 10 и GeForce RTX 20, то лучшая модель прошлого поколения (GeForce GTX 1080 Ti), которая в задачах стандартного рендеринга без DXR является аналогом GeForce RTX 2080, опустилась на уровень GeForce RTX 2070 при сниженном качестве трассировки лучей, а при высоком может бороться разве что с GeForce RTX 2060.

Дополнение: результаты GeForce GTX 1060, GTX 1660 и GTX 1660 Ti.

В тестах GeForce GTX 1660 и GTX 1660 Ti можно заметить слабые признаки того, что архитектура Turing и вправду лучше справляется с трассировкой лучей даже без поддержки RT-ядер по сравнению с видеокартами семейства Pascal аналогичного уровня — GeForce GTX 1070 и GTX 1070 Ti. При разрешениях 1080p и 1440p разница в потере быстродействия, которую GPU испытывает при активации DXR, между ускорителями 16-й серии, с одной стороны, и картами на чипе GP104, с другой, возникает при высоком и максимальном качестве эффектов трассировки лучей, пусть она и не превышает нескольких процентов. А вот в режиме 2160p при таких же настройках графический процессор TU116 уже выдерживает дополнительную нагрузку заметно лучше, чем «Паскали». Впрочем, последнее относится именно к GTX 1660 Ti: модель без приставки Ti с гибридным рендерингом в 4К откровенно не справляется.

Результаты двух моделей GeForce 16-й серии в абсолютных значениях частоты смены кадров также выглядят обнадеживающе. В режиме 1080p GeForce GTX 1660 и GTX 1660 Ti поддерживают около 60 FPS при низком и среднем качестве эффектов DXR, а при разрешении 1440p можно рассчитывать по меньшей мере на 30. Только в 4К с трассировкой лучей чипу TU116 делать уже нечего.

Что касается GeForce GTX 1060, то при условно низком разрешении экрана (1080p и 1440p) младший ускоритель из списка моделей, допущенных к трассировке лучей в реальном времени, утратил от 35 до 39 % кадровой частоты с низкими и средними настройками DXR, и от 57 до 64 % с высокими и максимальными. В этом GTX 1060 мало отличается от своих ближайших соседей по серии GeForce 10. Однако, как и GeForce GTX 1660, эта видеокарта получает катастрофический удар по быстродействию в 4К: теряется от 59 до 95 % изначальной скорости. Тем не менее, играть в Battlefield V с DXR на GeForce GTX 1060 все-таки можно, но придется согласиться на средний FPS немногим больше 50 в режиме 1080p и 30 в 1440p (если не жадничать с настройками качества).

Battlefield V, макс. Качество
1920 × 1080 TAA
RT Off RT Low RT Medium RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -28% -28% -37% -39%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -34% -35% -43% -44%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -35% -36% -46% -45%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -42% -43% -50% -51%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -38% -39% -55% -58%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -35% -36% -50% -53%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -40% -39% -54% -58%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -41% -41% -57% -61%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -40% -41% -57% -59%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -38% -39% -57% -61%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -36% -37% -57% -60%
Battlefield V, макс. Качество
2560 × 1440 TAA
RT Off RT Low RT Medium RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -33% -34% -44% -45%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -37% -38% -47% -49%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -36% -36% -48% -48%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -41% -42% -51% -52%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -46% -45% -58% -60%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -39% -44% -55% -59%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -40% -40% -59% -62%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -36% -39% -59% -63%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -39% -39% -58% -62%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -38% -38% -59% -63%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -35% -39% -62% -64%
Battlefield V, макс. Качество
3840 × 2160 TAA
RT Off RT Low RT Medium RT High RT Ultra
NVIDIA GeForce RTX 2080 Ti FE (11 Гбайт) 100% -30% -30% -44% -47%
NVIDIA GeForce RTX 2080 FE (8 Гбайт) 100% -31% -32% -46% -49%
NVIDIA GeForce RTX 2070 FE (8 Гбайт) 100% -40% -38% -53% -52%
NVIDIA GeForce RTX 2060 FE (6 Гбайт) 100% -28% -30% -44% -53%
NVIDIA GeForce GTX 1660 Ti (6 Гбайт) 100% -34% -34% -52% -56%
NVIDIA GeForce GTX 1660 (6 Гбайт) 100% -66% -71% -76% -79%
NVIDIA GeForce GTX 1080 Ti (11 Гбайт) 100% -36% -37% -60% -63%
NVIDIA GeForce GTX 1080 (8 Гбайт) 100% -40% -43% -64% -67%
NVIDIA GeForce GTX 1070 Ti (8 Гбайт) 100% -38% -42% -62% -65%
NVIDIA GeForce GTX 1070 (8 Гбайт) 100% -36% -42% -63% -66%
NVIDIA GeForce GTX 1060 (6 Гбайт) 100% -59% -71% -92% -95%
Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
Huawei предлагает для HarmonyOS в 200 раз меньше приложений, чем есть в Google Play — разрыв планируется сократить в течение года 10 ч.
World of Warcraft исполнилось 20 лет — это до сих пор самая популярная ролевая игра в мире 12 ч.
Microsoft хочет, чтобы у каждого человека был ИИ-помощник, а у каждого бизнеса — ИИ-агент 15 ч.
«Атака на ближайшего соседа» сработала — хакеры удалённо взломали компьютер через Wi-Fi поблизости 17 ч.
Google Gemini сможет управлять приложениями без пользователя и даже не открывая их 20 ч.
Илон Маск отделался выплатой $2923 за неявку для дачи показаний по делу о покупке Twitter 21 ч.
Новая статья: Death of the Reprobate: что не так на картине? Рецензия 23-11 00:05
Главный конкурент OpenAI получил $4 млрд на развитие ИИ без следов Хуанга 22-11 23:13
Valve раскрыла часть игр, которые получат скидку на осенней распродаже Steam — официальный трейлер акции 22-11 22:34
Threads получила «давно назревавшие улучшения» в поиске и тренды 22-11 22:17