реклама
Видеокарты

Обзор видеокарты NVIDIA GeForce RTX 3080, часть 2: долгожданные тесты

⇣ Содержание

#Тестовый стенд, методика тестирования

Тестовый стенд
CPU Intel Core i9-9900K (4,9 ГГц, 4,8 ГГц в AVX, фиксированная частота)
Материнская плата ASUS MAXIMUS XI APEX
Оперативная память G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 × 8 Гбайт (3200 МГц, CL14)
ПЗУ Intel SSD 760p, 1024 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Corsair Hydro Series H115i
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты AMD Radeon Software Adrenalin 2020 Edition 20.8.3
ПО для GPU NVIDIA
Все видеокарты NVIDIA GeForce Game Ready Driver 456.16
Игры
Игра (в порядке даты выхода) API Метод тестирования Настройки графики Полноэкранное сглаживание
Strange Brigade Vulkan Встроенный бенчмарк Макс. качество графики AA Ultra
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл. TAA
Assassin's Creed Odyssey DirectX 11 Встроенный бенчмарк Макс. качество графики AA High (TAA)
Battlefield V DirectX 12 Миссия Liberte + OCAT Макс. качество графики. DXR выкл., DLSS выкл. TAA High
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. DXR выкл., DLSS выкл., Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Встроенный бенчмарк (Battle Benchmark) Макс. качество графики TAA
Control DirectX 12 OCAT Макс. качество графики TAA
Borderlands 3 DirectX 12 Встроенный бенчмарк Макс. качество графики TAA
Red Dead Redemption 2 Vulkan Встроенный бенчмарк Макс. качество графики TAA High
DOOM Eternal Vulkan Начало миссии Mars Core + OCAT Макс. качество графики TAA
Игры (с трассировкой лучей)
Игра (в порядке даты выхода) API Метод тестирования Полноэкранное сглаживание
Battlefield V DirectX 12 Миссия Liberté + OCAT Макс. качество графики. DXR Raytrace Reflection Quality: Ultra TAA/DLSS
Shadow of the Tomb Raider DirectX 12 Встроенный бенчмарк Макс. качество графики. Ray Traced Shadows Quality: Ultra TAA/DLSS
Metro Exodus DirectX 12 Встроенный бенчмарк Макс. качество графики. Shading Rate 100%. Ray Trace: Ultra TAA/DLSS
Quake II RTX Vulkan Timedemo, запись demo1.dm2 Макс. качество графики TAA
Control DirectX 12 OCAT Ray Tracing Preset: High TAA/DLSS 2.0
Minecraft with RTX Beta DirectX 12 Бенчмарк в мире Portal Pioneers + OCAT Макс. дальность рендеринга геометрии и частиц Нет/DLSS 2.0

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет).

Средняя частота смены кадров на диаграммах является величиной, обратной среднему времени кадра. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста. Из этого массива чисел выбирается значение, соответствующее 1-му процентилю распределения. Red Dead Redemption 2 является исключением: ее встроенный бенчмарк регистрирует 1-й процентиль времени рендеринга кадра, из которого выводится соответствующая кадровая частота.

Вычисления общего назначения, кодирование/декодирование видео
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M AMF NVENC
3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320 Н/Д -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. В качестве нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и при максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

#Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрами (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

#Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Прежде чем приступить к бенчмаркам Palit RTX 3080 GamingPro OC, хотим рассказать о пополнении в нашем тестовом инструментарии. Вместе с комплектом LDAT, который позволяет регистрировать время задержки между вводом и реакцией изображения в играх, мы получили от NVIDIA новое средство измерения потребляемой мощности для плат расширения PCI Express под названием PCAT (Power Capture Analysis Tool).

В большинстве обзоров графических ускорителей используются косвенные методы оценки энергопотребления — при помощи программных инструментов драйвера видеокарты или чаще всего по совокупной мощности компьютера, — которые не позволяют проводить точное сравнение устройств различных производителей и рассчитывать такой показатель, как быстродействие на ватт мощности, характеризующий новые достижения в проектировании GPU. Так, современные видеокарты на чипах NVIDIA способны отдавать через API данные о своем общем энергопотреблении (включая оперативную память, вентиляторы охлаждения и потери КПД на преобразование напряжения) благодаря тому, что для контроля мощности в них применяются шунты на всех линиях 12 В. В то же время система питания ускорителей AMD устроена проще и позволяет отслеживать лишь мощность самого графического процессора на выходе силовых каскадов VRM без учета остальных компонентов. Ну а замеры полной мощности системы бытовым ваттметром, очевидно, не дают возможности исключить из уравнения неодинаковую загрузку центрального процессора при использовании GPU различных классов производительности.

Единственный способ раз и навсегда устранить перечисленные ограничения состоит в том, чтобы изолировать питание видеокарты от материнской платы тестового стенда и контролировать ток непосредственно между подопытным устройством и БП. В обзорах новых GPU мы уже не первый год следуем именно такой методике, когда видеокарта подключается к материнской плате жестким райзером, в котором разорваны линии питания, а весь ток и, следовательно, потребляемая мощность измеряется универсальным цифровым ваттметром при помощи шунта, рассчитанного на несколько сотен ватт.

Инструмент PCAT работает точно таким же образом. Он состоит из платы микроконтроллера с восьмиконтактными разъемами питания PCI Express и переходника, изолирующего видеокарту от материнской платы. Таким образом, все питание поступает на ускоритель через PCAT, а микроконтроллер регистрирует ток, проходящий через кабели и слот PCI Express. Для оценки энергопотребления на глазок у PCAT есть миниатюрный OLED-экран, но, в отличие от нашего ваттметра, устройство NVIDIA можно подключить к компьютеру по USB и записывать лог потребляемой мощности — совокупной или, если требуется, мощности слота PCI Express и разъемов дополнительного питания в отдельности.

Заметим, что программное обеспечение PCAT, как и LDAT, не обязательно запускать на тестовом компьютере, а в том случае, когда оно работает на отдельной машине, у PCAT нет никакой возможности узнать, какое именно железо мы тестируем. Соответственно, не стоит волноваться о том, получат ли ускорители AMD справедливые оценки мощности в сравнении с новинками NVIDIA. Что касается точности измерения, то замеры энергопотребления видеокарт под нагрузкой с помощью PCAT не разошлись с показателями наших собственных инструментов, откалиброванных по падению напряжения на шунте, более чем на 5 %. Тем не менее, в обзорах всех будущих GPU мы целиком перейдем на PCAT. В конце концов, инструмент NVIDIA намного удобнее в работе, не говоря о том, что выглядит куда симпатичнее наших самоделок.

Однако вернемся к Palit RTX 3080 GamingPro OC. Как мы уже заметили, перед нами разогнанный вариант GeForce RTX 3080, но оверклокинг в данном случае сводится к чисто символической величине 30 МГц по частоте Boost Clock, а резерв мощности видеокарты соответствует референсным 320 Вт. Как следствие, заводской разгон видеокарты не должен исказить общую картину сравнения GeForce RTX 3080 с другими ускорителями, все из которых представлены в бенчмарках референсными моделями.

NVIDIA оценивает диапазон тактовых частот GeForce RTX 3080 более консервативно, чем у его формальных предшественников — RTX 2080 и RTX 2080 SUPER. В действительности так оно и есть, хотя дистанция между устойчивой тактовой частотой ядра Palit RTX 3080 GamingPro OC и GeForce RTX 2080 SUPER Founders Edition оказалась немногим больше 50 МГц (1854 и 1907 МГц соответственно) под мощной нагрузкой в Crysis 3. Да, мы по-прежнему используем эту игру в качестве стресс-теста: достаточно сказать, что RTX 3080 стал первым ускорителем на нашей памяти, который добился в Crysis 3 фреймрейта 60 FPS при разрешении 4К (даже без полноэкранного сглаживания MSAA!). А вот по сравнению с чипом TU102 на плате GeForce RTX 2080 Ti новый GPU тактуется на 131 МГц выше, невзирая на полуторакратную разницу в транзисторных бюджетах. Жаль только, что универсальные программные инструменты для мониторинга и разгона видеокарт еще не получили доступ к датчикам питающего напряжения GPU, чтобы мы узнали, как смена техпроцесса подействовала на этот параметр.

Парадоксально, что NVIDIA раздала (избранным IT-изданиям, но тем не менее) комплекты для измерения мощности ускорителей именно в то время, когда ее потребительские устройства достигли беспрецедентно высоких TDP. Но может быть, в том-то и дело, что мы проверим мощность Ampere на практике и убедимся, что она не так страшна, как следует из его официальных ТТХ. Увы, по крайней мере Palit RTX 3080 GamingPro OC действительно расходует не меньше 314 из положенных по паспорту 320 Вт мощности. Единственная видеокарта, не считая «двухголовых» устройств, в нашей базе данных, которая превосходит по мощности RTX 3080, — это Radeon RX Vega 64 со штатной СЖО, а все предыдущие топ-модели NVIDIA (включая 250-ваттные RTX 2080 SUPER и RTX 2080 Ti) новинка оставила далеко позади.

При таком внушительном энергопотреблении и, следовательно, тепловыделении GPU нужно отдать должное системе охлаждения Palit. Температура в пределах 70 °C под нагрузкой еще не является признаком качества — просто именно так настроена автоматика кулера, а вот удержать уровень шума на отметке 38 дБА (ниже, чем у старших моделей Founders Edition прошлого поколения) куда сложнее.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 1854 1950 Н/Д Н/Д 1823 (46%) 1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт) +9% мощности 1940 2010 Н/Д Н/Д 1894 (48%) 1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 вместо графитовой прокладки 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Мы не питали больших надежд на оверклокинг GeForce RTX 3080, и, как показал опыт, видеокарта действительно не поддается разгону, который выражается в сколько-нибудь значимом приросте игрового быстродействия. Начнем с того, что прошивка Palit GamingPro OC позволяет лишь на 9 % увеличить резерв мощности платы, который является главным препятствием для наращивания тактовых частот графического процессора. А в рамках установленного TDP автоматика GPU Boost уже практически исчерпывает частотный потенциал. Нам удалось добавить 50 МГц к проектной частоте Boost Clock, что выражается в 85 МГц реальной тактовой частоты под игровой нагрузкой (5 % от исходных 1854 МГц). Надо ли говорить, что это капля в море, которая едва ли повлияет даже на самые чувствительные бенчмарки. К тому же оверклокинг графического ядра влечет за собой рост и без того чрезвычайно высокой потребляемой мощности на 19 Вт — к счастью, хотя бы без последствий для температуры и шума системы охлаждения.

Быть может, в GeForce RTX 3080 выгоднее разгонять оперативную память? Задел для оверклокинга чипов GDDR6X со штатной пропускной способностью 19 Гбит/с, которые применяются в GeForce RTX 3080, существует, но раскрыть его не так-то просто. Для того, чтобы найти предел стандартных чипов GDDR6 при неизменных таймингах, достаточно постепенно увеличивать тактовую частоту, пока видеокарта не потеряет стабильность или не появятся графические артефакты на экране. GDDR6X ведет себя коварно: поначалу мы смогли довести пропускную способность чипов до 21,8 Гбит/с на контакт, но скоро обнаружили, что чем дальше она уходит за пределы 21,2 Гбит/с, тем сильнее не возрастает, а, наоборот, падает производительность. Все дело в коррекции ошибок (ECC), свойственной этому типу памяти.

Кстати, GPU-Z и подобные программы некорректно определяют командную частоту GDDR6X на уровне 1 188 МГц, хотя на самом деле она вдвое выше. Если в будущем не исправят эту ошибку, привыкайте умножать число на 16, а не на 8, как с GDDR6, чтобы получить итоговую пропускную способность чипов.

#Игровые тесты (1920 × 1080)

Постоянные читатели железного раздела 3DNews наверняка заметили, что состав тестовой методики для новых GPU сильно изменился. Мы исключили из программы синтетическую нагрузку — как 3DMark в разделе игрового 3D-рендеринга, так и аналогичные тесты вычислений общего назначения. Да, 3DMark неплохо подходит для того, чтобы быстро оценить разницу между близкими по характеристикам видеокартами. Но когда речь идет о новом поколении графических процессоров, которое претендует на качественно иной уровень производительности, изучать «попугаи» в 3DMark не имеет никакого смысла. Он давно перестал быть альтернативой играм, основанным на разных графических движках и работающим с разными API, и порой изрядно расходится с действительностью в оценках GPU той или иной архитектуры. Бенчмарки с трассировкой лучей и масштабированием DLSS в 3DMark неплохо иллюстрировали возможности ускорителей GeForce RTX 20-й серии в их первые месяцы, но теперь вдобавок к играм, использующим богатые функции «гибридного» рендеринга, появились полностью трассированные модификации Quake II и Minecraft. В итоге мы решили упразднить тесты в 3DMark и вместо них расширить арсенал настоящих игр, который теперь наполовину состоит из проектов, поддерживающих трассировку лучей в том или ином объеме.

С другой стороны, нужно пояснить, почему в списке тестов отсутствуют некоторые игровые новинки 2020 года, отличившиеся высокими запросами к железу и на первый взгляд идеально подходящие для проверки таких устройств, как GeForce RTX 3080. Речь идет о Horizon Zero Dawn и Microsoft Flight Simulator, которым на 3DNews посвящены масштабные сравнительные тесты. Дело в том, что обе игры вышли на PC относительно недавно и пока не отличаются высокой стабильностью вообще и быстродействия в частности. Рисковать повторяемостью результатов бенчмарков ради того, чтобы тестовая методика состояла из самых свежих игр, мы не готовы, так что Horizon Zero Dawn и MSFS придется постоять в очереди, пока не закончится первая волна патчей, исправляющих ошибки.

Итак, приступим к анализу тестовых результатов в стартовом разрешении 1080p, которое, честно говоря, совершенно не подходит для того, чтобы раскрыть потенциал ускорителей класса GeForce RTX 3080. А жаль, ведь именно в таком режиме современное железо может развивать кадровую частоту свыше 100 FPS не только в легких киберспортивных играх, но и в требовательных ААА-проектах, что положительно сказывается на времени реакции — особенно на экране с высокой частотой. Недавно мы отдельно разбирали этот вопрос в ходе аппаратного тестирования задержек с помощью LDAT и пришли к выводу, что FPS полезно наращивать за пределы частоты обновления монитора, будь у вас даже сверхскоростная матрица 240 Гц. Увы, среди тестовых игр только DOOM Eternal и Strange Brigade являются таким счастливым исключением.

Тем не менее даже в таких условиях GeForce RTX 3080 обеспечивает существенную прибавку в 20 % усредненной кадровой частоты по сравнению с бывшим флагманом потребительских видеокарт NVIDIA, GeForce RTX 2080 Ti, а если сравнивать с RTX 2080 SUPER, речь идет от дополнительных 38 % FPS. Наконец, старшие модели позапрошлого поколения — GTX 1080 и GTX 1080 Ti — новинка превосходит на целых 110 и 67 % соответственно. Нечего и говорить о «красных» топах до предстоящего релиза чипов Navi второй волны: GeForce RTX 2080 одержал победу над Radeon VII и Radeon RX 5700 XT с преимуществом в 64 и 69 %.

Следующая страница → ← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
World of Warcraft исполнилось 20 лет — это до сих пор самая популярная ролевая игра в мире 4 мин.
Microsoft хочет, чтобы у каждого человека был ИИ-помощник, а у каждого бизнеса — ИИ-агент 4 ч.
«Атака на ближайшего соседа» сработала — хакеры удалённо взломали компьютер через Wi-Fi поблизости 5 ч.
Google Gemini сможет управлять приложениями без пользователя и даже не открывая их 8 ч.
Илон Маск отделался выплатой $2923 за неявку для дачи показаний по делу о покупке Twitter 10 ч.
Microsoft открыла доступ к скандальной ИИ-функции Recall — пользователям разрешили ограничить её «подглядывания» 15 ч.
Новая статья: Death of the Reprobate: что не так на картине? Рецензия 16 ч.
Главный конкурент OpenAI получил $4 млрд на развитие ИИ без следов Хуанга 17 ч.
Valve раскрыла часть игр, которые получат скидку на осенней распродаже Steam — официальный трейлер акции 18 ч.
Threads получила «давно назревавшие улучшения» в поиске и тренды 18 ч.
Eviden создаст для Финляндии ИИ-суперкомпьютер с производительностью 49 Пфлопс 14 мин.
Tesla признана самой опасной маркой машин — в этом есть и заслуга Илона Маска 2 ч.
iFixit не нашли улучшений ремонтопригодности у нового Apple MacBook Pro на чипе M4 Pro 3 ч.
Вселенское ДТП на скорости 3,2 млн км/ч — «Джемс Уэбб» пролил свет на столкновение галактик 3 ч.
Xiaomi 14T Pro, Xiaomi 14T и Redmi Note 13 Pro 5G — смартфоны с производительными процессорами и высококлассными камерами 4 ч.
Стартап Enfabrica выпустил чип ACF SuperNIC для ИИ-кластеров на базе GPU 4 ч.
«Аквариус» и «Группа Астра» представили ПАК облачной инфраструктуры Aquarius AIC 4 ч.
Bluetooth-колонки Tronsmart Halo 200, Mirtune S100 и Bang Max помогут превратить любую вечеринку в праздничное шоу 4 ч.
«Сбер» приобрёл долю в IT-компании «Аквариус» 6 ч.
Власти Индонезии считают, что Apple могла бы заплатить более $100 млн за возвращение iPhone на местный рынок 8 ч.