Оригинал материала: https://3dnews.kz/948821

Обзор и тестирование видеокарты NVIDIA GeForce GTX 1080 Ti: бой с тенью

Технические характеристики. Конструкция. Плата

NVIDIA применяет эту стратегию не в первый раз: когда происходит очередная смена техпроцесса или архитектуры графических процессоров, верхнюю позицию в новой линейке геймерских видеокарт какое-то время занимает устройство на чипе второго эшелона. Флагманский GPU сперва появляется в составе просьюмерского ускорителя под маркой TITAN, а затем, с теми или иными потерями вычислительных блоков и функций, доходит и до игровых моделей. Однако различия в технических характеристиках между очередным TITAN и очередным игровым флагманом на том же GPU в каждом поколении видеокарт уникальны.

В эпоху Kepler, которая породила первый «Титан» четыре года тому назад, GeForce GTX 780 и GTX TITAN были меньше всего похожи друг на друга. Помимо существенной разницы в наборе вычислительных блоков, игровая видеокарта получила вдвое меньше оперативной памяти и в восемь раз медленнее выполняла расчеты двойной точности (FP64). На базе архитектуры Maxwell NVIDIA уже не стала выпускать процессор, охватывающий одновременно графические задачи и вычисления двойной точности, поэтому GTX 980 Ti отличается от GeForce GTX TITAN X лишь объемом RAM и обладает практически эквивалентной производительностью в играх.

С приходом Pascal, впервые в своей истории, NVIDIA разделила GPU высшего эшелона на профессиональную и игровую категории. Переход на технологию 16 нм FinFET позволил выпустить процессор с беспрецедентным числом вычислительных блоков и уровнем быстродействия — GP100. Однако последний применяется лишь в ускорителях Quadro и Tesla, и вероятность увидеть его под маркой GeForce стремится к нулю. Альтернативный вариант «большого ядра», GP102, лишен архитектурных элементов и функций, важных для вычислительных задач, но вместе с тем не уступает GP100 в пропускной способности операций FP32, которые лежат в основе шейдерного кода 3D-приложений.

GP102 уже проявил себя в составе обновленного TITAN X, который, в неменьшей степени, чем игровой видеокартой, является ускорителем вычислений, приоритетом среди которых на этот раз стало применение моделей ИИ, созданных методом глубинного обучения (inference). Но, глядя на TITAN X, предсказать, каким окажется GTX 1080 Ti, было не так-то просто.

Дело в том, что NVIDIA не оставила себе большого пространства для маневра между GTX 1080 и TITAN X. Если судить по пиковой пропускной способности операций FP32 (что, разумеется, не является исчерпывающей характеристикой GPU), TITAN X лишь на 24% превосходит GeForce GTX 1080, в то время как разница между GTX 980 и GeForce GTX TITAN X по этому параметру составляла 35%. Если бы в поколении Pascal разработчики решили сколь-либо существенно сократить вычислительные ресурсы TITAN X, у NVIDIA получился бы довольно неубедительный флагман игровой линейки.

С другой стороны, в TITAN X ни частотный потенциал, ни набор функциональных блоков GP102 не раскрыты полностью, поэтому GeForce GTX 1080 Ti вполне мог оказаться быстрее, чем TITAN X, ведь NVIDIA когда-то поступила точно так же с GeForce GTX 780 Ti и первым TITAN. А в результате случилось нечто неожиданное: GeForce GTX 1080 Ti действительно урезали блоки GPU по сравнению с TITAN X, однако не те блоки, которых это обычно касается. Вместе с тем пиковая производительность GTX 1080 Ti, по крайней мере на бумаге, выше. Более того, у игровой видеокарты есть и другие, уже не столь очевидные преимущества.

GPU

Кристалл GP102, произведенный по норме 16 нм FinFET на мощностях TSMC, содержит 12 млрд транзисторов на площади 471 мм2. Параметры следующего по рангу чипа в линейке Pascal, GP104, намного скромнее — 7,2 млрд транзисторов и 314 мм2.

Однако структура вычислительных блоков GP102 повторяет таковую у чипа GP104, с учетом количественных изменений на высшем уровне архитектуры, так что весь дополнительный транзисторный бюджет в GP102 пошел на увеличение быстродействия в графике и иных вычислениях, опирающихся на формат данных FP32. Отдельно взятый SM (Streaming Multiprocessor) в GP102 и GP104 содержит 128 ядер CUDA для операций FP32, четыре FP64-совместимых ядра и одно ядро, способное выполнять две инструкции FP16 одновременно. Кроме того, в SM входят 40 блоков наложения текстур, 96 Кбайт разделяемой памяти и 48 Кбайт кеша L1.

Всего GP102 содержит 30 блоков SM, которые в сумме дают конфигурацию из 3840 ядер CUDA одинарной точности и 240 текстурников. Back-end конвейера представлен двенадцатью 32-битными контроллерами памяти GDDR5/5X (384-битная шина), с каждым из которых ассоциированы 8 ROP и секция кеша L2 объемом 256 Кбайт (3072 Кбайт на весь GPU).

Блок-схема NVIDIA GP102 в GeForce GTX 1080 Ti

По поводу отличий архитектуры Pascal от Maxwell рекомендуем обратиться к нашему обзору GeForce GTX 1080. В этой итерации разработчики развили достоинства предыдущего поколения и компенсировали присущие ему недостатки. Кратко перечислим наиболее существенные изменения:

  • улучшенная компрессия цвета с соотношениями вплоть до 8:1;
  • функция Simultaneous Multi-Projection геометрического движка PolyMorph Engine, позволяющая за один проход создавать вплоть до 16 проекций геометрии сцены (для VR и систем с несколькими дисплеями в конфигурации NVIDIA Surround);
  • возможность прерывания (preemption) в процессе исполнения draw call (при рендеринге) и потока команд (при вычислениях), которая вместе с динамическим распределением вычислительных ресурсов GPU обеспечивает полноценную поддержку асинхронных вычислений (Async Compute) — дополнительного источника быстродействия в играх под API DirectX 12 и сниженной латентности в VR;
  • контроллер дисплея, совместимый с интерфейсами DisplayPort 1.3/1.4 и HDMI 2.b. Поддержка высокого динамического диапазона (HDR);
  • шина SLI с повышенной пропускной способностью.

Добавим к этому списку технологию, которая была секретным ноу-хау последних архитектур NVIDIA, но вслед за независимым расследованием, результаты которого распространились в интернете, компания раскрыла свои карты. Помимо мощной компрессии цвета, Архитектуры Maxwell и Pascal используют разновидность тайлового рендеринга для экономии пропускной способности памяти (ПСП).

Классический тайловый рендеринг, широко распространенный в мобильных GPU, подразумевает обработку кадра в два прохода. Сначала драйвер разделяет экранное пространство на тайлы (участки с типичным размером 16 × 16 или 32 × 32 пиксела) и составляет индекс полигонов, находящихся в проекции каждого тайла. Затем последовательно в пределах каждого тайла целиком выполняется процедура рендеринга — от трансформации и пересечения полигонов до заполнения текстур и исполнения шейдеров — и конечный результат всех тайлов сшивается в единую картинку. Преимущество такого метода состоит в том, что любые промежуточные операции в пределах тайла оперируют единым массивом данных, который целиком помещается в кеш GPU, а следовательно, сокращается частота обращений к оперативной памяти.

Тем не менее, необходимость в двух проходах обработки геометрии сцены сама по себе расходует пропускную способность RAM, поскольку GPU необходимо сначала записать во внешнюю память информацию о полигонах, попадающих в тот или иной тайл, а затем, выполняя рендеринг от тайла к тайлу, извлекать ее обратно. Как следствие, эффективность тайлового рендеринга в конечном счете зависит от того, перевешивает ли экономия ПСП на скорости заполнения пикселов ее потери на двухпроходную проекцию геометрии. В мобильных приложениях, отличающихся простой геометрией, тайловый рендеринг оправдывает себя, но для современных десктопных игр лучше подходит стандартный метод мгновенного (immediate) рендеринга, при котором в едином экранном пространстве происходит последовательная растеризация одного полигона за другим.

В конвейере Maxwell и Pascal сочетаются лучшие черты обеих методов рендеринга. NVIDIA тоже использует тайлы, но в данном случае отрисовка кадров, как и в других десктопных архитектурах, не требует отдельной стадии сортировки (binning) всех полигонов, принадлежащих кадру, между тем или иным тайлом. Вместо этого GPU сначала целиком выполняет трансформацию геометрии сцены, а остальные этапы рендеринга происходят тайл за тайлом. При этом размер и количество тайлов, которые обрабатываются одновременно, определяется динамически по мере заполнения очереди геометрии фиксированной длины — таким образом, чтобы все данные помещались в кеш L2.

#Технические характеристики, цены

Как и TITAN X, GTX 1080 Ti не располагает полностью функциональной версией графического процессора. Производитель заблокировал два из 30 SM в GPU обеих видеокарт. Таким образом, front-end чипа и, следовательно, теоретическая пропускная способность в операциях за такт в GTX 1080 Ti ничуть не пострадали по сравнению с TITAN X. Однако в GTX 1080 Ti отключен один из 12 контроллеров RAM, а вместе с ним — 8 ROP и секция кеша L2. Как следствие, шина памяти GPU уменьшилась с 384 до 352 бит и видеокарта оснащается лишь 11 вместо 12 Гбайт GDDR5X.

Тем не менее GTX 1080 Ti отыграл потерянную пропускную способность RAM за счет увеличенной частоты шины — с 10 000 до 11 000 Мбит/с на контакт. Кроме того, NVIDIA подняла частоты GPU: базовую на 63 МГц и Boost Clock — на 51 МГц. Таким образом, единственным параметром, который дифференцирует GTX 1080 Ti от TITAN X в рендеринге графики, остается объем L2.

А что насчет вычислительных задач? Здесь, в отличие от игр, может возникнуть такая ситуация, когда дополнительный гигабайт RAM имеет значение. Удивительно другое: NVIDIA нисколько не ограничила скорость работы GTX 1080 Ti с различными форматами данных. GP102 и без того не подходит для «боевых» расчетов на основе данных FP64 и FP16 (скорость исполнения на уровне 1/32 и 1/64 от FP32), зато как TITAN X, так и GTX 1080 Ti выполняют за такт вчетверо больше операций int8 по сравнению с FP32. До появления GTX 1080 Ti только TITAN X в потребительской линейке NVIDIA поддерживал int8 — инструкции, применяемые для обработки данных моделями глубинного обучения.

ПроизводительNVIDIA
Модель GeForce GTX 980 Ti GeForce GTX TITAN X GeForce GTX 1080 GeForce GTX 1080 Ti TITAN X
Графический процессор
Название GM200 GM200 GP104 GP102 GP102
Микроархитектура Maxwell Maxwell Pascal Pascal Pascal
Техпроцесс, нм 28 нм 28 нм 16 нм FinFET 16 нм FinFET 16 нм FinFET
Число транзисторов, млн 8 000 8 000 7 200 12 000 12 000
Тактовая частота, МГц: Base Clock / Boost Clock 1 000 / 1 076 1 000 / 1 089 1 607 / 1 733 1 480 / 1582 1 417 / 1531
Число шейдерных ALU 2 816 3 072 2 560 3 584 3 584
Число блоков наложения текстур 176 192 160 224 224
Число ROP 96 96 64 88 96
Оперативная память
Разрядность шины, бит 384 384 256 352 384
Тип микросхем GDDR5 SDRAM GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM GDDR5X SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 753 (7 012) 1 753 (7 012) 1 250 (10 000) 1 376,25 (11 010) 1 250 (10 000)
Объем, Мбайт 6 144 12 288 8 192 11 264 12 288
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 6 060 6 691 8 873 11 340 10 974
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32
Пропускная способность оперативной памяти, Гбайт/с 336 336 320 484 480
Вывод изображения
Интерфейсы вывода изображения DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, Вт 250 250 180 250 250
Рекомендованная розничная цена (США, без налога), $ 649 (на момент выхода) 999 (на момент выхода) На момент выхода: 599 / 699 (FE) Новая цена: 499 / 549 (FE) 699 1 200
Рекомендованная розничная цена (Россия), руб. 39 990 (на момент выхода) 74 900 (на момент выхода) На момент выхода: 54 990 (FE) Новая цена: 45 790 (FE) 52 990 (FE) 89 990

GTX 1080 Ti и TITAN X разделяет довольно зыбкая граница, и это, с одной стороны, хорошая новость для энтузиастов, которые решили повременить с апгрейдом старой видеокарты на Pascal в ожидании топового ускорителя. С другой стороны, высокая производительность отражается на цене видеокарты. GTX 1080 Ti стал третьим однопроцессорным GeForce после GTX 780 Ti и GTX 1080 Founders Edition, достигшим отметки $699. Цена в российском онлайн-магазине компании составляет 52 990 руб. Кроме того, NVIDIA на этот раз не делает различий между видеокартой референсного дизайна (Founders Edition) и партнерскими образцами, которые появятся позже и получат точно такой же рекомендованный ценник.

В то же время NVIDIA сделала более доступными GeForce GTX 1070 и GTX 1080. На момент выхода последние были оценены в $379/449 и $599/699 (партнерские карты и Founders Edition соответственно), а теперь продаются за $349/399 и $499/549. Российские цены видеокарт на сайте NVIDIA снизились с 34 990 54 990 до 31 590 и 45 790 руб.

Вместе с тем NVIDIA объявила, что производители видеокарт получат возможность оснащать свои версии GeForce GTX 1060 и GTX 1080 более скоростными чипами GDDR5/5X: 9 вместо 8 Гбит/с для GTX 1060 и 11 вместо 10 Гбит/с — для GTX 1080. Референсные спецификации моделей при этом остались неизменными, просто у партнеров, закупающих у NVIDIA чипы памяти вместе с GPU для установки на собственные платы, появился выбор. Судя по тому, как редко мы видим на видеокартах оригинального дизайна микросхемы RAM, отличные от тех, которыми оснащаются референсные ускорители, такой ход NVIDIA действительно может сделать заводской разгон видеопамяти более распространенным явлением.

#Конструкция

Поскольку предтечей GeForce GTX 1080 Ti является TITAN X, не удивительно, что различия в облике видеокарт минимальны. GTX 1080 Ti отличается от полностью черного «Титана» стандартно-серебристым цветом кожуха, а внутри — точно такой же радиатор с испарительной камерой и вентилятор радиального типа. Эта конструкция хорошо зарекомендовала себя еще во времена первого TITAN и GeForce GTX 780/780 Ti. Обладая выдающимися акустическими характеристиками для данного типа системы охлаждения, референсные видеокарты NVIDIA выделяются среди партнерских устройств, т. к. последние практически всегда оснащаются кулером открытой конструкции. При этом закрытая «турбинка» остается лучшим вариантом для компактных ПК, где важно, чтобы видеокарта выбрасывала большую часть воздуха наружу. Кроме того, референсный кулер гарантирует охлаждение микросхем памяти и множества других горячих точек платы за счет массивного алюминиевого основания.

Начиная с GeForce GTX 1080, видеокарты NVIDIA, совместимые с режимом SLI, позволяют удалить часть металлической пластины, которой покрыта обратная сторона печатной платы, чтобы воздух свободно проникал к системе охлаждения соседней видеокарты.

Несмотря общую с TITAN X конструкцию системы охлаждения, у GTX 1080 Ti есть одна очевидная особенность: NVIDIA удалила порт DL-DVI с внешней панели видеокарты. Весь набор выходов, который остался на GTX 1080 Ti, ограничивается тремя разъемами DisplayPort 1.3/1.4 и одним HDMI 2.0b. Зато вся половина пластины теперь задействована для вывода горячего воздуха за пределы корпуса ПК, что должно положительно сказаться на эффективности охлаждения. Для тех, кто все еще пользуется монитором без разъемов DisplayPort или HDMI, NVIDIA прилагает к GeForce GTX 1080 Ti Founders Edition переходник с интерфейса DP на Single-Link DVI.

#Плата

Как и система охлаждения, оснастка печатной платы GeForce GTX 1080 Ti не только не ухудшилась по сравнению с TITAN X, но и стала лучше. Повышенная пропускная способность оперативной памяти в GTX 1080 Ti достигнута за счет новых чипов Micron (маркировка MT58K256M321JA-110), для которых эффективная частота 11 Гбайт/с является штатной. К слову, в каталоге Micron есть и память GDDR5X с частотой 12 Гбайт/с, но, выбрав наиболее скоростные чипы, NVIDIA, вероятно, пришлось бы исчерпать резерв надежности контроллеров RAM в составе GPU.

Что остается неизменным в преобразователе напряжения видеокарт NVIDIA, так это ШИМ-контроллер uP9511 от uPI Semiconductor, который на GTX 1080 Ti обслуживает максимальное для своих возможностей число фаз — семь, все из которых принадлежат схеме питания GPU. Две фазы чипов GDDR5X управляются контроллером uP1685. Однако и в силовой части видеокарты есть изменения. NVIDIA поместила на печатную плату ряд элементов, которые отсутствовали в TITAN X, в первую очередь — удвоила все полевые транзисторы в «фазах» питания GPU, что должно положительно отразиться на КПД преобразователя.

Производительность: 3DMark. Производительность: игры

#Тестовый стенд, методика тестирования

Конфигурация тестовых стендов
CPU Intel Core i7-5960X @ 4 ГГц (100 МГц × 40), постоянная частота
Материнская плата ASUS RAMPAGE V EXTREME
Оперативная память Corsair Vengeance LPX, 2133 МГц, 4 × 4 Гбайт
ПЗУ Intel SSD 520 240 Гбайт + Crucial M550 512 Гбайт
Блок питания Corsair AX1200i, 1200 Вт
Система охлаждения CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Монитор NEC EA244UHD
Операционная система Windows 10 Pro x64
ПО для GPU AMD
Все видеокарты Radeon Software Crimson ReLive Edition 17.3.1 (Tesselation: Use application settings)
ПО для GPU NVIDIA
Все видеокарты GeForce Game Ready Driver 378.78 WHQL

Бенчмарки: синтетические
Тест API Разрешение Полноэкранное сглаживание
3DMark Fire Strike DirectX 11 (feature level 11_0) 1920 × 1080 Выкл.
3DMark Fire Strike Extreme 2560 × 1440
3DMark Fire Strike Ultra 3840 × 2160
3DMark Time Spy DirectX 12 (feature level 11_0) 2560 × 1440
Бенчмарки: игры
Игра (в порядке даты выхода) API Настройки Полноэкранное сглаживание
1920 × 1080 / 2560 × 1440 3840 × 2160
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Swamp MSAA 4x Выкл.
Metro: Last Light Redux, встроенный бенчмарк Макс. качество SSAA 4x
GTA V, встроенный бенчмарк Макс. качество MSAA 4x + FXAA + Reflection MSAA 4x
DiRT Rally, встроенный бенчмарк Макс. качество MSAA 4x
Rise of the Tomb Raider, встроенный бенчмарк DirectX 12 Макс. качество, VXAO выкл. SSAA 4x
Tom Clancy's The Division, встроенный бенчмарк Макс. качество, HFTS выкл. SMAA 1x Ultra + TAA: Supersampling TAA: Stabilization
Ashes of the Singularity, встроенный бенчмарк Макс. качество MSAA 4x + TAA 4x Выкл.
DOOM Vulkan Макс. качество. Миссия Foundry TSSAA 8TX
Total War: WARHAMMER, встроенный бенчмарк DirectX 12 Макс. качество MSAA 4x
Deus Ex: Mankind Divided, встроенный бенчмарк Макс. качество MSAA 4x
Battlefield 1 + OCAT Макс. качество. Начало миссии Through Mud and Blood TAA
Бенчмарки: декодирование видео, вычисления
Программа Настройки
DXVA Checker, Decode Benchmark, H.264 Файлы 1920 × 1080p (High Profile, L4.1), 3840 × 2160p (High Profile, L5.1). Microsoft H264 Video Decoder
DXVA Checker, Decode Benchmark, H.265 Файлы 1920 × 1080p (Main Profile, L4.0), 3840 × 2160p (Main Profile, L5.0). Microsoft H265 Video Decoder
LuxMark 3.1 x64 Сцена Hotel Lobby (Complex Benchmark)
Sony Vegas Pro 13 Бенчмарк Sony для Vegas Pro 11, продолжительность — 65 с, рендеринг в XDCAM EX, 1920 × 1080p 24 Гц
SiSoftware Sandra 2016 SP1, GPGPU Scientific Analysis Open CL, FP32/FP64
CompuBench CL Desktop Edition X64, Ocean Surface Simulation
CompuBench CL Desktop Edition X64, Particle Simulation— 64K

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

#Производительность: 3DMark

Синтетические тесты игнорируют пропажу одного гигабайта памяти в GeForce GTX 1080 Ti, зато чувствительны к тактовой частоте GPU. Как следствие, в различных тестах либо GTX 1080 Ti и TITAN X эквивалентны по набранным очкам, либо GTX 1080 Ti имеет несущественное преимущество в 1–3%.

Какую бы из прочих однопроцессорных игровых видеокарт мы ни взяли для сравнения с GTX 1080 Ti, последний демонстрирует совершенно иной уровень быстродействия. Новый флагман в среднем на 32% опережает GTX 1080 в 3DMark, а в случае с GeForce GTX 980 Ti и Radeon R9 Fury X преимущество GTX 1080 Ti достигает 70% и 75%.

3DMark (Graphics Score)
Разрешение NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт) 0
Fire Strike 1920 × 1080 28 003 17 115 21 694 27 987 16 279 0
Fire Strike Extreme 2560 × 1440 13 453 7 928 10 264 13 520 7 745 0
Fire Strike Ultra 3840 × 2160 6 594 4 042 5 001 6 557 3 942 0
Time Spy 2560 × 1440 9 480 5 106 7 111 9 149 5 084 0
Макс. −39% −23% +0% −40% −100%
Среднее −41% −24% −1% −43% −100%
Мин. −46% −25% −3% −46% −100%

Производительность: игры (1920 × 1080, 2560 × 1440, 3840× 2160)

Тесты в реальных играх рисуют более сложную картину сравнения GeForce GTX 1080 Ti и TITAN X. Во всех разрешениях новинка имеет среднее преимущество в 2%. При этом между двумя картами подчас нет разницы даже в 1 FPS, а редкие примеры победы TITAN X как раз и сводятся к одному кадру в секунду сверх результата GTX 1080 Ti, что явно укладывается в случайные колебания замеров производительности. Тем не менее есть игра, которая отдает явное предпочтение GTX 1080 Ti, — Tom Clancy’s The Division. В ней преимущество GTX 1080 Ti составляет от 8 до 10%.

По сравнению с GTX 1080 новый флагман обеспечивает на 25–33% более высокую частоту смены кадров, но максимальная разница наблюдается при высоких разрешениях — от 1440p до 2160p. Вычислительная мощность топовых игровых видеокарт настолько велика, что в режиме 1080p важным фактором становится быстродействие CPU. Кроме того, DOOM уже достигает установленного в этой игре предела частоты смены кадров — 200 FPS — на обоих ускорителях.

Преимущество GTX 1080 Ti перед GTX TITAN X на базе архитектуры Maxwell в играх поменьше, чем в «синтетике», но по-прежнему чрезвычайно велико — от 54 до 67% в зависимости от разрешения. Radeon R9 Fury X, напротив, оказался еще более легким соперником, ведь против ускорителя AMD играет небольшой объем оперативной памяти (4 Гбайт). В результате если в режиме 1080p GTX 1080 Ti обеспечивает на 70% более высокую частоту смены кадров, то в 1440p и 2160p разница возрастает до 82 и 96%.

Отдельное внимание уделим результатам GTX 1080 Ti в 4К. Только видеокарты NVIDIA на базе GP102 на данный момент безоговорочно подходят для игры при таком разрешении с максимальными настройками качества графики (пусть и без полноэкранного сглаживания ресурсоемкими методами). В большинстве игр из нашей тестовой обоймы средняя частота смены кадров превышает 50–60 FPS и лишь в Deus Ex: Mankind Divided падает существенно ниже этого уровня.

1920 × 1080
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 58 45 45 55 32
Battlefield 1 TAA 144 90 118 140 92
Crysis 3 MSAA 4x 112 66 79 110 61
Deus Ex: Mankind Divided MSAA 4x 53 30 38 52 34
DiRT Rally MSAA 4x 128 84 101 124 66
DOOM TSSAA 8TX 200 151 200 200 156
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 91 67 84 91 54
Metro: Last Light Redux SSAA 4x 122 74 92 121 70
Rise of the Tomb Raider SSAA 4x 85 47 63 84 43
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 127 67 94 116 61
Total War: WARHAMMER MSAA 4x 77 59 71 78 51
Макс. −23% +0% +1% −22%
Среднее −35% −19% −2% −41%
Мин. −47% −29% −9% −52%
2560 × 1440
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 47 34 34 47 26
Battlefield 1 TAA 111 65 89 108 60
Crysis 3 MSAA 4x 72 41 53 70 40
Deus Ex: Mankind Divided MSAA 4x 34 19 25 34 20
DiRT Rally MSAA 4x 96 61 73 93 49
DOOM TSSAA 8TX 177 100 136 175 107
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 78 48 63 78 40
Metro: Last Light Redux SSAA 4x 72 44 52 69 42
Rise of the Tomb Raider SSAA 4x 51 29 38 52 27
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 91 49 66 83 47
Total War: WARHAMMER MSAA 4x 64 40 49 64 35
Макс. −28% −19% +2% −40%
Среднее −40% −25% −2% −45%
Мин. −46% −28% −9% −49%

3840 × 2160
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX TITAN X (1000/7012 МГц, 12 Гбайт) NVIDIA GeForce GTX 1080 (1607/10008 МГц, 8 Гбайт) NVIDIA TITAN X (1417/10000 МГц, 12 Гбайт) AMD Radeon R9 Fury X (1050/1000 МГц, 4 Гбайт)
Ashes of the Singularity Выкл. 57 44 44 58 35
Battlefield 1 64 40 54 64 17
Crysis 3 50 31 36 47 28
Deus Ex: Mankind Divided 38 21 28 36 13
DiRT Rally 66 41 50 64 33
DOOM 97 54 75 97 57
GTA V 70 41 52 68 34
Metro: Last Light Redux 64 39 47 61 38
Rise of the Tomb Raider 61 35 44 61 31
Tom Clancy's The Division TAA: Stabilization 54 29 39 50 32
Total War: WARHAMMER Выкл. 52 31 39 52 32
Макс. −23% −16% +3% −38%
Среднее −40% −25% −2% −49%
Мин. −46% −28% −7% −73%

Производительность: декодирование видео, вычисления. Тактовые частоты, энергопотребление, температура, разгон. Выводы

Производительность: декодирование видео

Чипы семейства Pascal оснащаются одним и тем же мультимедийным блоком, производительность которого зависит исключительно от тактовой частоты GPU. Как следствие, по скорости декодирования видео форматов H.264 и HEVC между топовыми «зелеными» видеокартами нет практически значимых различий. В этой дисциплине Pascal продвинулся далеко вперед по сравнению с прошлыми видеокартами, особенно GeForce GTX TITAN X, который, в отличие от GTX 960 и 950, не умеет полностью аппаратно декодировать HEVC и перекладывает часть работы на CPU. AMD тоже, хоть и улучшила производительность своего кодека в H.264, не может на равных соперничать с Pascal.

Прим.: поскольку в пределах одной линейки GPU декодеры обычно не различаются, в диаграммах приведено по одному устройству из каждого семейства (или больше в том случае, если это правило нарушается).

#Производительность: вычисления

Результаты вычислительных тестов, в отличие от игр, далеко не столь однородны. Слишком многое зависит от специфики приложений, в которых приоритет имеют разные характеристики ускорителя: количество шейдерных ALU, тактовая частота, объем и пропускная способность памяти. Из всех задач TITAN X оказался быстрее GTX 1080 Ti лишь в трассировке лучей в LuxMark и математических функциях SiSoft Sandra. В остальных тестах либо между TITAN X и GTX 1080 Ti нет разницы, либо преимущество на стороне последнего. Есть и разновидности нагрузки, которые по-прежнему лучше всего ложатся на архитектуру AMD. Рендеринг ролика в Sony Vegas 13 Pro и симуляция водной поверхности в CompuBench CL отдают предпочтение Radeon R9 Fury X.

#Тактовые частоты, энергопотребление, температура, разгон

По частотному режиму и профилю работы системы охлаждения GeForce GTX 1080 Ti отличается от TITAN X. В тесте Crysis 3 частота GPU новинки колеблется от 1734 до 1772 МГц, а предельное значение даже выше, чем у GTX 1080: 1873 МГц против 1860 МГц. У TITAN X зона типичных частот под нагрузкой, судя по нашим замерам, располагается ниже: 1557–1671 МГц.

При этом, естественно, GTX 1080 Ti нуждается в более эффективном отводе тепла от GPU. Помимо того, что в обеих видеокартах целевая температура по умолчанию увеличена на 3 °C по сравнению с GTX 1080 (85 против 82 °С), GTX 1080 Ti раскручивает вентилятор до более высоких оборотов, чем TITAN X (2628 против 2472 об/мин). Неспроста NVIDIA удалила порт DVI у GTX 1080 Ti, чтобы облегчить выход горячего воздуха. Максимальное напряжение питания для GP102 тоже превышает таковое для GP104: 1,062 и 1,05 В соответственно.

По мощности GTX 1080 Ti и TITAN X одинаковы с практической точки зрения, пусть система в комплекте с последним потребляет на 7 Вт меньше под игровой нагрузкой, что объясняется более низкими частотами GPU и RAM. Как GTX 1080, так и флагманы предыдущего поколения (GeForce GTX TITAN X и Radeon R9 Fury X), а в особенности — GeForce GTX 1080, являются более экономичными видеокартами.

Для разгона GTX 1080 Ti мы увеличили максимальное напряжение питания GPU до 1,093 В, запустили вентилятор СО на максимальной скорости (4815 об/мин) и в результате добились стабильной работы чипа на базовой частоте 1600 МГц. Образец TITAN X, который мы тестировали ранее, разогнался до 1617 МГц, но эту разницу можно смело списать на качество отдельных кристаллов GPU. Чипы памяти с более высокой штатной частотой впервые в нашей практике покорили отметку 12 ГГц. При этом средняя частота GPU, которую видеокарта поддерживала в играх, составила 1974 МГц, а максимальная — 2025 МГц. Между прочим, пиковая частота графического процессора в наших экспериментах с разгоном GTX 1080 была ненамного выше — 2126 МГц.

Любопытно сравнить разогнанные GeForce GTX 1080 Ti и TITAN X по температуре и энергопотреблению. Пусть незначительно с практической точки зрения, но у GTX 1080 Ti эти параметры ниже, при том что высокая частота RAM на GTX 1080 Ti перекрывает разницу в частотах разогнанного GPU. Заслуга в этом принадлежит усиленной системе питания и охлаждения новой карты.

#Производительность: разгон

Эффект от разгона GeForce GTX 1080 Ti не столь велик, как в случае с TITAN X, ведь графический процессор здесь изначально работает на более высоких частотах. Тем не менее оверклокинг принес дополнительные 10% очков в 3DMark, а в играх частота смены кадров возросла на 7–12% в зависимости от разрешения (чем оно выше, тем больше разница).

3DMark (Graphics Score)
Разрешение NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Fire Strike 1920 × 1080 28 003 30 571
Fire Strike Extreme 2560 × 1440 13 453 14 882
Fire Strike Ultra 3840 × 2160 6 594 7 334
Time Spy 2560 × 1440 9 480 10 515
Макс. +11%
Среднее +10%
Мин. +9%
1920 × 1080
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 58 63
Battlefield 1 TAA 144 154
Crysis 3 MSAA 4x 112 120
Deus Ex: Mankind Divided MSAA 4x 53 59
DiRT Rally MSAA 4x 128 139
DOOM TSSAA 8TX 200 200
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 91 93
Metro: Last Light Redux SSAA 4x 122 137
Rise of the Tomb Raider SSAA 4x 85 92
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 127 140
Total War: WARHAMMER MSAA 4x 77 77
Макс. +13%
Среднее +7%
Мин. +0%
2560 × 1440
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity MSAA 4x + TAA 4x 47 51
Battlefield 1 TAA 111 112
Crysis 3 MSAA 4x 72 80
Deus Ex: Mankind Divided MSAA 4x 34 38
DiRT Rally MSAA 4x 96 103
DOOM TSSAA 8TX 177 197
GTA V MSAA 4x + FXAA + Reflection MSAA 4x 78 84
Metro: Last Light Redux SSAA 4x 72 80
Rise of the Tomb Raider SSAA 4x 51 57
Tom Clancy's The Division SMAA 1x Ultra + TAA: Supersampling 91 101
Total War: WARHAMMER MSAA 4x 64 71
Макс. +12%
Среднее +9%
Мин. +1%
3840 × 2160
Полноэкранное сглаживание NVIDIA GeForce GTX 1080 Ti (1480/11010 МГц, 11 Гбайт) NVIDIA GeForce GTX 1080 Ti (1600/12310 МГц, 11 Гбайт)
Ashes of the Singularity Выкл. 57 63
Battlefield 1 64 75
Crysis 3 50 55
Deus Ex: Mankind Divided 38 42
DiRT Rally 66 73
DOOM 97 110
GTA V 70 75
Metro: Last Light Redux 64 72
Rise of the Tomb Raider 61 69
Tom Clancy's The Division TAA: Stabilization 54 61
Total War: WARHAMMER Выкл. 52 57
Макс. +17%
Среднее +12%
Мин. +6%

#Выводы

Вопреки тому, как NVIDIA поступала с топовыми GPU в прошлых поколениях ускорителей, на этот раз, кажется, сделано все, чтобы GeForce GTX 1080 Ti не только не уступал TITAN X в производительности, но и получил дополнительные преимущества. Графический процессор GTX 1080 Ti понес определенные потери в наборе функциональных блоков по сравнению с GPU в составе TITAN X, который также не является полностью разблокированным. Но отсутствие одного контроллера RAM, восьми ROP и одного из 12 Гбайт памяти практически незаметно в играх и полностью компенсируется небольшим увеличением тактовых частот GPU и новыми чипами GDDR5X, работающими на эффективной частоте 11 ГГц. Как ни странно, даже расчетные возможности GP102 в GTX 1080 Ti не пострадали: видеокарта может агрегировать четыре операции над данными int8 за один такт 32-битного CUDA-ядра — точно так же, как и TITAN X, для которого, как ускорителя работы предварительно натренированных сетей глубинного обучения, это является одной из приоритетных функций.

Таким образом, небольшой компромисс в спецификациях GeForce GTX 1080 Ti выглядит скорее попыткой снизить себестоимость видеокарты, нежели дифференцировать ее от TITAN X. Более того, NVIDIA усовершенствовала «физические» параметры платы — эффективность охлаждения и КПД системы питания, в итоге лишив TITAN X остатков практической ценности. Последний, при цене на $500 выше, может подарить покупателю лишь моральное удовлетворение от владения немного более мощным GPU. На долю TITAN X также остаются специфические сценарии расчетных задач, в которых абсолютно необходимо иметь 12 Гбайт RAM.

Похоже, NVIDIA согласна пожертвовать TITAN X, чтобы в уже недалеком будущем дать решительный бой архитектуре Vega от AMD, которая возродит соревнование в верхнем сегменте игровых видеокарт. Не исключено, что вскоре появится и обновленная версия TITAN X на базе GP102, которая получит полностью функциональную версию GPU, а может, и «большой Pascal» — GP100 — все-таки найдет дорогу в просьюмерские устройства.

Что бы ни произошло в будущем, сейчас NVIDIA все еще наслаждается отсутствием конкуренции среди топовых видеоускорителей и GeForce GTX 1080 Ti можно сравнивать лишь с его предшественниками на лидерском посту — GTX 980 Ti (GTX TITAN X) и GeForce GTX 1080. Судя по нашим тестам, семейство Pascal получило лучший флагман, нежели Maxwell. GTX 1080 Ti обеспечивает на 25–33% более высокую частоту смены кадров в играх по сравнению с картой классом ниже (GTX 1080), чем не мог похвастаться GTX 980 Ti. В итоге те геймеры, которым GTX 1080 в свое время не показался убедительным предложением, могут решиться на апгрейд, даже если замене подлежит некогда могучий GTX TITAN X, который GTX 1080 Ti опережает на 54 –67%.

GTX 1080 Ti стал первым GeForce, который безоговорочно подходит для игры в разрешении 4К — цель, к которой безуспешно стремились видеокарты начиная с GeForce GTX 780 Ti и Radeon R9 290X. До GTX 1080 Ti с такой задачей мог справиться только TITAN X или пара GTX 1070/1080 в режиме SLI, но низкая цена флагмана по сравнению с TITAN X делает его более выгодным решеним, лишенным всех издержек многопроцессорных конфигураций.



Оригинал материала: https://3dnews.kz/948821