Итоги 2020 года: игровые видеокарты / Видеокарты

Несмотря на пандемию и экономические потрясения, компьютерная индустрия хотя бы в чем-то развивается по плану. Например, у производителей дискретных GPU настал очередной цикл полного обновления кремниевой базы. Чипы предыдущего поколения еще надолго задержатся в категории бюджетных видеокарт и мобильной графики, но верхушку модельного ряда NVIDIA уже полностью заменила свежими продуктами на базе архитектуры Ampere. Что касается AMD, то до появления устройств серии Radeon RX 6000 в каталоге «красных» решений и не было полноценного high-end’а, а предыдущая решительная попытка составить конкуренцию «зеленым» в верхнем сегменте быстродействия (Radeon VII) обернулась очередным разочарованием. Теперь же, спустя пять лет после Radeon R9 Fury (X), рынок ускорителей игровой графики наконец пришел в нормальное состояние, когда у покупателей появился выбор между марками GeForce и Radeon в любом ценовом диапазоне.

Впрочем, кого мы обманываем? В условиях строжайшего дефицита, который поразил все новое железо, NVIDIA и AMD пока могут соревноваться разве что за симпатии экспертов и энтузиастов. Однако шквальный спрос на ускорители GeForce 30-й серии и Radeon RX 6000 говорит о том, что осенние новинки определенно удались. Давайте резюмируем достижения чипмейкеров в этом году, но самое интересное оставим на десерт и будем двигаться в хронологическом порядке.

⇡#Radeon RX 5600 XT

Прошедший год не сравнится с рекордным 2019-м по количеству и многообразию представленных графических ускорителей (чего, естественно, не скажешь о качественных изменениях, которые произошли в верхнем ценовом сегменте). Поэтому не видим никаких причин, чтобы проигнорировать единственное важное пополнение в совокупном ряду устройств AMD и NVIDIA, помимо дебютантов GeForce 30-го семейства и Radeon RX 6000. Вдобавок к Radeon RX 5600 XT AMD выпустила для сборщиков систем самую младшую модель 5000-й серии, RX 5300. В свою очередь, под маркой NVIDIA появились несколько разновидностей GeForce GTX 1650, отличающихся от оригинальной версии памятью GDDR6. Но все перечисленные бюджетные новинки нельзя причислить к решениям, подходящим для современных игр, — у них слабые GPU и небольшой объем VRAM.

SAPPHIRE PULSE Radeon RX 5600 XT

Про Radeon RX 5600 XT этого не скажешь. Даже теперь, когда передовые решения AMD и NVIDIA подняли планку быстродействия на новую высоту, а требовательные игры — такие как Cyberpunk 2077 или Microsoft Flight Simulator — вновь срезали избыток кадровых частот даже на самом мощном железе, RX 5600 XT выдерживает конкуренцию среди видеокарт, ориентированных на разрешение 1080p. Ускорители для игры в этом режиме — самые востребованные, и даже устройства класса Radeon RX 5700 XT, которые были нацелены на 1440p в начале своей карьеры, уже покупают для того, чтобы гарантировать уверенный фреймрейт не меньше 60 FPS в народном 1080p. Топовые модели для 4К-экранов остаются статусными продуктами, да и, по правде говоря, запросы игр снова обгоняют возможности GPU в ультравысоком разрешении, особенно если речь идет о трассировке лучей без компромиссных решений масштабирования кадра наподобие DLSS или FidelityFX CAS.

AMD редко выпускает на основе одного и того же GPU больше двух розничных моделей в рамках одной продуктовой линейки, но для Radeon RX 5600 XT пришлось сделать исключение — позаимствовать кристалл Navi 10 у Radeon RX 5700 (XT) и в очередной раз урезать его вычислительные блоки. Тем не менее RX 5600 XT полностью воспроизводит конфигурацию Radeon RX 5700, за исключением суженной с 256 до 192 бит шины оперативной памяти. Последнее значит, что у видеокарты осталось всего лишь 6 Гбайт VRAM, но справедливости ради стоит отметить, что это же относится ко всем разновидностям его ближайшего соперника — GeForce GTX 1660.

Radeon RX 5600 XT заполнил широкий промежуток, образовавшийся между Radeon RX 5700 (XT) и двумя модификациям Radeon RX 5500 XT, которые AMD выпустила ранее, вступив в прямое противостояние с GeForce GTX 1660 Ti. Но в итоге истинным конкурентом Radeon RX 5600 XT стал вовсе не GeForce GTX 1660 Ti, а удешевленный, но почти столь же производительный GTX 1660 SUPER. Кроме того, NVIDIA парировала анонс Radeon RX 5600 XT скидкой на GeForce RTX 2060. Все эти видеокарты находятся в довольно тесном диапазоне быстродействия и не предполагают колебаний в объеме оперативной памяти.

Хотя Radeon RX 5600 XT без труда выполнил свою первоначальную миссию в бенчмарках против GeForce GTX 1660 Ti, более доступный GTX 1660 SUPER и дисконтированный GeForce RTX 2060 поставили новинку в незавидное положение. Однако урезанные спецификации всегда можно откатить назад в изменившихся конкурентных условиях. Так и поступила AMD в ответ на удешевление GeForce RTX 2060, санкционировав агрессивный заводской разгон партнерских версий Radeon RX 5600 XT, который выражается в увеличенном резерве мощности и повышенных тактовых частотах. Оверклокинг — не важно, официальный или силами пользователя — расходует лишь небольшую долю частотного потенциала Navi 10, но при этом способен вывести RX 5600 XT прямо на уровень RTX 2060. Разумеется, продукты AMD 5000-й серии не допущены к графическим эффектам на основе трассировки лучей, но и GeForce RTX 2060 трудно освоить передовые игры (такие как Cyberpunk 2077) на максималках и с рейтрейсингом даже при помощи DLSS.

Производитель	AMD
Модель	Radeon RX 5500 XT	Radeon RX 5600 XT	Radeon RX 5700	Radeon RX 5700 XT	Radeon RX 5700 XT Anniversary Edition
Графический процессор
Название	Navi 14 XTX	Navi 10 XLE	Navi 10 PRO	Navi 10 XT	Navi 10 XT
Микроархитектура	RDNA	RDNA	RDNA	RDNA	RDNA
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET	7 нм FinFET
Число транзисторов, млн	6 400	10 300	10 300	10 300	10 300
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock	1 607/1 717/1 845	1 130/1 375/1 560	1 465/1 625/1 725	1 605/ 1755/1 905	1 680/1 830/1 980
Шейдерные ALU FP32	1 408	2 304	2 304	2 560	2 560
Блоки наложения текстур (TMU)	88	144	144	160	160
Блоки операций растеризации (ROP)	32	64	64	64	64
Оперативная память
Разрядность шины, бит	128	192	256	256	256
Тип микросхем	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 750 (14 000)	1 500 (12 000)	1 750 (14 000)	1 750 (14 000)	1 750 (14 000)
Объем, Мбайт	4 096/8 192	6 144	8 096	8 096	8 096
Шина ввода/вывода	PCI Express 4.0 x8	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	5 196	7 188	7 949	9 754	10 138
Производительность FP64/FP32	1/16	1/16	1/16	1/16	1/16
Производительность FP16/FP32	2/1	2/1	2/1	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	224	288	448	448	448
Вывод изображения
Интерфейсы вывода изображения	DL DVI-D, DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b	DisplayPort 1.4, HDMI 2.0b
TBP/TDP, Вт	130	150	185	225	235
Розничная цена (США, без налога), $	4 Гбайт: 169 8 Гбайт: 199 (рекоменд. на дату выхода)	279 (рекоменд. на дату выхода)	349 (рекоменд. на дату выхода)	399 (рекоменд. на дату выхода)	449 (рекоменд. на дату выхода)
Розничная цена (Россия), руб.	4 Гбайт: 12 999 8 Гбайт: 14 299 (рекоменд. на дату выхода)	20 990 (рекоменд. на дату выхода)	25 499 (рекоменд. на дату выхода)	29 499 (рекоменд. на дату выхода)	Н/Д

В итоге Radeon RX 5600 XT по сей день остается актуальным предложением в своей ценовой категории (около 30 тыс. руб.). В разговоре о других новинках 2020 года мы будем оперировать более стабильными долларовыми ценами, но в данном случае удобнее рубли. Дело в том, что «красные» видеокарты серии Radeon RX 5000 под Новый год смели с американских торговых площадок, а у нас они по-прежнему широко доступны. Остальные модели 5000-й серии также не спешат уходить с рынка, ведь новейшие устройства Radeon RX 6000 пока заменили лишь верхушку каталога AMD.

⇡#NVIDIA GeForce RTX 30: старшие модели

Релиз видеокарт на чипах Turing, которые первыми среди потребительских устройств освоили аппаратное ускорение трассировки лучей, был событием исторического масштаба для самого чипмейкера и игровой 3D-графики в целом. Однако технологический прорыв и, не в последнюю очередь, усугубляющееся отставание AMD дали NVIDIA возможность повысить розничные цены. Основные усилия разработчиков Turing были направлены на расширение функций рендеринга при помощи аппаратного рейтрейсинга и обработки данных нейросетями, но в проектах без трассировки производительность на доллар у GeForce RTX 20-й серии в лучшем случае не изменилась по сравнению с предшествующим поколением. Последнее отлично проиллюстрировали результаты нашего исторического тестирования видеокарт, начиная с моделей 2013 года и заканчивая GeForce 20. Наконец, потенциал инновационных технологий далеко не всегда раскрывается в продуктах первого поколения, и по новейшим играм хорошо видно, что младшие модели RTX 20 уже с трудом тянут рейтрейсинг на максималках.

В следующей, 30-й серий GeForce RTX производитель решил исправить сложившуюся ситуацию. Одним предложением новинки можно охарактеризовать так: они получили в 2,5–3 раза больше FP32-совместимых CUDA-ядер, блоки для трассировки лучей второго поколения, и все это доступно за те же деньги, которых стоили непосредственные предшественники свежих моделей. Разумеется, речь идет о рекомендованных ценах. Все новое железо, появившееся осенью прошлого года, до сих пор в большом дефиците и продается по откровенно завышенным ценам.

NVIDIA GeForce RTX 3080 и RTX 3090 Founders Edition

В отличие от Turing, следующая итерация архитектуры NVIDIA, Ampere, в большей степени ориентирована на чистый рост производительности, нежели на функциональные усовершенствования. Тем не менее инженеры NVIDIA не просто раздули чипы Turing еще на несколько миллиардов транзисторов. В логике Ampere есть ряд интересных нововведений, о которых мы подробно писали в осенней аналитической статье, а сегодня кратко резюмируем самую важную информацию.

Пока NVIDIA выпустила лишь два кристалла Ampere потребительской категории — GA102 и GA104. Благодаря тому, что набор 32-битных CUDA-ядер, обрабатывающих вещественные числа, внутри потоковых мультипроцессоров GPU был удвоен, формула главных исполнительных блоков GA102 включает поражающее воображение количество шейдерных ALU — 10 496 FP32 (да и у GA104 их 6144 штуки, а это все еще больше по сравнению с показателем флагманского кристалла семейства Turing). Процессор состоит ни много ни мало из 28 млрд транзисторов — такой компонентный бюджет NVIDIA может себе позволить благодаря миграции с 12-нм техпроцесса TSMC на самсунговский 8-нм.

Графический процессор NVIDIA GA102

Запас сырой вычислительной мощности совсем не помешает в новейших играх со сложными трассированными эффектами, которые чрезвычайно сильно усложняют шейдерные операции. Но одновременно с этим NVIDIA внесла изменения в специализированную логику, выполняющую собственно трассировку лучей в пределах геометрии кадра. Первая итерация данной архитектуры имеет свои ограничения, связанные с тем, что RT-ядро в процессе трассировки отдельно взятого луча сначала ищет лежащий на пути полигон, а уже затем вычисляет координаты пересечения с поверхностью. RT-ядро Ampere может делать и то и другое одновременно с двумя разными лучами. Кроме того, в Ampere появилась функция аппаратно ускоренного размытия в движении, хотя она полезнее программам для профессиональной визуализации, чем играм.

Тензорные блоки Ampere обрели поддержку структурно-разреженных матриц, которые позволяют существенно увеличить пропускную способность тензорных ядер, хотя в первую очередь это касается опять-таки вычислений, не связанных с игровой графикой. А вот следующая функция вновь напрямую затрагивает игровую производительность. Дело в том, что Turing не позволяет одновременно нагружать блоки трассировки лучей и тензорные ядра в пределах одного потокового мультипроцессора. Графические шейдеры могут исполняться непрерывно по мере рендеринга кадра, но параллельно с ними в отдельный момент времени действует только один тип расчетной нагрузки — либо рейтрейсинг, либо тензорные операции для масштабирования DLSS. В Ampere трассировка лучей, графические шейдеры и DLSS исполняются одновременно, что увеличивает фреймрейт.

Массив вычислительных блоков чипа GA102 обслуживает 384-битная шина оперативной памяти с поддержкой нового типа микросхем, GDDR6X, созданных компанией Micron по заказу NVIDIA. Чипы GDDR6X обеспечивают топовым моделям 30-й серии (GeForce RTX 3080 и RTX 3090) пропускную способность вплоть до 19,5 Гбит/с на контакт, но для этого пришлось решиться на коренное изменение принципов кодирования сигнала, ответственного за передачу данных (WCK). В памяти типа GDDR6 один такт WCK кодирует один бит информации, соответствующий высокому или низкому напряжению проводника. В GDDR6X, напротив, применяется амплитудно-импульсная модуляция PAM4, когда амплитуда сигнала может принимать четыре различных значения, и, соответственно, один такт сигнала кодирует два бита данных. В рамках PAM4 открылась возможность вдвое снизить частоту WCK, сохранив прежнюю пропускную способность, а затем постепенно наращивать и то и другое.

Печатная плата NVIDIA GeForce RTX 3080

Другое нововведение, относящееся к локальной памяти видеокарты, — это функция RTX IO, которая, впрочем, также доступна старым видеокартам под маркой RTX. Она представляет собой частную реализацию технологии DirectStorage в комплекте игровых API Microsoft. RTX IO должна решить проблемы, возникающие при коммуникации между ПЗУ компьютера, центрального процессора и локальной памяти графической карты, — в таких сценариях, как предварительная загрузка текстур игры или стриминг ресурсов по требованию, который широко используется для преодоления ограничений емкости VRAM. В традиционной логике ввода-вывода передача данных выполняется неоптимальным способом, когда ресурсы сперва копируются в системную память и лишь затем — в память GPU, дважды проходя через интерфейс PCI Express, а компрессия без потерь, которую широко используют разработчики игр, занимает такты центрального процессора. API DirectStorage и технология RTX IO полностью меняют традиционную схему: при помощи DMA-блоков Turing и Ampere графические ресурсы копируются напрямую в VRAM, минуя системную память, и на пути от SSD к видеокарте остаются в сжатом виде. Декомпрессию выполняет сам графический процессор путем асинхронных вычислений на CUDA-ядрах.

Однако это еще не все. NVIDIA добавила в чипы Ampere логику фиксированной функциональности для быстрого декодирования AV1 — нового формата видео, который обеспечивает чрезвычайно высокую степень компрессии по сравнению с распространенными кодеками HEVC (H.265) и VP9, но в то же время нуждается в серьезной вычислительной мощности при софтверном декодировании. И наконец, все представители 30-го семейства оснащаются выходом HDMI версии 2.1. Он может пропускать сигнал с разрешением 8К и кадровой частотой 60 Гц либо 4К и 120 Гц, таким образом, это самый скоростной видеоинтерфейс на домашних ПК. Пока это задел на будущее, но, как показывает история, возможности HDMI 2.1 рано или поздно пойдут в дело.

Однако довольно теоретических рассуждений. На данный момент NVIDIA представила четыре модели 30-й серии: два устройства, основанные на младшем чипе GA104, — GeForce RTX 3060 Ti и RTX 3070 и два на GA102 — RTX 3080 и RTX 3090. Напомним, что представляют собой новинки, и как они выступили в наших бенчмарках, начиная с RTX 3080.

Производитель	NVIDIA
Модель	GeForce RTX 3060 Ti	GeForce RTX 3070	GeForce RTX 3080	GeForce RTX 3090
Графический процессор
Название	GA104	GA104	GA102	GA102
Микроархитектура	Ampere	Ampere	Ampere	Ampere
Техпроцесс	8 нм (8N)	8 нм (8N)	8 нм (8N)	8 нм (8N)
Число транзисторов, млн	17 400	17 400	28 300	28 300
Тактовая частота, МГц: Base Clock / Boost Clock	1 410 /1 665	1 500 /1 725	1 440 /1 710	1 395 /1 695
Шейдерные ALU FP32	4 864	5 888	8 704	10 496
Блоки наложения текстур (TMU)	152	184	272	328
Блоки операций растеризации (ROP)	80	96	96	112
Тензорные ядра	152	184	272	328
RT-ядра	38	46	68	82
Оперативная память
Разрядность шины, бит	256	256	320	384
Тип микросхем	GDDR6 SGRAM	GDDR6 SGRAM	GDDR6X SGRAM	GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	1 750 (14 000)	1 750 (14 000)	1 188 (19 000)	1 219 (19 500)
Объем, Мбайт	8 192	8 192	10 240	24 576
Шина ввода/вывода	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	16 197	20 314	29 768	35 581
Производительность FP64/FP32	1/32	1/32	1/32	1/32
Производительность FP16/FP32	1/1	1/1	1/1	1/1
Пропускная способность оперативной памяти, Гбайт/с	448	448	760	936
Вывод изображения
Интерфейсы вывода изображения	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1	DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт	200	220	320	350
Розничная цена (США, без налога), $	399 (рекоменд. в момент выхода)	499 (рекоменд. в момент выхода)	699 (рекоменд. в момент выхода)	1 499 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.	39 990 (рекоменд. в момент выхода)	45 490 (рекоменд. в момент выхода)	63 490 (рекоменд. в момент выхода)	136 990 (рекоменд. в момент выхода)

Старшие модели основаны на одном и том же GPU. Состав исполнительных блоков процессора в RTX 3080 был серьезно урезан, но даже в таком виде ускоритель двукратно превосходит по паспортной пропускной способности FP32-вычислений GeForce RTX 2080 Ti, а RTX 2080 — уже в три раза. На практике стоит ожидать рост игрового фреймрейта в пределах 70 %, если взять за точку отсчета GeForce RTX 2080 SUPER, но и такой результат нельзя не признать впечатляющим рывком быстродействия, который приближается к достижениям архитектуры Pascal. Особенно при том, что GeForce RTX 3080 поступил в продажу по той же рекомендованной цене, что и его формальный предшественник, RTX 2080, — $699.

Ключевое слово здесь, конечно, «рекомедованной». Пока дефицит не пойдет на убыль, все новинки будут стоит намного больше. Единственное, в чем NVIDIA пришлось пойти на компромисс, — это объем оперативной памяти, который у GeForce RTX 3080 составляет уже не столь внушительные 10 Гбайт. Кроме того, топовые модели Ampere оказались чрезвычайно прожорливыми видеокартами. Прогресс в производительности на ватт имеет место, и все-таки своими достижениями RTX 3080 обязан не в последнюю очередь потребляемой мощности под 300 Вт.

NVIDIA GeForce RTX 3080 Founders Edition

Впрочем, как показал истинный флагман 30-й серии, 300 Вт — это еще не предел. GeForce RTX 3090 расходует вплоть до 350 Вт и стоит подобающе, $1 499. Благо исключительно для игр покупка RTX 3090 лишена всякого смысла, ведь даже в самых благоприятных условиях дополнительные вычислительные ресурсы, которые NVIDIA пробудила в графическом процессоре GA102, способны увеличить кадровые частоты всего лишь на 12 %, а объем оперативной памяти, расширенный до 24 Гбайт, геймерам попросту не нужен. Чипмейкер позиционирует GeForce RTX 3090 как решение для игр в разрешении 8К, и в этом случае от 24 Гбайт VRAM действительно есть польза. Но мы проверили и убедились, что без чрезвычайно агрессивного масштабирования силами DLSS, которое доступно лишь избранным тайтлам, к 8К компьютерное железо еще совершенно не готово (не говоря уже о том, сколько стоят 8К-экраны). На самом деле GeForce RTX 3090 — это просьюмерская видеокарта и прямой наследник устройств под маркой TITAN. Только в профессиональных приложениях, которым требуется больше 10 Гбайт видеопамяти, RTX 3090 действительно отрабатывает свою цену. Да и вообще архитектура Ampere даже лучше, чем в играх, проявляет себя в неграфических вычислениях, начиная от 3D-моделирования или видеомонтажа и заканчивая машинным обучением — традиционно сильнейшей стороной NVIDIA. Неспроста GeForce RTX 3090 оказалась единственной моделью нового поколения, сохранившей разъем NVLink для прямой коммуникации между двумя GPU.

NVIDIA GeForce RTX 3090 Founders Edition

Прежде чем мы перейдем к следующим по старшинству представителям 30-й серии, нужно отдать должное конструкции старших видеокарт Founders Edition. Высокий показатель TBP и чипы оперативной памяти нового типа — из-за всего этого GeForce RTX 3080 и RTX 3090 выдвигают повышенные требования к питанию и охлаждению видеокарт. NVIDIA вышла из положения благодаря необычному кулеру, который содержит всего два вентилятора, но укороченная печатная плата освободила половину радиатора для сквозного продува. Как следствие, оба устройства работают чрезвычайно тихо, несмотря на громадную потребляемую мощность, а RTX 3080 Founders Edition удалось сделать еще и неожиданно компактной по меркам высокопроизводительных видеокарт.

Кулер NVIDIA GeForce RTX 3090 Founders Edition

⇡#NVIDIA GeForce RTX 30: младшие модели

От предшественницы GeForce RTX 3080 отличает, среди прочего, одна важная особенность, которая и лежит в основе ударного роста FPS за доллар стоимости: в 30-м поколении модельный ряд карт NVIDIA сегментирован по-другому, и устройство на 80-й позиции комплектуется флагманским GPU (пусть и урезанным), а 70-й модели выделен чип второго эшелона — GA104. Линейка GeForce 20 была устроена совершенно иначе: напомним, что в основе RTX 2080 лежит графический процессор TU104, а в базовой версии RTX 2070 применяется TU106. Таким образом, два ключевых представителя 30-й серии шагнули наверх в рамках кремниевой базы своего времени по сравнению с их формальными предшественниками.

GeForce RTX 3070 опирается на частично урезанный кристалл GA104, но потери быстродействия в данном случае совершенно незначительны. Новинка почти вдвое превосходит GeForce RTX 2080 SUPER (видеокарту на полностью функциональном кристалле TU104) по расчетной пропускной способности за такт в операциях над 32-битными вещественными числами. Конечно, это лишь теоретические выкладки. Тем не менее в играх RTX 3070 сулит производительность на уровне GeForce RTX 2080 Ti — самой переоцененной модели 20-й серии, которую отдавали за сумму не меньше $999, — по стоимости RTX 2070, то есть всего за $499. А главное, все предварительные оценки RTX 3070 теперь подкреплены независимыми бенчмарками, и перед нами действительно предстал полный аналог GeForce RTX 2080 Ti, который вдобавок ко всему потребляет меньше энергии. А по сравнению с видеокартой, которая занимает 70-ю позицию в продуктовом ряду GeForce 20, — базовой версией RTX 2070, речь идет о приятном бонусе в 43–62 % игрового фреймрейта.

NVIDIA GeForce RTX 3070 Founders Edition

Уязвимое место GeForce RTX 3070 — объем локальной памяти. RTX 3070 радикально превосходит RTX 2070 и RTX 2070 SUPER по игровому быстродействию, не говоря уже о профессиональных задачах, но в распоряжении графического процессора по прежнему есть лишь 8 Гбайт оперативки. Более того, если проследить развитие устройств NVIDIA в данной ценовой нише, начиная с GeForce RTX 1070/1080, то оказывается, что объем видеопамяти не прогрессирует уже четыре года. Современным играм 8 Гбайт еще достаточно, но покупателям хотелось бы иметь запас на будущее. Увы, заложить его в спецификации RTX 3070, сохранив прежнюю стоимость, было бы непросто. 256-битная шина памяти ставит выбор между 8 и 16 Гбайт VRAM: 8 — маловато, а 16 — уже легкий перебор (AMD считает иначе, но это мы обсудим ниже).

Как бы то ни было, в условиях продолжающегося дефицита и завышенных цен, не говоря уже о падающем курсе рубля, даже GeForce RTX 3070 не по карману множеству российских покупателей. Кроме того, большинство геймеров по-прежнему сидит за мониторами с разрешением 1080p. В таком режиме различия между GPU сглаживаются, а потенциал мощного железа раскрывается лишь частично. Младший на данный момент представитель нового поколения, GeForce RTX 3060 Ti, стал первым шагом чипмейкера в бюджетном направлении. При рекомендованной стоимости $399 он выступает прямой заменой GeForce RTX 2060 SUPER, но, подобно своим старшим родственникам, метит на значительно более высокий уровень производительности — в данном случае аналогичный тому, который обеспечивает GeForce RTX 2080 SUPER.

RTX 3060 Ti — вторая видеокарта на чипе GA104 после RTX 3070. Как следствие, графический процессор здесь урезан сильнее, чем в RTX 3070: на чипе осталось чуть больше половины основных вычислительных блоков, если сравнивать с GeForce RTX 3080. Тем не менее GeForce RTX 3060 Ti существенно превосходит видеокарту предыдущего поколения, аналогом которой он должен стать в играх, — RTX 2080 SUPER — по скорости операций над вещественными числами стандартной точности (опять-таки в теории). В свою очередь, формальный предшественник новинки — GeForce RTX 2060 SUPER — обеспечивает лишь половину паспортного быстродействия шейдерных расчетов, свойственного RTX 3060 Ti.

NVIDIA GeForce RTX 3060 Ti Founders Edition

По сравнению с ускорителями, которые раньше жили в данной ценовой категории, RTX 3060 Ti действительно располагает совершенно иными возможностями: GeForce RTX 2060 SUPER он превосходит на 32–39 % игрового фреймрейта, Radeon RX 5700 XT — на 24–30 % и действительно является аналогом RTX 2080 SUPER, который в свое время дебютировал по цене $579. Это именно такие количественные изменения, которые переходят в качество, если речь идет о трассированных играх. В передовых проектах с рейтрейсингом младшие представители 20-го семейства уже исчерпали свой потенциал, а путь RTX 3060 Ti только начинается. Единственное, что мы советуем пользователям, которым посчастливилось найти RTX 3060 Ti (как и RTX 3070) по адекватной цене, — это попытать счастья в оверклокинге оперативной памяти. Похоже, новинка испытывает дефицит пропускной способности VRAM, но благодаря новым контроллерам в чипах Ampere память превосходно разгоняется.

GeForce RTX 3060 Ti и RTX 3070 выгодно отличаются от старших «Амперов» умеренной потребляемой мощностью в пределах 200–220 Вт, поэтому довольствуются упрощенной системой охлаждения. Недаром в конструкции младших моделей Founders Edition обошлись без дорогостоящей испарительной камеры, однако, если судить по фирменным устройствам NVIDIA, качественные разновидности RTX 3060 Ti и RTX 3070 гарантируют не только высокое быстродействие, но и по-настоящему низкий уровень шума.

⇡#Radeon RX 6000: AMD снова в седле

После того как AMD с успехом опробовала архитектуру RDNA на ускорителях Radeon 5000-й серии, пришло время вернуть конкуренцию между двумя производителями дискретных GPU в самый престижный, верхний ценовой сегмент. И что особенно важно, AMD не только вновь соревнуется за корону быстродействия, но и стремится восстановить утраченный паритет с NVIDIA в функциях рендеринга, которые открывают современные графические API, в частности в аппаратном ускорении трассировки лучей.

Референсные видеокарты AMD Radeon RX 6800 и RX 6800 XT

Но как ни крути, визитная карточка большого чипа Navi, который лег в основу «красных» новинок осени 2020 года, — то, что он действительно большой. AMD удвоила массив основных вычислительных блоков по сравнению их числом в процессоре Navi 10 в составе Radeon RX 5700 XT. Полностью функциональный кристалл Navi 21 содержит в общей сложности 5120 шейдерных ALU, благодаря чему (а также высоким тактовым частотам) он стал самым мощным дискретным GPU AMD в отношении сырой пропускной способности операций FP32 на такт. Неспроста и количество транзисторов увеличилось более чем вдвое — с 10,3 млрд у Navi 10 до 26,8 млрд.

Другой, но уже по-настоящему революционной особенностью нового кремния AMD является громадный кеш третьего уровня объемом 128 Мбайт — Infinity Cache, расположенный прямо на чипе Navi 21. Это далеко не новое решение, которое уже не раз использовали — также в виде интегрированного массива памяти или дискретного кристалла — производители SoC для игровых приставок и мобильных ПК. Но все-таки в сфере дискретных GPU компания AMD прибегла к нему впервые. Пропускная способность интерфейса Infinity Fabric, который соединяет Infinity Cache с более глубокими слоями стека памяти, достигает внушительной величины в 1,85 Тбайт/с, а это почти в четыре раза больше, чем у чипов GDDR6 на 256-битной шине. Да, новые ускорители 6000-й серии оборудованы простыми чипами GDDR6 с пропускной способностью 16 Гбит/с и, таким образом, недалеко ушли по совокупной ПСП от Radeon RX 5700 XT, но благодаря Infinity Cache слабая подсистема внешней памяти им совершенно не мешает.

Графический процессор AMD Navi 21

Чего до сих пор остро не хватало «красным» графическим процессорам, так это ускорения трассировки лучей. В чипе Navi 21 наконец-то появились специализированные блоки под названием Ray Accelerators, пускай для AMD это лишь первый — и потому не самый впечатляющий — эксперимент в аппаратном рейтрейсинге. Увы, нет данных для того, чтобы напрямую сравнить быстродействие RA с аналогичными компонентами «зеленых» GPU, но, как показывает практика, продукты на базе Navi 21 пока могут соревноваться на равных лишь с прошлым поколением видеокарт NVIDIA, если речь идет о тайтлах с гибридным рендерингом, и проседают еще сильнее в полностью трассированных играх — таких как Minecraft или Quake II RTX.

Кроме того, AMD нечем крыть тензорные ядра чипов Turing и Ampere, предназначенные для эксплуатации и тренировки нейронных сетей. А значит, у Radeon отсутствуют настолько же эффективные инструменты масштабирования кадра, как технология DLSS 2.0, которая избавилась от детских болезней ранних версий и во всех новых играх обеспечивает по меньшей мере удовлетворительное качество изображения. Даже новейшие модели GeForce RTX 30-й серии при высоком разрешении с трудом поддерживают комфортный фреймрейт без масштабирования, а игроделы уже привыкают закладывать в требования к железу прибавку быстродействия, которую обеспечивает DLSS. Компания работает над расширением библиотек FidelityFX под названием Super Resolution, которое станет более качественным средством реконструкции деталей, чем существующий алгоритм FidelityFX CAS, но, как и в случае с трассировкой лучей, AMD придется какое-то время наверстывать отставание от первопроходцев.

Зато у видеокарт серии Radeon RX 6000 есть нашумевшая функция Smart Access Memory (которая, кстати, распространяется и на Radeon RX 5000), открывающая центральному процессору прямой доступ к полному объему локальной памяти видеокарты. Небольшая часть VRAM всегда является частью адресного пространства системной памяти, но SAM позволяет целиком отображать VRAM в RAM и за счет этого предотвращает ненужное копирование данных. По усредненным оценкам AMD, SAM дает еще 6 % FPS в популярных играх и вплоть до 11 % в самом лучшем случае. Есть только одно условие — пока SAM официально работает лишь на процессорах Ryzen 5000 и материнских платах с чипсетом B550 или X570.

В действительности адресное пространство шины PCI Express изначально допускает гибкую конфигурацию путем установки базовых адресных регистров (BAR), поэтому довольно скоро — путем обновлений BIOS или в порядке эксперимента — Smart Access Memory запустили на чипсетах 400-й серии и даже на интеловском железе. Над собственным аналогом SAM также работает NVIDIA, и, скорее всего, данная функция рано или поздно распространится на любые комбинации современных CPU и GPU. Но пока, как ни крути, полную совместимость гарантируют только новые видеокарты AMD на «родной» платформе Ryzen 5000. И то и другое является дорогостоящим дефицитным товаром, так что преимущества SAM для большинства пользователей остаются лишь предметом отвлеченных дискуссий.

Ускорители AMD теперь не уступают «зеленым» соперникам по охвату функций рендеринга в рамках последних версий интерфейса Direct3D. К примеру, Navi 21 может воспользоваться совершенно новой моделью программирования геометрии — Mesh Shaders, которая параллелизирует ранние этапы графического конвейера, устраняя бутылочное горлышко при большом количестве полигонных сеток в кадре. А в перспективе новые шейдеры полностью заменят этап тесселяции поверхностей или по крайней мере дополнят его в тех случаях, когда уместно более гибкое решение. Одновременно в Navi 21 появилась поддержка Variable Rate Shading — функции, позволяющей регулировать вычислительные ресурсы, выделенные на шейдинг отдельных фрагментов изображения, в зависимости от того, требуется ли им повышенная точность, или, наоборот, допустимо падение качества. AMD выработала свой подход к имплементации API DirectStorage для прямой загрузки графических ресурсов с твердотельных накопителей в оперативную память графического процессора. Наконец, интерфейс HDMI 2.1 и выделенный ASIC для декодирования видеопотока AV1 — все это теперь тоже есть в железе AMD. Перечисленные и другие нововведения архитектуры RDNA второго поколения мы намного подробнее разбирали в обзоре Radeon RX 6800 и RX 6800 XT.

AMD выпустила сразу три видеокарты на базе чипа Navi 21. Младшие новинки — Radeon RX 6800 и Radeon RX 6800 XT — получили GPU с частично деактивированными вычислительными блоками и нацелены на конфронтацию с GeForce RTX 3070 и RTX 3080. В свою очередь, флагманский ускоритель Radeon RX 6900 XT продемонстрировал всю мощь нетронутого кристалла Navi 21 — он метит в одну категорию производительности с GeForce RTX 3090.

Производитель	AMD
Модель	Radeon RX 6800	Radeon RX 6800 XT	Radeon RX 6900 XT
Графический процессор
Название	Navi 21 XL	Navi 21 XT	Navi 21 XTX
Микроархитектура	RDNA 2	RDNA 2	RDNA 2
Техпроцесс, нм	7 нм FinFET	7 нм FinFET	7 нм FinFET
Число транзисторов, млн	26 800	26 800	26 800
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock	1 700/1 815/2 105	1825 /2 015/2 250	1825 /2 015/2 250
Шейдерные ALU FP32	3 840	4 608	5 120
Блоки наложения текстур (TMU)	240	288	320
Блоки операций растеризации (ROP)	96	128	128
Оперативная память
Разрядность шины, бит	256	256	256
Тип микросхем	GDDR6 SDRAM	GDDR6 SDRAM	GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)	2 000 (16 000)	2 000 (16 000)	2 000 (16 000)
Объем, Мбайт	16 192	16 192	16 192
Объем Infinity Cache, Мбайт	128	128	128
Шина ввода/вывода		PCI Express 4.0 x16	PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)	16 166	20 736	23 040
Производительность FP64/FP32	1/16	1/16	1/16
Производительность FP16/FP32	2/1	2/1	2/1
Пропускная способность оперативной памяти, Гбайт/с	512	512	512
Вывод изображения
Интерфейсы вывода изображения	DisplayPort 1.4, HDMI 2.1	DisplayPort 1.4, HDMI 2.1	DisplayPort 1.4, HDMI 2.1
TBP/TDP, Вт	250	300	300
Розничная цена (США, без налога), $	579 (рекоменд. на дату выхода)	649 (рекоменд. на дату выхода)	999 (рекоменд. на дату выхода)
Розничная цена (Россия), руб.	Н/Д	Н/Д	Н/Д

Базовая модель Radeon RX 6800 поступила в продажу по рекомендованной стоимости $579. Чипмейкер твердо уверен в ее превосходстве над GeForce RTX 3070 и назначил более высокую розничную цену. Действительно, в наших игровых тестах без трассировки лучей Radeon RX 6800 оторвался от GeForce RTX 3070 на 5–11 % FPS. Кроме того, AMD не поскупилась на объем оперативной памяти: все три устройства, включая RX 6800, получили 16 Гбайт VRAM. Но не все так просто: потенциальным владельцам RX 6800 нужно сделать поправку на игры с трассировкой лучей, в которых младшей модели приходится бороться с ускорителями прошлого поколения GeForce RTX 2080 и RTX 2080 SUPER. И это в лучшем случае, если речь не идет о полностью трассированной графике.

Radeon RX 6800 XT отличается от «простого» RX 6800 значительно повышенными тактовыми частотами, а главное, количеством активных шейдерных ALU и блоков текстурирования в кристалле GPU. Новинка на $50 дешевле своего 699-долларового соперника (GeForce RTX 3080), невзирая на преимущество в объеме VRAM, и несложно догадаться, почему AMD вновь соблазняет покупателя экономией. В традиционных играх без рейтрейсинга Radeon RX 6800 XT отстает от GeForce RTX 3080 на величину от 3 до 7 % FPS и, разумеется, не выдерживает никакого сравнения в условиях трассировки лучей.

Серию новых ускорителей увенчал Radeon RX 6900 XT с рекомендованной ценой $999. Флагманские ускорители комплектуются полностью активированными кристаллами Navi 21, которые вдобавок проходят отбор по наименьшим требованиям к напряжению питания. Radeon RX 6900 XT, без всяких сомнений, является одной из самых производительных игровых видеокарт современности. Но, как и в случае с GeForce RTX 3090, максимальную пользу из нее могут извлечь только профессиональные приложения, а вовсе не игры. Даже на 4К-экране, когда быстродействие заведомо не ограничено ресурсами центрального процессора, преимущество RX 6900 XT в 8 % FPS по сравнению с RX 6800 XT явно не соответствует наценке в $350. Как следствие, свергнуть GeForce RTX 3090 с пьедестала AMD все-таки не удалось: даже в консервативных тайтлах без рейтрейсинга продукт NVIDIA лидирует в бенчмарках с преимуществом от 7 до 18 % фреймрейта. Что там говорить, даже RTX 3080 уступает RX 6900 XT по игровой производительности лишь при условно-низком разрешении экрана (1080p или 1440p), да и то ненамного — в среднем 5–6 % FPS. Более привлекательно (опять-таки как RTX 3090) Radeon RX 6900 XT смотрится в рабочих приложениях — благодаря внушительному объему VRAM.

Референсная печатная плата AMD Radeon RX 6900 XT

И все-таки нельзя не признать, что подобных результатов в сравнении с показателями лучших продуктов NVIDIA мы не видели уже давно. Кроме того, чип Navi 21 поставил точку в многолетнем отставании «красного» кремния по быстродействию на ватт. Оценки энергоэффективности в играх без рейтрейсинга у представителей серии GeForce 30 с одной стороны и у Radeon RX 6000 с другой по большому счету одинаковы. Старшие модели ограничены резервом мощности 300 Вт, в то время как базовой версии RX 6800 достаточно 250. AMD по-прежнему использует конвейер TSMC с нормой 7 нм, но благодаря массе различных оптимизаций чипы Navi второго поколения далеко ушли от своих предшественников.

Стоит похвалить AMD и за то, что компания наконец-то уделила подобающее внимание конструкции референсных видеокарт., пусть даже они рано или поздно уйдут в прошлое, когда партнеры чипмейкера наладят выпуск устройств собственного дизайна. Судя по уровню шума и нагреву эталонных версий Radeon RX 5700 (XT) и Radeon VII, раньше AMD рассчитывала именно на это, но серия Radeon RX 6000 от таких проблем не страдает, особенно старшие модели, которым достался более крупный кулер, чем у RX 6800.

Вместо заключения еще раз акцентируем внимание на том, что все устройства, представленные NVIDIA и AMD осенью 2020 года, включая GeForce RTX 3060 Ti, относятся к устройствам высокопроизводительным и, соответственно, дорогим. А теперь кризис доступности нового железа только усилился в связи с очередным циклом криптовалютного ажиотажа. Как следствие, рядовые покупатели еще не скоро получат доступ к по-настоящему мощным графическим ускорителям по разумной цене, особенно в России. Повод для надежды есть лишь в том, что за моделями для энтузиастов обязательно последуют решения попроще и подешевле. Скорее всего, уже в первом полугодии оба чипмейкера до конца сформируют линейку видеокарт на чипах нового поколения. В среднем и нижнем ценовом сегменте мы по традиции увидим особенно тесную конкуренцию, исход которой решают не только характеристики кремния, но и в значительной степени возможности и цены конкретных реализаций той или иной модели. За всем этим мы будем пристально следить — должно быть интересно.