Оригинал материала: https://3dnews.kz/1098210

Итоги 2023 года: почему с видеокартами все так плохо

Соблюдая двухлетний темп релизов, ведущие разработчики дискретных GPU представили очередные флагманские решения в конце 2022 года. С тех пор линейки игровых видеокарт целиком мигрировали на новую микроархитектуру: Ada Lovelace у «зеленых» и RDNA 3 у «красных». Предположительно, NVIDIA в скором времени выпустит несколько промежуточных моделей серии GeForce RTX 40, однако принципиально новых решений для игровых ПК уже не будет по меньшей мере до третьего квартала. В этот раз мы решили отступить от привычного формата итогов и дадим общую оценку всему актуальному поколению ускорителей, включая позиции, которые появились раньше 2023 года. Причем не столько с технической точки зрения, сколько по их потребительской ценности, которая упала в глубочайшую яму в течение нескольких последних циклов.

#Серия GeForce RTX 40: деньги сегодня, FPS завтра

Архитектура Ada Lovelace претерпела лишь точечные изменения по сравнению с Ampere, зато потребительские чипы NVIDIA вновь производятся на мощностях TSMC, уже по технологической норме 4N, которая открыла дорогу к рабочим тактовым частотам на грани 3 ГГц и ранее невообразимым транзисторным бюджетам, ведь «зеленые» GPU несут массивный кеш второго уровня, а значит, не нуждаются в более скоростной видеопамяти, чем у их предшественников. Кстати, 16-гигабитные чипы GDDR6X, которыми укомплектовано большинство новых моделей, уже не настолько прожорливые и горячие, как память 30-й серии, а значит, проблемы с их охлаждением ушли в прошлое.

Ada Lovelace нисколько не отличается от предыдущей итерации по быстродействию шейдерных расчетов в пересчете на один SM графического процессора. Вместе с тем NVIDIA снова удвоила скорость обработки данных методами глубинного обучения, а также одной из операций трассировки лучей (поиск точки пересечения луча с полигоном). Кроме того, любые дискретные GPU потребительского класса, и «зеленые» в том числе, теперь выполняют аппаратное кодирование чрезвычайно ресурсоемкого видеоформата AV1. Все перечисленные нововведения и другие особенности логики Ada Lovelace мы подробно обсуждали в обзоре флагманской видеокарты GeForce RTX 4090.

Графический процессор NVIDIA AD102

Маркетинговая кампания 40-й линейки неотрывно фокусируется на одной функции, которая входит в состав DLSS третьего поколения, — генерации кадров при помощи векторов движения и анализа оптического потока. Для этого необходим (по крайней мере, по утверждению NVIDIA) аппаратный блок расчетов Optical Flow, который является частью медиапроцессора Ada Lovelace. Как следствие, генерация кадров доступна лишь новым устройствам как источник «бесплатных» FPS в дополнение к и без того увеличенной производительности.

Впрочем, если речь идет о старшей модели серии, пользователю настолько мощной видеокарты генерация кадров может пригодиться лишь в экзотических ситуациях (таких как игры при разрешении 8К), ведь GeForce RTX 4090 стал первым ускорителем, который обеспечил фреймрейт не меньше 60 FPS в большинстве современных игр на 4К-экране без всякого масштабирования даже с трассировкой лучей. Если взять за точку отсчета оригинальную версию GeForce RTX 3090, новый лидер сдвинул планку игрового быстродействия на 62 либо 72 % в зависимости от того, задействована ли трассировка лучей. Несмотря на высокую рекомендованную стоимость — $1 599, RTX 4090 превосходит своего непосредственного предшественника, RTX 3090, на 50–60 % еще и по быстродействию на доллар MSRP. Как и старшие модели GeForce RTX 30, RTX 4090 представляет собой не столько игровую, сколько просьюмерскую видеокарту, о чем свидетельствует и объем видеопамяти в 24 Гбайт.

GIGABYTE GeForce RTX 4090 Gaming OC

Увы, позитивная тенденция, которую будто бы запустил флагман 40-й линейки, не получила продолжения в следующих устройствах. Теперь, когда перед нами вся серия десктопных видеокарт GeForce RTX 40, не считая ожидаемого в скором времени промежуточного апгрейда, это особенно бросается в глаза. Приметой «зеленых» ускорителей текущего поколения является смещение нескольких моделей вниз по рангу используемого в них графического процессора, что само по себе было бы простительно, если бы не одновременный рост MSRP большинства позиций и, как следствие, весьма посредственное соотношение «цена — производительность».

Возьмем GeForce RTX 4080: в отличие от RTX 3080, который оснастили урезанной версией флагманского чипа GA102, его наследник пока является единственной дискретной видеокартой на базе кремния второго эшелона — AD103. Ресурсов этого GPU оказалось достаточно, чтобы в наших тестах GeForce RTX 4080 превзошел всех представителей 30-го семейства, включая GeForce RTX 3090, а по сравнению с RTX 3080 рост быстродействия при оптимальной нагрузке (в 4К без рейтрейсинга) составил 52 %, с трассировкой лучей — 81 %. Кроме того, новинка располагает VRAM объемом 16 Гбайт, который успели освоить некоторые игры при максимальных настройках графики. Однако на все технические достижения NVIDIA бросает тень рекомендованная цена 80-й модели, увеличившаяся с $699 до $1 199! В сухом остатке GeForce RTX 4080 представляет собой надстройку над 30-й серией, которая сулит ранее недоступный уровень быстродействия, но за пропорциональную доплату.

NVIDIA GeForce RTX 4080 Founders Edition

Следующее по старшинству устройство, GeForce RTX 4070 Ti, основано на кристалле с подобающим 70-й модели идентификатором AD104 и является превосходной демонстрацией энергоэффективности чипов Ada Lovelace. GeForce RTX 4070 Ti можно приравнять по быстродействию к GeForce RTX 3090, хотя по потребляемой мощности эти видеокарты различаются кардинально: 285 и 350 Вт. RTX 4070 Ti рассчитан на игры при разрешении 1440p с бескомпромиссной графикой (а во многих случаях и трассировкой лучей) и некоторые тайтлы в 4К. Относительно GeForce RTX 3070 Ti новая модель стала на 45 % быстрее в играх без рейтрейсинга на 4К-экране и на 56 % — в 1440p с рейтрейсингом. Однако и стоит RTX 4070 Ti уже не $599, а $799, а значит, прирост производительности на доллар MSRP не превышает 17 %.

Palit GeForce RTX 4070 Ti GameRock OC Classic

Базовая версия GeForce RTX 4070 оказалась едва ли не в худшем положении, чем RTX 4070 Ti. Как вы могли заметить, чем ниже позиция устройства в линейке, тем меньше становится разница в быстродействии между двумя поколениями GPU. У RTX 4070 по сравнению с RTX 3070 она составляет 25 либо 38 % в режиме 1440p — без рейтрейсинга и с RT соответственно. Надо ли удивляться, что при этом рекомендованная стоимость новинки на $100 выше, чем у RTX 3070, который в свое время поступил в продажу за $499 (теперь RTX 4070 часто продают со скидкой в $50, но это ничего принципиально не меняет). Стало быть, удельная производительность возросла не более чем на 15 %, а в играх без трассировки лучей, которые по-прежнему имеют наибольший приоритет для видеокарт среднего класса, сводится к 4 %. RTX 4070 и RTX 4070 Ti досталось 12 Гбайт видеопамяти, в то время как обе модификации RTX 3070 несут лишь 8 — и на том спасибо.

Palit GeForce RTX 4070 Dual OC

GeForce RTX 4060 Ti на основе чипа AD106, а также простой RTX 4060 стали единственными представителями 40-го семейства, которые не подорожали по сравнению с аналогичными продуктами уходящего поколения. Несмотря на это, RTX 4060 Ti является, пожалуй, самой оскорбительной из «зеленых» новинок. Все дело в том, что быстродействие модели 60 Ti выросло на мизерную величину 9 % без трассировки лучей и еще меньше — на 4 % — в трассированных играх, а объем видеопамяти по-прежнему составляет 8 Гбайт. NVIDIA представила и 16-гигабайтную версию RTX 4060 Ti, но она уже на $100 дороже. В силу того, что этот ускоритель больше ничем не отличается от младшего брата и также рассчитан на игры при разрешении 1080p (большинству которых еще достаточно 8 Гбайт VRAM), легко угадать, что среди всех моделей 40-й серии он выделяется в лучшем случае нулевой, если не отрицательной динамикой FPS на доллар стоимости.

GIGABYTE GeForce RTX 4060 Ti EAGLE OC

GeForce RTX 4060 без пометки Ti замыкает существующий модельный ряд NVIDIA, т. к. 50-я позиция все еще свободна. В отличие от RTX 4060 Ti, базовая версия комплектуется графическим процессором на один ранг ниже — AD107, который по своим характеристикам больше подошел бы именно гипотетическому RTX 4050. Как следствие, даже в отдельных играх без рейтрейсинга RTX 4060 не достиг заветных 60 FPS, а по сравнению с GeForce RTX 3060 обеспечивает лишь 10–15 % дополнительного фреймрейта. Кроме того, RTX 4060 досталось 8 Гбайт VRAM, в то время как RTX 3060 имеет 12 Гбайт. Как бы то ни было, благодаря тому, что NVIDIA снизила MSRP 60-й модели с $329 до $299, показатель FPS на доллар стоимости вырос на 21–26 %. Увы, это лучшее, на что оказалась способна вся серия, не считая GeForce RTX 4090.

Palit GeForce RTX 4060 Dual

Устройства линейки GeForce RTX 40, за исключением флагмана, явно переоценены, если рассматривать их в тех же условиях, что аналогичные модели прошлого поколения. Но с этим ограничением категорически не согласна NVIDIA. В расчетную производительность и, как следствие, цену новинок заложена генерация кадров. С технической точки зрения позиция чипмейкера по-своему оправданна. Генерация кадров действительно обеспечивает громадный прирост быстродействия в дополнение к апскейлингу, и, в силу того, что кадры генерируются на самом позднем этапе конвейера рендеринга, технология способна ощутимо разгрузить не только GPU, но и заодно центральный процессор компьютера.

Полный комплект функций DLSS 3 уже реализован во многих играх, да и вообще все идет к тому, что честный рендеринг в ресурсоемких играх без таких костылей, как масштабирование и генерация кадров, останется привилегией самых мощных и дорогих игровых ПК. Однако технологию, привязанную к железу одного производителя, нельзя считать общепринятой нормой, тем более в то время, когда есть альтернативное решение — FSR 3, совместимое с любыми GPU трех последних поколений (а то и старше, но таковы рекомендации AMD). А значит, золотым стандартом оценки производительности остается нативное разрешение с нативным фреймрейтом.

По сути, NVIDIA повторила сценарий 20-й серии. В ее цены тоже была включена функция, которой не всегда могли или даже хотели воспользоваться покупатели, но им все равно пришлось ее оплачивать. Поэтому, невзирая на технические успехи чипов Ada Lovelace, линейка GeForce 40 вызвала мало положительных эмоций. Топовые решения — GeForce RTX 4080 и RTX 4090 — находятся в привилегированном положении благодаря тому, что они раздвинули границы возможного для игровых видеокарт. А вот у средних и младших моделей была и остается выгодная альтернатива в виде устройств прошлого поколения — особенно Radeon RX 6000, запасы которых распродают с большой скидкой.

Другой проблемой всех ускорителей старше GeForce RTX 4070 стало питание через разъем 12VHPWR, который предусмотрен стандартами PCI Express 5.0 и ATX 3.0. 12VHPWR рассчитан на мощность вплоть до 600 Вт и является «умным» коннектором, который обеспечивает коммуникацию и согласование мощности между потребителем и источником питания. Кроме того, спецификация ATX 3.0 предполагает, что блок питания, оборудованный разъемом 12VHPWR, сохраняет стабильность напряжений при кратковременных скачках выходной мощности вплоть до 200 % от номинального максимума. Миграция на ATX 3.0 спровоцировала ревизию каталога всех популярных производителей БП для настольных компьютеров, и, пусть заявленная совместимость с новым стандартом еще не гарантирует соблюдения его требований, лаборатория Cybenetics разработала независимую программу сертификации под названием ATX 3.0 Pass, на которую можно ориентироваться при выборе устройства.

Разъем 12V-2×6 придет на смену 12VHPWR

Однако внедрение 12VHPWR не прошло безболезненно. Новый разъем оказался довольно привередливым к качеству соединения между кабелем и видеокартой, на которое может повлиять даже такой безобидный фактор, как изгиб проводников. Результатом стало заметное число ускорителей, которые отправились в ремонт для замены оплавленной «розетки» питания. С тех пор скандал поутих, а пользователи привыкли к тому, что данный разъем требует особенного внимания во время сборки ПК, однако на стандарте 12VHPWR уже поставили крест сами его разработчики. NVIDIA и консорциум PCI-SIG готовят замену под названием 12V-2×6, которая войдет в спецификации PCI Express 6 и ATX 3.1 и может появиться уже в видеокартах следующего поколения. Новый коннектор физически и электрически совместим с 12VHPWR, но модифицирован таким образом, чтобы в случае неплотного контакта не возникал перегрев, а полная мощность вплоть до 600 Вт была доступна лишь при надежном соединении.

Спецификации первой волны ускорителей на чипах Ada Lovelace собраны в таблице ниже, а на днях NVIDIA добавила к ним обновленные версии GeForce RTX 4070, RTX 4070 Ti и RTX 4080 с пометкой SUPER, которые сулят значительную прибавку быстродействия по сравнению с базовыми моделями. GeForce RTX 4080 SUPER достался целиком разблокированный графический процессор AD103, а GeForce RTX 4070 Ti SUPER также перевели на AD103, в то время как исходная модификация RTX 4070 Ti укомплектована кристаллом на одну ступень ниже — AD104. Наконец, GeForce RTX 4070 SUPER просто добавили активных вычислительных ядер. Как следствие ревизии характеристик, пиковая пропускная способность шейдерных операций у трех новинок, начиная со старшей, возросла на величину в 7, 10 и 22 относительно оригинальных видеокарт.

NVIDIA избегает сравнения подсемейства SUPER с дебютным составом 40-й линейки, ведь действительная разница в производительности между родственными GPU всегда отстает от теории. Однако технические изменения не так важны, как преобразование ценового ряда. Пусть GeForce RTX 4080 SUPER недалеко ушел от «обычного» RTX 4080, его рекомендованная стоимость на $200 ниже, а остальные видеокарты под маркой SUPER обладают такими же MSRP, как их предшественники. Заметно, что в таком случае GeForce RTX 4070 Ti SUPER является самым слабым апгрейдом из трех по соотношению цены и проектного быстродействия, но только этот ускоритель вместе с усиленным GPU приобрел еще 4 Гбайт видеопамяти, причем более скоростной, чем раньше.

GeForce RTX 4070 Ti и RTX 4080 передали эстафету версиям SUPER и уходят на пенсию, а GeForce RTX 4070 официально подешевел на $50. Новинки поступят в продажу 17, 24 и 31 января, начиная с RTX 4070 SUPER и заканчивая RTX 4080 SUPER.

ПроизводительNVIDIA
Модель GeForce RTX 4060 GeForce RTX 4060 Ti GeForce RTX 4070 GeForce RTX 4070 SUPER GeForce RTX 4070 Ti GeForce RTX 4070 Ti SUPER GeForce RTX 4080 GeForce RTX 4080 SUPER GeForce RTX 4090
Графический процессор
Название AD107 AD106 AD104 AD104 AD104 AD103 AD103 AD103 AD102
Микроархитектура Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace Ada Lovelace
Техпроцесс TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N TSMC 4N
Число транзисторов, млрд 18,9 22,9 35,8 35,8 35,8 45,9 45,9 45,9 76,3
Тактовая частота, МГц: Base Clock / Boost Clock 1 830/2 460 2 310/2 535 1 920/2 475 1 980/2 475 2 310/2 610 2 310/2 610 2 210/2 505 2 205/2 550 2 230/2 520
Шейдерные ALU FP32 3 072 4 352 5 888 7 168 7 680 8 448 9 728 10 240 16 384
Блоки наложения текстур (TMU) 96 136 184 224 240 264 304 320 512
Блоки операций растеризации (ROP) 32 48 64 80 80 112 112 112 176
Тензорные ядра 96 136 184 224 240 264 304 320 512
RT-ядра 24 32 46 56 60 66 76 80 128
Оперативная память
Разрядность шины, бит 128 128 192 192 192 256 256 256 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 063 (17 000) 1 125 (18 000) 1 313 (21 000) 1 313 (21 000) 1 313 (21 000) 1 313 (21 000) 1 400 (22 400) 1 438 (23 000) 1 313 (21 000)
Объем, Мбайт 8 192 8 192/16 384 12 228 12 228 12 228 16 384 16 384 16 384 24 576
Объем кеша L2, Мбайт 24 32 36 36 48 48 64 64 96
Шина ввода/вывода PCI Express 4.0 x8 PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 15 114 22 065 29 146 35 482 40 090 44 099 48 737 52 224 82 575
Производительность FP64/FP32 1/64 1/64 1/64 1/64 1/64 1/64 1/64 1/64 1/64
Производительность FP16/FP32 1/1 1/1 1/1 1/1 1/1 1/1 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 272 288 504 504 504 672 717 736 1 008
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 115 160 200 225 285 285 320 320 450
Розничная цена (США, без налога), $ 299 (рекоменд. в момент выхода) 399/499 (рекоменд. в момент выхода) 599 (рекоменд. в момент выхода); 549 (после релиза RTX 4070 SUPER) 599 (рекоменд. в момент выхода) 799 (рекоменд. в момент выхода) 799 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 999 (рекоменд. в момент выхода) 1599 (рекоменд. в момент выхода)

Серия Radeon RX 7000: поздно и мало

NVIDIA не могла бы себе позволить настолько хищную ценовую политику, если бы не вновь ослабшая конкуренция со стороны AMD. С сугубо технической точки зрения кремний Navi 3x, который лег в основу 7000-й серии, представляет собой впечатляющий, а в некоторых отношениях уникальный продукт. Однако складывается впечатление, что компания столкнулась с производственными трудностями, которые не позволили высвободить резерв быстродействия старших моделей и задержали релиз средних. Да и программное обеспечение у «Радеонов», как обычно, отстает от железа. Потребительская ценность новых устройств опять сводится к выгодным показателям FPS на доллар в растеризованных играх. Именно это нужно множеству покупателей, пусть даже в ущерб функциональности. Но рано радоваться, ведь при таком подходе большая часть 7000-й линейки конкурирует с 6000-ми моделями самой AMD, и не всегда успешно.

Сама архитектура RDNA претерпела глубокую переработку на пути от второго к третьему поколению. Теперь, вслед за чипами семейства Ampere и Ada Lovelace от NVIDIA, «красные» GPU научились проводить вещественночисленные операции с удвоенной пропускной способностью на один Compute Unit, и все же AMD не учитывает дополнительные шейдерные ALU в спецификациях ускорителей из-за того, что их может задействовать лишь ограниченный набор инструкций. Разбухший вычислительный массив внутри каждого Compute Unit’а также используется для матричных инструкций умножения-сложения. RDNA по-прежнему не имеет выделенной тензорной логики, однако хорошее начало положено: теоретическая пропускная способность CU в пересчете на отдельные операции достигла половины от 1024 FLOP потокового мультипроцессора «зеленой» архитектуры Ampere и четверти от 2048 FLOP у Ada Lovelace.

Механизм трассировки лучей в RDNA 3 получил ряд оптимизаций, направленных на более эффективную очередность и группировку расчетов, однако прохождение структуры BVH по-прежнему выполняется программно, на шейдерных ALU. Не изменился и темп поиска пересечений луча с боксом BVH и поверхностью полигона. Как следствие, в играх с рейтрейсингом «красные» ускорители все еще испытывают значительно большую потерю производительности, чем в остальном аналогичные решения NVIDIA.

Зато AMD вновь оказалась первопроходцем в методах физического исполнения процессоров. Старшие представители третьего поколения Navi созданы по чиплетной технологии, которая позволяет использовать разную фотолитографию для изготовления кристаллов, содержащих логику того или иного типа. Чиплет GCD представляет собой ядро GPU и выполнен по тонкой норме TSMC N5 (NVIDIA использует вариацию этого же техпроцесса под названием 4N). В свою очередь, по чиплетам MCD разбросаны контроллеры VRAM, кеш последнего уровня и другие плохо сжимаемые компоненты, которые довольствуются нормой TSMC N6. Другим преимуществом чиплетной сборки является возможность комбинировать на одной подложке произвольный набор кристаллов и унифицировать производство за счет того, что графические процессоры совершенно разной весовой категории комплектуются одними и теми же MCD. О том, как именно реализован чиплетный метод в ускорителях AMD, а также обо всех особенностях и ограничениях архитектуры RDNA 3 мы подробно писали в обзоре старших видеокарт серии.

Графический процессор AMD Navi 31 XT/XTX

Наконец, отметим обязательную для современных GPU функцию аппаратного кодирования видео AV1 и нативную совместимость с последними версиями двух главных интерфейсов вывода изображения — HDMI 2.1a и DisplayPort 2.1, которой не может похвастаться ни NVIDIA, ни Intel.

Radeon RX 7900 XT и RX 7900 XTX основаны на громадном чипсете Navi 31, который состоит в общей сложности из семи кристаллов — одного GCD и шести MCD, — а для того, чтобы насытить данными широкий вычислительный конвейер, AMD пришлось вернуться к 384-битной шине видеопамяти в дополнение к 96 Мбайт кеша третьего уровня.

Лидер серии превосходит Radeon RX 6900 XT на величину вплоть до 52 % в стандартных играх, что позволяет забыть о масштабировании кадров при разрешении 4К. Прибавка фреймрейта с трассировкой лучей достигает 64 %, и этого в большинстве случаев хватает для комфортного гейминга в 1440p. Однако Radeon RX 7900 XTX явно не дотянул до того уровня производительности, на который рассчитывала AMD, в силу консервативных тактовых частот. Хуже того, преимущество лучшего из «зеленых» решений перед «красным» увеличилось с 16/72 % в прошлом поколении до 23/84 % (без рейтрейсинга и с рейтрейсингом соответственно). Radeon RX 7900 XTX поступил в продажу по такой же MSRP $999, как Radeon RX 6900 XT, а его главным соперником выступает GeForce RTX 4080, который NVIDIA оценила в $1 199. По сравнению с предтоповой моделью конкурента флагман AMD на 8 % быстрее в растеризованных играх на 4К-экране, однако RTX 4080 ушел вперед на 32 % по совокупным результатам трассированных бенчмарков (в этой дисциплине Radeon RX 7900 XTX может потягаться разве что с GeForce RTX 4070 Ti).

В свою очередь, Radeon RX 7900 XT лишился части вычислительных блоков Navi 31 и довольствуется 320-битной шиной VRAM, однако уступает флагману лишь 13 % игрового быстродействия в 4К. При рекомендованной цене в $899 Radeon RX 7900 XT занимает промежуточное положение на «зеленой» шкале между GeForce RTX 4070 Ti и RTX 4080. Относительно более дешевого соперника продукт AMD лидирует с преимуществом вплоть до 18 % FPS без рейтрейсинга, но RTX 4070 Ti предсказуемо ушел вперед на 20 % в гибридных и полностью трассированных бенчмарках.

SAPPHIRE NITRO+ Radeon RX 7900 XT и Radeon RX 7900 XTX

Radeon RX 7900 XT и XTX обладают запасом видеопамяти в 20–24 Гбайт и достигли впечатляющих результатов в широком спектре рабочих задач. А в целом, пусть дебютная реализация чиплетного GPU и не работает в полную силу, по соотношению цены и быстродействия старшие представители серии выступают по меньшей мере хорошей альтернативой десктопным продуктам NVIDIA. Кроме того, заметим, что все численные соотношения между теми или иными устройствами основаны на данных из оригинальных обзоров, а со времен последней битвы флагманов уже прошел целый год. В свете премьеры GeForce RTX 40 SUPER мы планируем еще раз испытать топовые предложения обеих компаний — уже в новых игровых тайтлах, с отточенными драйверами и на более производительной платформе.

Семейство Navi 3x включает лишь три графических процессора, в то время как NVIDIA успела выпустить пять GPU архитектуры Ada Lovelace. По утверждению AMD, цикл релизов текущего поколения завершен, но в серии Radeon RX 7000 по-прежнему есть вакантные позиции. В частности, AMD не закрыла огромный промежуток между 899-долларовым Radeon RX 7900 XT и Radeon RX 7800 XT, который стоит лишь $499. Подходящая видеокарта по цене $649 существует, но она доступна розничным покупателям только на рынке континентального Китая.

Radeon RX 7900 GRE основан на специальной версии чипсета Navi 31, которая недалеко ушла от Radeon RX 7900 XT по числу вычислительных блоков чиплета GCD, но комплектуется всего четырьмя активными кристаллами MCD, а значит, 256-битной шиной видеопамяти. Ближайшая по возможностям (и вместе с тем более дорогая) из видеокарт NVIDIA — GeForce RTX 4070 Ti — обеспечивает лишь 8 % дополнительного фреймрейта по сравнению с Radeon RX 7900 GRE в нетрассированных играх с подходящим обоим ускорителям разрешением 1440p. С другой стороны, даже GeForce RTX 4070 опережает Radeon RX 7900 GRE в трассировке лучей. Несомненным достоинством последнего являются 16 Гбайт VRAM, совсем не лишние в современных требовательных играх.

Как бы то ни было, шансы увидеть Radeon RX 7900 GRE в мировой рознице (по крайней мере без существенной прибавки тактовых частот) устремились к нулю в тот момент, когда AMD выпустила ускоритель практически эквивалентного игрового быстродействия под маркой Radeon RX 7800 XT. Прежде компания не могла предложить новых решений средней ценовой категории на протяжении без малого девяти месяцев после релиза Radeon RX 7900 XT и XTX.

AMD Radeon RX 7900 GRE в референсном исполнении

Radeon RX 7800 XT, в отличие от 800-х моделей прошлого поколения, опирается на GPU второго эшелона — Navi 32, что заметно и по его техническим характеристикам. NVIDIA сделала то же самое с GeForce RTX 4060 и RTX 4060 Ti, но, надо отдать должное AMD, при рекомендованной стоимости $499 устройство занимает такую же рыночную нишу, как его технический прообраз Radeon RX 6700 XT. Radeon RX 7800 XT рассчитан на игры в режиме 1440p и является прямой заменой экс-флагманской видеокарты Radeon RX 6900 XT. В окружении «зеленых» решений Radeon RX 7800 XT оказался на величину вплоть до 21 % быстрее, чем GeForce RTX 4070, без трассировки лучей, и пусть RTX 4070 Ti превосходит RX 7800 XT с отрывом в 9–10 %, «красный» ускоритель дешевле обоих и несет 16 вместо 12 Гбайт VRAM. GeForce RTX 4070 вырвался вперед на 14 % в играх с гибридным рендерингом, а вот 16-гигабайтную версию GeForce RTX 4060 Ti, которая стоит ровно столько же, сколько Radeon RX 7800 XT, последний разгромил и с трассировкой лучей. В итоге, пусть Radeon RX 7800 XT и не тянет на полноценную 800-ю модель, низкая цена превратила его в самое выгодное предложение актуального каталога десктопных GPU.

Radeon RX 7700 XT представляет собой ту же видеокарту за вычетом части CU графического процессора и одного чиплета MCD, а объем VRAM уменьшился до 12 Гбайт, что в совокупности привело к снижению игрового быстродействия на 15–21 %. Беспрецедентно узкий ценовой зазор в $50 между двумя моделями, на первый взгляд, лишает Radeon RX 7700 XT права на жизнь, однако последний соседствует в прайс-листах с GeForce RTX 4060 Ti — самой одиозной видеокартой последнего поколения. Radeon RX 7700 XT не уступает ей в трассированных играх, а без рейтрейсинга лидирует с преимуществом вплоть до 29 % FPS.

SAPPHIRE PULSE Radeon RX 7700 XT и Radeon RX 7800 XT

Парад «красных» новинок замыкает Radeon RX 7600 — игровой ускоритель начального уровня на чипе Navi 33. В отличие от старших образцов кремния Navi третьего поколения, этот процессор изготовлен в виде монолитного кристалла по фотолитографической норме TSMC N6. Хотелось бы сказать, что Navi 33 также широко используется в моделях Radeon RX 7000 для лэптопов, но AMD утратила сколь-либо заметное присутствие в мобильном секторе, а все многообразие ноутбучных версий Navi 33 осталось на бумаге.

Radeon RX 7600 продается по цене $269 — ниже, чем у 600-й модели прошлого поколения, — и предназначен для игр в народном режиме 1080p, порой с компромиссным качеством изображения. Продолжая тенденцию, заложенную старшими продуктами, Radeon RX 7600 сулит быстродействие на 5 % выше, чем у более дорогого GeForce RTX 4060, и подобрался на расстояние в 6–9 % к GeForce RTX 4060 Ti. Однако даже GeForce RTX 4060 располагает преимуществом вплоть до 48 % FPS в трассированных играх.

SAPPHIRE PULSE Radeon RX 7600

Как и все устройства NVIDIA, за исключением GeForce RTX 4080 и RTX 4090, «красные» ускорители младше Radeon RX 7900 XT вынуждены бороться за деньги покупателей не только с продуктами другого чипмейкера, но и с большими запасами старого железа — в первую очередь собственными предшественниками из 6000-й линейки. А по сравнению с ними новое железо AMD может предложить еще меньше инновационных функций, чем продукты NVIDIA, у которых хотя бы есть пакет DLSS 3 с по-прежнему более качественным апскейлингом.

Альтернативная технология FSR созрела до третьей версии, которая также осуществляет генерацию кадров, лишь после релиза Radeon RX 7700 XT и RX 7800 XT. К тому же, несмотря на то, что в архитектуру RDNA 3 заложен механизм быстрого исполнения матричных инструкций, FSR 3 не использует машинное обучение даже опционально. А значит, пусть расчет оптического потока на шейдерных ALU предъявляет большие требования к ресурсам графического процессора, нежели аппаратный метод NVIDIA, генерация кадров теперь доступна и старым устройствам AMD, начиная с 5000-го семейства. В такой ситуации у середнячков линейки Radeon RX 7000 осталось мало эксклюзивных качеств: повышенная энергоэффективность, мощный мультимедийный ASIC с возможностью кодирования AV1, поддержка DisplayPort 2.1, вот и все.

ПроизводительAMD
Модель Radeon RX 7600 Radeon RX 7700 XT Radeon RX 7800 XT Radeon RX 7900 GRE Radeon RX 7900 XT Radeon RX 7900 XTX
Графический процессор
Название Navi 33 XL Navi 32 XL Navi 32 XT Navi 31 XL Navi 31 XT Navi 31 XTX
Микроархитектура RDNA 3 RDNA 3 RDNA 3 RDNA 3 RDNA 3 RDNA 3
Техпроцесс, нм TSMC N6 TSMC N5/N6 TSMC N5/N6 TSMC N5/N6 TSMC N5/N6 TSMC N5/N6
Число транзисторов, млрд 13,3 28,1 28,1 57,7 57,7 57,7
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock 1 720 /2 250/2 655 1 700 /2 171/2 544 1 295 /2 124/2 430 1 270/1 880/2 245 1 500 /2 025/2 394 1 855 /2 269/2 499
Шейдерные ALU FP32 2 048 (4 096) 3 456 (6 912) 3 840 (7 680) 5 120 (10 240) 5 376 (10 752) 6 144 (12 228)
Блоки наложения текстур (TMU) 128 216 240 320 336 384
Блоки операций растеризации (ROP) 64 96 96 192 192 192
Оперативная память
Разрядность шины, бит 128 192 256 256 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 250 (18 000) 2 250 (18 000) 2 438 (19 500) 2 250 (18 000) 2 500 (20 000) 2 500 (20 000)
Объем, Мбайт 8 192 12 288 16 384 16 384 20 480 24 576
Объем Infinity Cache, Мбайт 32 48 64 64 80 96
Шина ввода/вывода PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 10 875 (21 750) 17 584 (35 168) 18 662 (37 325) 22 989 (45 978) 25 740 (51 481) 30 708 (61 116)
Производительность FP64/FP32 1/32 (1/64) 1/32 (1/64) 1/32 (1/64) 1/32 (1/64) 1/32 (1/64) 1/32 (1/64)
Производительность FP16/FP32 2/1 2/1 2/1 2/1 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 288 432 624 576 800 960
Вывод изображения
Интерфейсы вывода изображения DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a
TBP/TDP, Вт 165 245 263 260 315 335
Розничная цена (без налога), $ 269 (рекоменд. на дату выхода) 449 (рекоменд. на дату выхода) 499 (рекоменд. на дату выхода) 649 (рекоменд. на дату выхода) 899 (рекоменд. на дату выхода) 999 (рекоменд. на дату выхода)

Семейству Radeon RX 7000 пошло бы на пользу обновление кремния, а еще лучше появление одного графического процессора в промежутке между Navi 31 и Navi 32. Но, по слухам, AMD отменила ранее запланированный апгрейд и не собирается выпускать никаких других дискретных графических процессоров архитектуры RDNA 3. Хуже того — говорят, что в линейке Radeon RX 8000 не будет видеокарт высшего эшелона из-за того, что резерв производственных мощностей TSMC уже исчерпан. AMD пришлось выбирать между потребительскими GPU и ускорителями вычислений семейства Instinct, занимающими громадную площадь кремниевых пластин, и последние оказались важнее.

#Видеокарты Intel, о которых все забыли

На первый взгляд, попытка Intel выйти на рынок дискретных видеокарт, третья по счету, была хорошо подготовлена. Компания уже давно не новичок в проектировании GPU, хоть и встроенных в кристалл центрального процессора, а о совершенно новой архитектуре Xe-HPG были заранее опубликованы многообещающие подробности.

Xe-HPG имеет мало общего с предыдущими интегрированными решениями Intel и во многих задачах не уступает продуктам конкурентов ни по функциональности, ни по теоретическому быстродействию. Так, блок Xe-Core, который является аналогом CU в чипах AMD и SM у NVIDIA, развивает точно такой же темп операций с числами FP32 и вдвое быстрее выполняет целочисленные расчеты. В свою очередь, пропускная способность матричных операций, необходимых для обработки данных нейросетями, в пересчете на один Xe-Core также соответствует возможностям чипов Ada Lovelace, а значит, в четыре раза превосходит достижения RDNA 3.

Intel Arc A770 Limited Edition

Кроме того, интеловские GPU способны выполнять шейдерные вычисления в полном темпе одновременно с матричными на уровне отдельно взятого Xe-Core — внутри CU или SM это невозможно. Intel представила собственный метод апскейлинга кадров при помощи нейросети — XeSS, — который совместим не только с Xe-HPG, но и с графическими процессорами конкурентов, только в последнем случае используются упрощенные вычислительные кернелы. Что касается трассировки лучей, Xe-HPG содержит специализированную логику для прохождения иерархии BVH, как и архитектура NVIDIA, а по скорости поиска пересечений луча находится в промежутке между Ada Lovelace и RDNA 2/3.

Три кристалла Intel первой итерации под названием Alchemist производит тайваньская TSMC на узле N6. Самый крупный чип, ACM-G10 (DG2-512), лег в основу старших десктопных моделей Arc A750 и A770, которые предназначены для игры в режиме 1080p на максималках, а значит, конкурируют с GeForce RTX 4060 и Radeon RX 7600. Увы, даже флагман Intel отстал от «зеленого» и «красного» соперника на величину в 3 и 8 % FPS соответственно, несмотря на перевес в теоретической производительности и энергопотребление вплоть до 225 Вт. В трассировке лучей Arc A770 является аналогом GeForce RTX 4060, зато превосходит Radeon RX 7600 на 30 % фреймрейта.

ПроизводительIntel
Модель Arc A750 Arc A770 (8 Гбайт) Arc A770 (16 Гбайт)
Графический процессор
Название DG2-512 (ACM-G10) DG2-512 (ACM-G10) DG2-512 (ACM-G10)
Микроархитектура Alchemist Alchemist Alchemist
Техпроцесс TSMC N6 TSMC N6 TSMC N6
Число транзисторов, млрд 21,7 21,7 21,7
Тактовая частота, МГц: Base Clock / Boost Clock 2 050/2 400 2 100/2 400 2 100/2 400
Шейдерные ALU FP32 3 584 4 096 4 096
Блоки наложения текстур (TMU) 224 256 256
Блоки операций растеризации (ROP) 112 128 128
Блоки XMX 448 512 512
RT-ядра 28 32 32
Оперативная память
Разрядность шины, бит 256 256 256
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (16 000) 2 000 (16 000) 2 188 (17 500)
Объем, Мбайт 8 192 8 192 16 384
Объем кеша L2, Мбайт 12 16 16
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 17 203 19 661 19 661
Производительность FP64/FP32 1/4 1/4 1/4
Производительность FP16/FP32 2/1 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 512 512 560
Вывод изображения
Интерфейсы вывода изображения DisplayPort 2.0, HDMI 2.0b (2.1) DisplayPort 2.0, HDMI 2.0b (2.1) DisplayPort 2.0, HDMI 2.0b (2.1)
TBP/TDP, Вт 225 225 225
Розничная цена (США, без налога), $ 289 (рекоменд. в момент выхода) 329 (рекоменд. в момент выхода) 349 (рекоменд. в момент выхода)

Хотя рекомендуемые розничные цены Arc A750 и старшей версии A770 с 16 Гбайт VRAM были установлены на уровне $289 и $349, в данный момент эти ускорители доступны за суммы $190 и $280, которые лучше соответствуют их реальным возможностям. Впрочем, главной проблемой интеловских видеокарт на старте была даже не цена, а чрезвычайно сырые и проблемные драйверы — к счастью, уже по большей части исправленные. По последней доступной нам информации от аналитиков JPR, устройства Arc занимали всего лишь 2 % рынка дискретных видеокарт во втором квартале 2023 года, но Intel не сдается и работает над семейством графических процессоров Battlemage с обновленной микроархитектурой, которые могут появиться на рынке уже в наступившем году. Однако непротиворечивых данных об их характеристиках все еще нет.



Оригинал материала: https://3dnews.kz/1098210