Оригинал материала: https://3dnews.kz/1080145

Итоги 2022 года: игровые видеокарты

Видеокарты экономкласса и промежуточные апгрейды

Мы вряд ли ошибемся, назвав 2022 год самым насыщенным в истории потребительских видеокарт если не по значимости, то как минимум по числу релизов нового железа. NVIDIA и AMD добавили массу новых позиций к модельному ряду уходящего поколения, многие из которых останутся в строю надолго, а затем выпустили долгожданные продукты новой архитектуры и сформировали верхушку следующих серий — GeForce 40 и Radeon RX 7000. Настолько же важным событием стал запуск дискретных ускорителей Intel, хотя говорить о полноценной конкуренции Arc с двумя хозяевами рынка пока еще очень рано. При этом все достижения (и неудачи) технического прогресса происходят на фоне по-прежнему неблагоприятной для рядового покупателя ценовой обстановки. Время бешеного спроса на видеокарты, осложненного дефицитом полупроводников, ушло, но создатели графических процессоров продолжают мыслить прошлым.

#Новые видеокарты экономкласса

К тому времени, когда производители дискретных GPU вновь обратили внимание на нижний ценовой сегмент, флагманские продукты актуального модельного ряда уже отслужили больше года. Тогда каталог доступных в продаже недорогих решений, по-прежнему представленный сериями Radeon RX 5000 и GeForce 16, уже поредел, а их функциональное устаревание стало заметным. Ведь появилось немало игр с изначально нетребовательной реализацией трассировки лучей или возможностью подогнать нагрузку под слабое железо, которой в конце концов и воспользовались бюджетные новинки.

Увы, предложения NVIDIA и AMD для экономных пользователей оказались не слишком привлекательными, каждое по собственной причине. Больше всего камней полетело в ускорители Radeon RX 6400 и RX 6500 XT, основанные на самом легком графическом процессоре, который «красные» использовали в дискретных видеокартах последних лет, — Navi 24. GPU содержит всего 16 вычислительных блоков (CU — Compute Unit), что означает лишь 1024 шейдерных ALU. Зато может похвастаться чрезвычайно высокими тактовыми частотами, которых удалось достигнуть благодаря тонкому техпроцессу TSMC N6. И разумеется, Navi 24 располагает почти всеми функциями архитектуры RDNA 2, включая аппаратную трассировку лучей.

Если учесть низкую потребляемую мощность — в пределах 107 Вт, Radeon RX 6500 XT производит хорошее впечатление на бумаге, но ряд компромиссных решений обеспечил видеокарте холодный прием. Дело в том, что Navi 24 — это в первую очередь ноутбучный чип, компаньон мобильных процессоров Ryzen 6000, которые наконец-то обзавелись поддержкой PCI Express 4-го поколения. Поэтому AMD вполне резонно ограничила GPU четырьмя линиями системной шины. Для десктопной видеокарты это, напротив, стало гигантской проблемой в контексте апгрейда старых компьютеров: режим PCI Express 3.0 отнимает у Radeon RX 6500 XT в среднем 8 % игрового быстродействия. Не добавил новинке привлекательности и скромный объем VRAM в 4 Гбайт (хотя позднее были выпущены и модификации с 8 Гбайт памяти). Наконец, в Navi 24 отсутствует кодировщик видео, что опять-таки больше всего вредит устаревшим системам, которым пошла бы на пользу замена видеокарты.

SAPPHIRE PULSE Radeon RX 6500 XT

Как бы то ни было, все недостатки Radeon RX 6500 XT можно было бы простить, если бы он предлагался по подходящей цене. Но, как выяснилось, в играх ускоритель является полным аналогом Radeon RX 5500 XT — видеокарты, которая стоит на точно такой же позиции модельного ряда и также поступила в продажу по рекомендованной стоимости $199. Если сбросить со счетов функцию рейтрейсинга — опциональную для GPU начального уровня, — Radeon RX 6500 XT стал идеальной иллюстрацией отсутствия прогресса в производительности на доллар, омрачившего многие релизы данного поколения.

Все то же самое можно было бы сказать и о Radeon RX 6400, который основан на урезанной модификации Navi 24 и оценивается в $159, однако младшая модель была и остается единственным современным предложением в диапазоне мощности ниже 75 Вт, исключая младшие образцы Intel Arc, по сути и не рассчитанные на розничного покупателя.

Бюджетный ускоритель NVIDIA нового образца — GeForce RTX 3050 — стартовал с более высоких позиций. Вместо ноутбучного кристалла GA107, который выглядел самым подходящим кандидатом на эту роль, компания снова пустила в дело чип GA106, дебютировавший ранее в составе GeForce RTX 3060. В результате RTX 3050 представляет собой не что иное, как облегченную версию старшей видеокарты без каких-либо скрытых, но существенных компромиссов. GPU использует лишь 2560 из 3840 шейдерных ALU и урезанную до 128 бит шину памяти, но, в отличие от первых версий Radeon RX 6500 XT, комплектуется подобающими современной видеокарте 8 Гбайт VRAM. Ширина интерфейса PCI Express тоже пошла под нож, однако восьми линий таким устройствам более чем достаточно даже на скорости третьего поколения. С технической точки зрения у GeForce RTX 3050 есть лишь одно слабое место: посредственная энергоэффективность и, как следствие, сравнительно высокая потребляемая мощность — 130 Вт.

Palit GeForce RTX 3050 Dual

В отличие от Radeon RX 6500 XT, не говоря уже об RX 6400, GeForce RTX 3050 вполне может справиться с трассированными играми, пусть не на максималках и обязательно с масштабированием кадров. Кроме того, NVIDIA установила хотя бы формально более низкую стоимость GeForce RTX 3050 ($249) по сравнению с самой доступной моделью 20-й серии, RTX 2060 ($300 или $349 в зависимости от марки GPU). Увы, «рыночек», который в то время страдал от резкого дефицита, с одной стороны, и ажиотажного спроса, с другой, «порешал » иначе, так что GeForce RTX 3050 по большому счету нельзя было считать бюджетным решением.

С тех пор цены GeForce RTX 3050 опустились до исходных рекомендованных значений, а у Radeon RX 6500 XT и RX 6400 даже ниже: $164 и $139 (здесь и далее мы будем оперировать валютными ценами из-за того, что рублевые подвержены значительным колебаниям), но придется смириться с тем, что уходящее поколение видеокарт так и не породило безусловно привлекательных и функционально полноценных решений по цене ниже $200.

#Промежуточные апгрейды GeForce RTX 30 и Radeon RX 6000

Зато NVIDIA и AMD выпустили массу промежуточных позиций в середине и на вершине ценового ряда, благодаря которым чипмейкеры укрепили слабые места соответствующей линейки, немного подтянули характеристики или всего лишь пустили в дело накопившуюся отбраковку кристаллов GPU. По очевидным причинам нам не представилась возможность испытать в деле какую-либо из этих новинок, однако невелика потеря — по их спецификациям и так все ясно.

Например, GeForce RTX 3060 теперь существует в конфигурациях не только с 12, но и с 8 Гбайт памяти, причем пострадал не только объем, но и производительность VRAM, интерфейс которой урезали с 192 до 128 бит. Судя по независимым тестам, дистанция по игровому быстродействию между двумя версиями GeForce RTX 3060 значительна и лежит в пределах от 15 до 20 % FPS. При этом текущий минимум валютных цен различается лишь на $10 ($339 и $349), так что 8-гигабайтную версию RTX 3060 трудно рекомендовать к покупке при каких-либо обстоятельствах.

ПроизводительNVIDIA
Модель GeForce RTX 3050 GeForce RTX 3060 (8 Гбайт) GeForce RTX 3060 (12 Гбайт) GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 3070 Ti
Графический процессор
Название GA106 GA106 GA106 GA104 GA104 GA104
Микроархитектура Ampere Ampere Ampere Ampere Ampere Ampere
Техпроцесс Samsung 8N Samsung 8N Samsung 8N Samsung 8N Samsung 8N Samsung 8N
Число транзисторов, млрд 12 12 12 17,4 17,4 17,4
Тактовая частота, МГц: Base Clock / Boost Clock 1 550/1 780 1 320/1 777 1 320/1 777 1 410/1 665 1 500/1 725 1575/1 770
Шейдерные ALU FP32 2 560 3 584 3 584 4 864 5 888 6 144
Блоки наложения текстур (TMU) 80 112 112 152 184 192
Блоки операций растеризации (ROP) 32 48 48 80 96 96
Тензорные ядра 80 112 112 152 184 192
RT-ядра 20 28 28 38 46 48
Оперативная память
Разрядность шины, бит 128 128 192 256 256 256
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 750 (14 000) 1 875 (15 000) 1 875 (15 000) 1 750 (14 000) 1 750 (14 000) 1 188 (19 000)
Объем, Мбайт 8 192 8 192 12 288 8 192 8 192 8 192
Шина ввода/вывода PCI Express 4.0 x8 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 9 114 12 738 12 738 16 197 20 314 21 750
Производительность FP64/FP32 1/64 1/64 1/64 1/64 1/64 1/64
Производительность FP16/FP32 1/1 1/1 1/1 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 224 240 360 448 448 608
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 130 170 170 200 220 290
Розничная цена (США, без налога), $ 249 (рекоменд. в момент выхода) Н/Д 329 (рекоменд. в момент выхода) 399 (рекоменд. в момент выхода) 499 (рекоменд. в момент выхода) 599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 24 900 (рекоменд. в момент выхода) Н/Д 32 990 (рекоменд. в момент выхода) 39 990 (рекоменд. в момент выхода) 45 490 (рекоменд. в момент выхода) 57 900 (рекоменд. в момент выхода)

Одной ступенью выше появились разновидности GeForce RTX 3060 Ti, где вместо кристалла GA104 установлен предтоповый чип GA103, который ранее использовался лишь в ноутбучной версии RTX 3080 Ti. Однако для покупателей ничего не изменилось, ведь формулу GA103 подогнали под изначальные характеристики GeForce RTX 3060 Ti, оставив в неприкосновенности лишь 4864 из существующих на кристалле 7680 CUDA-ядер. Конфигурация VRAM, энергопотребление и, в конце концов, цена также остались прежними.

В свою очередь, AMD тоже выпустила еще одну видеокарту среднего ценового диапазона под названием Radeon RX 6650 XT (причем, надо отметить, модельные номера десктопных продуктов, заканчивающиеся на 50 или 5, компания не использовала уже очень давно). Так же как и RX 6600 XT, новая модель построена на базе чипа Navi 23, но в данном случае он был немного разогнан, а главное, пропускную способность чипов памяти увеличили с 16 до 17,5 Гбит/с, что имеет большое значение при узкой 128-битной и шине и небольшом по сравнению с топовыми представителями серии объеме кеша L3 (32 Мбайт). Вместе с тем потребляемая мощность возросла с 160 до 180 Вт, а цена — совсем незначительно. Сейчас оба устройства продаются намного дешевле, чем было рекомендовано в момент релиза, и доступны за $279 и $289 соответственно.

Radeon RX 6700 — видеокарта, появление которой было неизбежно, — представляет собой, как легко догадаться, урезанный вариант Radeon RX 6700 XT. Графический процессор в данном случае пострадал не так уж сильно: из 2560 шейдерных ALU оставили 2304 и понизили целевую тактовую частоту на 131 МГц. Важнее то, что объем памяти 10 вместо 12 Гбайт указывает на суженную с 192 до 160 бит шину VRAM. Впрочем, и мощность видеокарты, которая, прямо скажем, не отличалась выдающейся энергоэффективностью в полной конфигурации, составляет 175, а не 230 Вт. Как бы то ни было, видеокарты AMD 6000-й серии выглядят привлекательнее, чем раньше, благодаря крупным скидкам. Цены Radeon RX 6700 и 6700 XT сейчас опустились ниже релизной MSRP — до $329 и $359 соответственно.

Сам Radeon RX 6700 XT вместе с цифрами 50 в названии обновленной модели получил небольшой бонус тактовых частот GPU и видеопамять с пропускной способностью 18 Гбит/с, но и потребляемую мощность для этого пришлось повысить с 230 до 250 Вт.

ПроизводительAMD
Модель Radeon RX 6400 Radeon RX 6500 XT Radeon RX 6600 Radeon RX 6600 XT Radeon RX 6650 XT
Графический процессор
Название Navi 24 XL Navi 24 XT Navi 23 XL Navi 23 XT Navi 23 KXT
Микроархитектура RDNA 2 RDNA 2 RDNA 2 RDNA 2 RDNA 2
Техпроцесс, нм TSMC N6 TSMC N6 TSMC N7 TSMC N7 TSMC N7
Число транзисторов, млрд 5,40 5,40 11,06 11,06 11,06
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock ?/2 039/2 321 2 310/2 610/2 815 1 626/2 044/2 491 1 968/2 359/2 589 2 055/2 410/2 635
Шейдерные ALU FP32 768 1 024 1 792 2 048 2 048
Блоки наложения текстур (TMU) 48 64 112 128 128
Блоки операций растеризации (ROP) 32 32 64 64 64
Оперативная память
Разрядность шины, бит 64 64 128 128 128
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (16 000) 2 250 (18 000) 1 750 (14 000) 2 000 (16 000) 2 188 (17 500)
Объем, Мбайт 4 096 4 096 8 192 8 192 8 192
Объем Infinity Cache, Мбайт 16 16 32 32 32
Шина ввода/вывода PCI Express 4.0 x4 PCI Express 4.0 x4 PCI Express 4.0 x8 PCI Express 4.0 x8 PCI Express 4.0 x8
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 3 565 5 765 8 928 10 605 10 793
Производительность FP64/FP32 1/16 1/16 1/16 1/16 1/16
Производительность FP16/FP32 2/1 2/1 2/1 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 128 144 224 256 280
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1
TBP/TDP, Вт 53 107 132 160 180
Розничная цена (США, без налога), $ Н/Д 199 (рекоменд. на дату выхода) 329 (рекоменд. на дату выхода) 379 (рекоменд. на дату выхода) 399 (рекоменд. на дату выхода)
Розничная цена (Россия), руб. Н/Д 17 999 (рекоменд. на дату выхода) Н/Д Н/Д Н/Д

Что касается топовых моделей, то в этой категории потенциал обновления «красных» ускорителей был ограничен тем, что Radeon RX 6900 XT уже комплектуется полностью разблокированным графическим процессором Navi 21. Тем не менее, пока еще не наступило время 7000-й линейки, AMD нашла возможность легкого апгрейда флагманской видеокарты благодаря следующей версии кристалла, которая обеспечила гомеопатический рост тактовой частоты — на 60 МГц. А главное, в Radeon RX 6950 XT заменили оперативную память с пропускной способностью 16 Гбит/с чипами GDDR6 18 Гбит/с. Попутно увеличилась и потребляемая мощность (с 300 до 335 Вт). Верхушку серии Radeon RX 6000 также затронуло удешевление: Radeon RX 6950 XT практически вытеснил в рознице своего предшественника, а самые дешевые модификации устройства продаются за сумму от $749.

ПроизводительAMD
Модель Radeon RX 6700 Radeon RX 6700 XT Radeon RX 6750 XT Radeon RX 6800 Radeon RX 6800 XT Radeon RX 6900 XT Radeon RX 6950 XT
Графический процессор
Название Navi 22 XTL Navi 22 XT Navi 22 KXT Navi 21 XL Navi 21 XT Navi 21 XTX Navi 21 KXTX
Микроархитектура RDNA 2 RDNA 2 RDNA 2 RDNA 2 RDNA 2 RDNA 2 RDNA 2
Техпроцесс, нм TSMC N7 TSMC N7 TSMC N7 TSMC N7 TSMC N7 TSMC N7 TSMC N7
Число транзисторов, млрд 17,2 17,2 17,2 26,8 26,8 26,8 26,8
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock 1 941/2 174/2 450 2 321/2 424/2 581 2 150/2 495/2 600 1 700/1 815/2 105 1 825 /2 015/2 250 1 825 /2 015/2 250 1925 /2 100/2 310
Шейдерные ALU FP32 2 304 2 560 2 560 3 840 4 608 5 120 5 120
Блоки наложения текстур (TMU) 144 160 160 240 288 320 320
Блоки операций растеризации (ROP) 64 64 64 96 128 128 128
Оперативная память
Разрядность шины, бит 160 192 192 256 256 256 256
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (16 000) 2 250 (18 000) 2 000 (16 000) 2 000 (16 000) 2 000 (16 000) 2 250 (18 000)
Объем, Мбайт 10 240 12 228 12 228 16 192 16 192 16 192 16 192
Объем Infinity Cache, Мбайт 80 96 96 128 128 128 128
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 11 290 13 215 13 312 16 166 20 736 23 040 23 654
Производительность FP64/FP32 1/16 1/16 1/16 1/16 1/16 1/16 1/16
Производительность FP16/FP32 2/1 2/1 2/1 2/1 2/1 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 320 384 432 512 512 512 576
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1 DisplayPort 1.4, HDMI 2.1
TBP/TDP, Вт 175 230 250 250 300 300 335
Розничная цена (США, без налога), $ Н/Д 479 (рекоменд. на дату выхода) 549 (рекоменд. на дату выхода) 579 (рекоменд. на дату выхода) 649 (рекоменд. на дату выхода) 999 (рекоменд. на дату выхода) 1 099 (рекоменд. на дату выхода)
Розничная цена (Россия), руб. Н/Д Н/Д Н/Д Н/Д Н/Д Н/Д Н/Д

«Зеленые», в свою очередь, провели модернизацию GeForce RTX 3080, которая выражается в 256 бонусных CUDA-ядрах и 2 Гбайт VRAM, что вполне существенно, ведь некоторым играм уже не вполне хватает прежних 10 Гбайт видеопамяти при максимальных настройках графики. Вот только ни о каких скидках в данном случае речи не идет: MSRP видеокарты увеличилась с $699 до $799, а на самом деле она продается как минимум за $1 329 и вряд ли может соблазнить геймеров после того, как вышел GeForce RTX 4070 Ti. Оригинальный GeForce RTX 3080, напротив, впервые за свою историю доступен по рекомендованной стоимости (пусть и не от самых именитых производителей) и, таким образом, обладает превосходным соотношением «цена — производительность».

NVIDIA наконец созрела для того, чтобы выпустить десктопную видеокарту на основе полностью разблокированного старшего GPU семейства Ampere, GA102, — ею стал GeForce RTX 3090 Ti. Кроме того, новому флагману достались скоростные чипы памяти GDDR6X с пропускной способностью 21 Гбит/с, а штатное энергопотребление достигло рекордной величины 450 Вт. GeForce RTX 3090 Ti появился в то время, когда рекомендованные розничные цены видеокарт потеряли какой-либо смысл, так что NVIDIA и вовсе не стала обнародовать MSRP новинки. За ориентировочное значение для RTX 3090 Ti принимают $2 000, да и сегодня она стоит не меньше $1 799. Отдавать за нее такие деньги сейчас, разумеется, бессмысленно даже в том случае, если такая производительность и 24 Гбайт памяти нужны для рабочих задач, ведь GeForce RTX 4090, несмотря на повышенный спрос и цены, лучше отрабатывает вложенные средства.

ПроизводительNVIDIA
Модель GeForce RTX 3080 (10 Гбайт) GeForce RTX 3080 (12 Гбайт) GeForce RTX 3080 Ti GeForce RTX 3090 GeForce RTX 3090 Ti
Графический процессор
Название GA102 GA102 GA102 GA102 GA102
Микроархитектура Ampere Ampere Ampere Ampere Ampere
Техпроцесс Samsung 8N Samsung 8N Samsung 8N Samsung 8N Samsung 8N
Число транзисторов, млрд 28,3 28,3 28,3 28,3 28,3
Тактовая частота, МГц: Base Clock / Boost Clock 1 440/1 710 1 260/1 710 1 365/1 665 1 395/1 695 1 395/1 695
Шейдерные ALU FP32 8 704 8 960 10 240 10 496 10 752
Блоки наложения текстур (TMU) 272 280 320 328 336
Блоки операций растеризации (ROP) 96 112 112 112 112
Тензорные ядра 272 280 320 328 336
RT-ядра 68 70 80 82 84
Оперативная память
Разрядность шины, бит 320 384 384 384 384
Тип микросхем GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 188 (19 000) 1 188 (19 000) 1 188 (19 000) 1 219 (19 500) 1 313 (21 000)
Объем, Мбайт 10 240 12 288 12 288 24 576 24 576
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 29 768 30 643 34 099 35 581 36 449
Производительность FP64/FP32 1/64 1/64 1/64 1/64 1/64
Производительность FP16/FP32 1/1 1/1 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 760 912 912 936 1 008
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 320 350 350 350 450
Розничная цена (США, без налога), $ 699 (рекоменд. в момент выхода) 799 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 1 499 (рекоменд. в момент выхода) 1 999 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. 63 490 (рекоменд. в момент выхода) Н/Д 116 900 (рекоменд. в момент выхода) 136 990 (рекоменд. в момент выхода) Н/Д

GPU новой архитектуры от NVIDIA, AMD и Intel

#Intel Arc

Появления дискретных видеокарт от Intel ждали с большим энтузиазмом, и неспроста. Ключевые подробности архитектуры Xe-HPG, на которой основаны «синие» GPU, были обнародованы заранее, и сложилось впечатление, что она по большому счету не уступает решениям конкурентов, а в некоторых аспектах и превосходит их (устройство Xe-HPG мы подробно разбирали в обзорах Arc A380 и Arc A770). К тому же мы успели проверить в деле ускоритель Intel Iris Xe DG1 и остались довольны результатами. Эту экзотическую видеокарту можно было встретить только в составе некоторых предварительно собранных ПК, а сам графический процессор Xe DG1 является образцом мобильной графики Xe LP, «вырезанной» из мобильных CPU Tiger Lake и, следовательно, имеет немного общего с кремнием Arc. Тем не менее при чрезвычайно низком энергопотреблении — в пределах 25 Вт — у Iris Xe DG1 просто не было и нет аналогов среди десктопных «затычек» ни по игровой производительности, ни по арсеналу функций. Серия Arc в первом поколении тоже не распространяется на высокие категории цены и быстродействия. Сначала Intel анонсировала пять моделей с рекомендованной стоимостью от $139 до $349, а впоследствии — самую младшую, Arc A310, которая должна стоить еще дешевле.

В пересчете на основную масштабируемую единицу GPU — Xe-Core, которую можно условно приравнять к SM в чипах NVIDIA архитектуры Ampere (GeForce 30) и Ada (GeForce 40) либо CU в RDNA 3 (Radeon 7000-й серии), кремний Intel обладает такой же пропускной способностью шейдерных операций над числами FP32 и вдвое большей при целочисленных вычислениях. Преимущество Xe-HPG перед старой версией RDNA 2 (Radeon RX 6000) по обоим признакам является двукратным. При этом Intel сделала большой акцент на матричных (тензорных) операциях, а соответствующие компоненты логики Xe-HPG на бумаге опять-таки сулят вдвое большую производительность по сравнению с Ampere и находятся на одном уровне с Ada. Что касается трассировки лучей, то в этой дисциплине продукты Intel пока не могут соревноваться с «зелеными», но явно превосходят возможности Radeon RX 6000.

Обширные ресурсы матричной логики Intel задействовала в собственном алгоритме масштабирования кадров XeSS на основе глубинного обучения. XeSS обеспечивает впечатляющее качество изображения и, помимо Intel Arc, совместим практически со всеми более-менее современными GPU других производителей. На «чужом» железе используется упрощенная нейросеть, но даже в такой ситуации XeSS обеспечивает лучший результат по сравнению с распространенной технологией FSR первого поколения — это мы проверили в сравнительном тестировании видеокарт в Call of Duty: Modern Warfare II.

Наконец, чипы Arc имеют чрезвычайно быстрый декодер всех распространенных форматов доставки видео, приличную скорость кодирования (в том числе формата AV1) и поддерживают вывод сигнала DisplayPort 2.0 (а референсные карты Arc старших моделей — еще и HDMI 2.1).

GUNNIR Intel Arc A380 Photon

Увы, на практике все оказалось не так радужно, как в теории. Мы пока успели испытать только Arc A380 и Arc A770 и вынуждены констатировать, что в соответствующих ценовых категориях Intel не удалось сделать покупателям предложение, от которого невозможно отказаться. Младшая модель, несмотря на громадное преимущество по числу вычислительных блоков и 8 Гбайт VRAM, пасует в играх перед Radeon RX 6500 XT, который при этом и стоит ненамного больше. Вдвое большая скорость рейтрейсинга, нежели у RX 6500 XT, конечно, впечатляет, но для бюджетной видеокарты точно не является решающим преимуществом. Особенно обидно, что Arc A380 не хватает производительности даже для того, чтобы эффективно использовать фирменный апскейлинг XeSS (все алгоритмы на основе нейросети не бесплатны с точки зрения вычислительных ресурсов).

Как бы то ни было, Arc A380 ориентирована главным образом на китайский рынок и плохо представлена в других частях света. A750 и A770, в свою очередь, были выпущены в мировую розницу и даже доступны в виде референсных устройств с претензией на премиальную конструкцию от самой Intel. Arc A770 рассчитана на гейминг при разрешении 1080p на максималках, по быстродействию без трассировки лучей является аналогом GeForce RTX 3060 и ненамного уступает Radeon RX 6600 XT. Что касается рейтрейсинга, Intel опять переиграла AMD c разгромным счетом и по меньшей мере не отстает от NVIDIA в условиях гибридного рендеринга. Наконец, в отличие от младшей модели, Arc A770 способна извлечь большую пользу из апскейлинга XeSS.

Таким образом, в лице Arc A770 вырисовывается достойный конкурент GeForce RTX 3060: новинка и быстрее, и дешевле при условии, что мы рассматриваем версию A770 с 8, а не 16 Гбайт памяти. В то же время недавняя коррекция цен сделала Radeon RX 6600 XT более выгодным приобретением, если оставить за скобками игры с трассировкой лучей.

Intel Arc A770 Limited Edition

К сожалению, Intel пока не может позволить себе играть в осторожные игры с небольшим преимуществом по цене или производительности. Дело в том, что линейка Arc в ее текущем состоянии — это не более чем продукт для энтузиастов и ценителей экзотики. Интеловский драйвер все время после релиза колебался между состояниями «ужасный» и «проблемный», и даже сейчас, когда самые вопиющие баги остались в прошлом, опыт эксплуатации видеокарт Arc не будет гладким для рядового покупателя. Кроме того, все модели серии имеют общее ограничение: они настолько привязаны к функции Resizable BAR шины PCI Express, что без нее теряют значительную (от 14 до 34 % по результатам Arc A380) долю игрового фреймрейта и, как следствие, не годятся для апгрейда старых компьютеров.

#NVIDIA GeForce RTX 40

Работая над следующим поколением графических процессоров, NVIDIA положила все силы на экстенсивный рост характеристик и внесла лишь точечные функциональные изменения. Благодаря передовой фотолитографии TSMC 4N ей удалось увеличить транзисторный бюджет GPU до ранее немыслимых величин, а тактовые частоты устремились к символической отметке 3 ГГц.

С точки зрения микроархитектуры кремний Ada Lovelace, который лег в основу 40-й серии GeForce, обладает точно такой же удельной пропускной способностью шейдерных операций, как предыдущие чипы Ampere, а существенному апгрейду в очередной раз подверглись только блоки трассировки лучей и тензорная логика: NVIDIA вновь рапортует об удвоенной скорости некоторых операций рейтрейсинга и обработки данных методами глубинного обучения. Кроме того, вслед за ускорителями Intel Arc «зеленые» GPU впервые приобрели возможность кодировать в железе стандарт видео AV1. Подробнее мы разбирали архитектурные особенности и характеристики 40-й серии в обзоре GeForce RTX 4090.

Титульной функцией Ada является мощный интегрированный ASIC для вычислений оптического потока, который используется не только в целях обработки видео, но и новой, уже третьей по счету, версией апскейлинга DLSS. Пусть DLSS остается золотым стандартом качества изображения и гарантирует крупный прирост игрового фреймрейта в любой весовой категории графических процессоров, для настолько мощных ускорителей, как топы нового семейства, его возможностей уже недостаточно: ограничителем кадровой частоты довольно быстро становится центральный процессор. DLSS 3.0 решает эту проблему путем генерации промежуточных кадров на основе векторов движения и анализа оптического потока. Ну а для будущих средних и младших моделей линейки это просто еще один источник «бесплатных» FPS.

ПроизводительNVIDIA
Модель GeForce RTX 4070 Ti GeForce RTX 4080 GeForce RTX 4090
Графический процессор
Название AD104 AD103 AD102
Микроархитектура Ada Lovelace Ada Lovelace Ada Lovelace
Техпроцесс TSMC 4N TSMC 4N TSMC 4N
Число транзисторов, млрд 35,8 45,9 76,3
Тактовая частота, МГц: Base Clock / Boost Clock 2 310/2 610 2 210/2 505 2 230/2 520
Шейдерные ALU FP32 7 680 9 728 16 384
Блоки наложения текстур (TMU) 240 304 512
Блоки операций растеризации (ROP) 80 112 176
Тензорные ядра 240 304 512
RT-ядра 60 76 128
Оперативная память
Разрядность шины, бит 192 256 384
Тип микросхем GDDR6X SGRAM GDDR6X SGRAM GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 1 313 (21 000) 1 400 (22 400) 1 313 (21 000)
Объем, Мбайт 12 228 16 384 24 576
Объем кеша L2, Мбайт 48 64 96
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 40 090 48 737 82 575
Производительность FP64/FP32 1/64 1/64 1/64
Производительность FP16/FP32 1/1 1/1 1/1
Пропускная способность оперативной памяти, Гбайт/с 504 717 1 008
Вывод изображения
Интерфейсы вывода изображения DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт 285 320 450
Розничная цена (США, без налога), $ 799 (рекоменд. в момент выхода) 1 199 (рекоменд. в момент выхода) 1 599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб. Н/Д Н/Д Н/Д

NVIDIA успела выпустить три GPU нового поколения (AD102, AD103 и AD104) и три соответствующие видеокарты (RTX 4090, RTX 4080, RTX 4070 Ti). Все новинки демонстрируют огромный рост характеристик по сравнению со своими формальными предшественниками, особенно GeForce RTX 4090, который отличился умопомрачительным компонентным бюджетом GPU в 76,3 млрд транзисторов и формулой основных вычислительных блоков, которая включает 16 384 FP32-совместимых CUDA-ядра. Таким образом, теоретическое быстродействие флагмана оценивается в 2,3 раза выше по сравнению с GeForce RTX 3090 Ti, правда, при столь же чудовищном энергопотреблении вплоть до 450 Вт. Другая примета чипов Ada состоит в том, что, несмотря на использование компанией NVIDIA скоростных чипов памяти GDDR6X с номиналом 21 либо 22,4 Гбит/с, общей пропускной способности VRAM таким видеокартам уже недостаточно, однако дефицит ПСП компенсирует большой объем кеша второго уровня — вплоть до 72 Мбайт.

MSI GeForce RTX 4090 SUPRIM X

В абсолютных числах игровой производительности GeForce RTX 4090 стал первой видеокартой за долгие годы, которая тянет практически все актуальные игры в режиме 4К на максималках, удерживая кадровую частоту выше 60 FPS, а большинство из них — даже с рейтрейсингом без всякого масштабирования кадров. В свою очередь, по относительным оценкам GeForce RTX 4090 превосходит аналогичную модель прошлого поколения, GeForce RTX 3090, на 62 либо 72 % в зависимости от того, активна ли трассировка лучей. А главное, несмотря на традиционно высокую для просьюмерских устройств рекомендованную стоимость ($1 599), RTX 4090 предлагает на 50–60 % больше FPS в пересчете на доллар MSRP по сравнению с RTX 3090. В данный момент новинка пользуется ажиотажным спросом и потому продается дороже рекомендованного значения — она стоит более 2 тысяч долларов. Однако уже наметилась тенденция к нормализации цен, а никаких производственных трудностей у NVIDIA, судя по всему, нет.

К сожалению, GeForce RTX 4090 пока является единственным представителем нового поколения, который сделал то, что от него требовалось, — обеспечил крупный сдвиг в стоимости игровых FPS. И это при том, что RTX 4090 — в неменьшей степени рабочая, чем геймерская видеокарта. Про следующие новинки такого не скажешь. GeForce RTX 4080 также обладает гигантской вычислительной мощностью, которой достаточно для комфортной игры в 4К без масштабирования кадров, а в ряде случаев еще и с трассировкой лучей. Вот только у GeForce RTX 4080, который оценили в $1 199, есть более высокий ориентир производительности на доллар — оригинальная версия RTX 3080. По этому параметру старая и новая видеокарта в лучшем случае равны (когда действует рейтрейсинг), а в худшем (без трассировки лучей) NVIDIA теперь продает каждый FPS дороже, чем раньше.

Palit GeForce RTX 4080 GameRock OC

GeForce RTX 4070 Ti попал в точно такую же ситуацию несмотря на то, что ближе к середине модельного ряда обычно располагаются наиболее выгодные покупки. С технической точки зрения к RTX 4070 Ti нет никаких претензий: видеокарта располагает по большому счету такой же производительностью, как GeForce RTX 3090, хотя потребляет лишь 285 вместо 350 Вт мощности, позволяет играть в режиме 1440p без компромиссов, а с помощью апскейлинга — и в 4К. А вот по сравнению с GeForce RTX 3070 Ti (изначально переоцененной видеокартой!) новинка, получившая беспрецедентно высокий для своей категории ценник $799, развивает от силы 16 % бонусного фреймрейта в пересчете на доллар MSRP.

У всех топовых представителей 40-й линейки есть и другая проблема, которая, возможно, обойдет стороной младшие модели. Дело в том, что они используют для питания разъем 12VHPWR, предусмотренный спецификациями PCI Express 5.0 и блоков питания ATX 3.0. Новый разъем рассчитан на передачу вплоть до 600 Вт мощности по одному кабелю, хотя имеет всего лишь 16 силовых контактов вместо 32, распределенных по четырем старым восьмиконтактным разъемам такого же совокупного номинала. Это обстоятельство само по себе снижает запас прочности 12VHPWR, но вдобавок ко всему большинству пользователей теперь придется запитывать видеокарту через переходник с двух, трех или четырех восьмиконтактных розеток на один 12VHPWR. А где переходники, там опасность плохих соединений, перегрузки кабелей и в конце концов запах горящего пластика. Напомним, что сажать питание GeForce RTX 4080 или тем более RTX 4090 на разветвляющиеся кабели старого БП с двумя штекерами недопустимо, а лучше этого не делать и с RTX 4070 Ti.

Palit GeForce RTX 4070 Ti GameRock OC Classic

#Radeon RX 7000

В отличие от продуктов NVIDIA, «красным» GPU предстояла глубокая модернизация. Несмотря на высокую энергоэффективность ускорителей Radeon RX 6000, уже в прошлом поколении «зеленая» архитектура была значительно мощнее, не говоря уже о посредственном быстродействии RDNA 2 в игровом рейтрейсинге и отсутствии специализированных матричных (тензорных) массивов ALU.

AMD Radeon RX 7900 XTX

На фундаментальном уровне логика RDNA 3 совершила такой же переход, как «зеленый» Ampere: число FP32-совместимых шейдерных ALU внутри каждого Compute Unit’а было удвоено, а целочисленные расчеты GPU выполняет в половинном темпе. Таким образом, между основными строительными блоками RDNA 3 с одной стороны и Ampere/Ada с другой по этому параметру можно поставить знак равенства. Кроме того, максимальное количество CU на одном кристалле увеличили с 80 до 96, что означает максимум 12 288 вещественночисленных шейдерных ALU стандартной точности (хотя AMD по непонятной причине указывает в спецификациях 6 114 — без удвоения). В свою очередь, модернизированные блоки трассировки лучей, по утверждению AMD, развивают производительность на 80 % больше, нежели в RDNA 2. «Красные» чипы нового поколения по-прежнему лишены выделенной логики для матричных операций — вычисления такого рода ложатся на шейдерные ALU, однако теперь должны происходить в 2,7 раза быстрее. Как бы то ни было, у AMD нет и такой программной инфраструктуры, как у NVIDIA, чтобы оправдать инвестиции транзисторного бюджета в собственный аналог отдельных тензорных ядер.

Зато, как уже происходило раньше, AMD лидирует в новых методах физического исполнения CPU и GPU. Флагманский чип нового поколения, Navi 31, на котором основаны модели Radeon RX 7900 XT и RX 7900 XTX, стал первым графическим процессором, созданным по принципам чиплетной компоновки. Контроллеры памяти, хранилище Infinity Cache и другие плохо масштабируемые uncore-детали распределили по шести кристаллам MCD, в то время как ядро GPU (чиплет GCD) осталось монолитным. При этом чиплеты двух типов производятся по различной технологической норме: MCD довольствуются старой фотолитографией TSMC N6, а GCD выпускается на передовой линии TSMC N5 (вариацию этого узла под названием 4N использует NVIDIA для производства кристаллов Ada). В общей сложности чипсет Navi 31 содержит 57,7 млрд транзисторов.

Для того чтобы насытить данными такой мощный графический процессор, AMD пришлось вернуться к 384-битной шине памяти, которую дополняет чрезвычайно высокая скорость чипов GDDR6 (20 Гбит/с) и кеш третьего уровня объемом 96 Мбайт. Среди вторичных функций отметим контроллер DisplayPort 2.1 (которого, кстати, нет в GeForce 40) и HDMI 2.1, а также обязательное с недавних пор кодирование AV1 силами выделенного ASIC.

ПроизводительAMD
Модель Radeon RX 7900 XT Radeon RX 7900 XTX
Графический процессор
Название Navi 31 XT Navi 31 XTX
Микроархитектура RDNA 3 RDNA 3
Техпроцесс, нм TSMC N5/N6 TSMC N5/N6
Число транзисторов, млрд 57,7 57,7
Тактовая частота, МГц: Base Clock / Game Clock / Boost Clock 1 500 /2 025/2 394 1 855 /2 269/2 499
Шейдерные ALU FP32 5 376 (10 752) 6 144 (12 228)
Блоки наложения текстур (TMU) 326 384
Блоки операций растеризации (ROP) 192 192
Оперативная память
Разрядность шины, бит 320 384
Тип микросхем GDDR6 SGRAM GDDR6 SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 500 (20 000) 2 500 (20 000)
Объем, Мбайт 20 480 24 576
Объем Infinity Cache, Мбайт 80 96
Шина ввода/вывода PCI Express 4.0 x16 PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 25 740 (51 481) 30 708 (61 116)
Производительность FP64/FP32 1/32 (1/64) 1/32 (1/64)
Производительность FP16/FP32 2/1 2/1
Пропускная способность оперативной памяти, Гбайт/с 800 960
Вывод изображения
Интерфейсы вывода изображения DisplayPort 2.1, HDMI 2.1a DisplayPort 2.1, HDMI 2.1a
TBP/TDP, Вт 315 335
Розничная цена (США, без налога), $ 899 (рекоменд. на дату выхода) 999 (рекоменд. на дату выхода)
Розничная цена (Россия), руб. Н/Д Н/Д

Что касается теоретических оценок быстродействия, то флагманский Radeon RX 7900 XTX находится в промежутке между GeForce RTX 4080 и RTX 4090 при энергопотреблении 355 Вт, хотя стоит дешевле первого — $999. В свою очередь, урезанный по всем ключевым признакам (конфигурация GPU, разрядность шины памяти и ее объем в 20 вместо 24 Гбайт) и до $899 в цене Radeon RX 7900 XT также превосходит GeForce RTX 4080 на бумаге и рассчитан на потребляемую мощность 315 Вт.

А вот насколько теория сходится с практикой, мы проверим самостоятельно в ближайшее время. После новогодних каникул у нас большие планы по тестированию видеокарт, в которые входит Intel Arc A750 и, разумеется, кастомные модификации новых устройств от партнеров AMD и NVIDIA.



Оригинал материала: https://3dnews.kz/1080145