Дебют игровых видеокарт под маркой Arc, безусловно, стал одним из самых ожидаемых и запоминающихся событий IT-индустрии по меньшей мере в текущем году. Кому, если не Intel, по силам такая монументальная задача — стать третьим игроком на рынке дискретных GPU, уже давно поделенном между собой NVIDIA и AMD. В конце концов, у Intel есть обширный опыт разработки интегрированной графики, а сами ускорители Arc не являются первыми ее дискретными решениями даже в последнее время (не говоря уж о предыдущих попытках компании выйти на этот рынок). Ранее Intel выпустила чип Xe DG1 для ультрабуков и одноименную видеокарту, причем весьма неплохо себя показавшую в роли «затычки» для предварительно собранных настольных ПК (у нас ей был посвящен отдельный обзор). В свою очередь, графические процессоры Arc не только сулят более высокую производительность, но и с функциональной точки зрения не отстают от актуальных предложений конкурентов, а в некоторых аспектах даже опережают их.
Впрочем, читатели уже наверняка знают, чем обернулся релиз первого, самого младшего представителя серии Arc. Нельзя сказать, что видеокарта Arc A380 однозначно провалилась, но Intel пришлось столкнуться с серьезными проблемами и, возможно, пересмотреть из-за этого дальнейшие планы на все семейство. Нам же, вследствие известных событий и разрыва отношений Intel с российскими партнерами, лишь сейчас представилась возможность составить собственное мнение об Arc A380. Но, с другой стороны, это, может быть, и к лучшему. Похоже, именно двух месяцев, прошедших со времени релиза, создателям Arc и не хватило, чтобы заранее обеспечить приемлемое качество сопутствующего ПО, а сами видеокарты в то время еще не были доступны где бы то ни было за пределами Китая. При использовании актуального драйвера испытания Arc A380 прошли без особенных трудностей, а результаты тестов наверняка лучше иллюстрируют реальные преимущества и недостатки устройства. Но, как обычно, начнем обзор с анализа технических характеристик и архитектуры новых GPU.
⇡#Архитектура Intel Xe-HPG
В основу первого поколения дискретных видеокарт под маркой Arc лягут два графических процессора: DG2-128 и DG2-512. Чипы первой волны относятся к семейству Alchemist, а на будущее уже запланированы следующие серии — Battlemage, Celestial и Druid, но все перечисленные варианты кремния объединяет микроархитектура Xe-HPG.
В соответствии с названием Xe-HPG выступает наследником Xe-LP — графического модуля центральных процессоров Core, начиная с 11-го поколения, и дискретного чипа Xe DG1. Тем не менее архитектура Xe-HPG подчиняется иной внутренней организации, которая в общих количественных и качественных показателях больше напоминает продукты NVIDIA (и — в меньшей степени — AMD), чем предыдущие наработки самой Intel, и роднит десктопные GPU с грядущими серверными решениями Xe-HPC.
Вместо исполнительных блоков (EU), число которых служит основной характеристикой производительности Xe-LP, фундаментальным элементом Xe-HPG теперь является Xe-Core. По примеру потокового мультипроцессора (SM) в чипах NVIDIA, ядро Xe-Core объединяет набор FP32-совместимых ALU с кешем нулевого и первого уровня, блоками load/store и прочей обслуживающей логикой. А на более глубоком уровне ALU скомпонованы в 16 векторных блоков по 8 ALU каждый. Как следствие, интеловский Xe-Core претендует на такую же пиковую производительность в 128 операций с плавающей запятой за такт, как SM архитектуры Ampere, что позволяет выполнять наглядное, но, увы, лишь приблизительное сравнение продуктов той и другой компании по паспортным данным. К сожалению, Intel не опубликовала настолько же подробных данных о Xe-HPG, как делает NVIDIA в документации к своим чипам. В частности, трудно найти информацию из первых рук о том, как внутри Xe-Core устроена работа с целочисленными шейдерными инструкциями и тригонометрическими операциями. Также неизвестно, насколько велика конкуренция тех или иных вычислительных ресурсов за такты и порты диспетчера инструкций, а это в конечном счете определяет потенциал эффективной загрузки GPU в реальных приложениях.
Помимо векторных блоков, занятых исполнением шейдерного кода, существенный объем Xe-Core выделен матричной (тензорной) логике. Каждый Xe-Core содержит 16 матричных блоков XMX, способных обрабатывать по 64 операции с данными половинной точности (FP16) за такт. А в сумме Xe-Core развивает пропускную способность вплоть до 1024 операций за такт, что равно 2048 FLOPS операций FMA на герц тактовой частоты. Как следствие, Xe-Core теоретически не уступает потоковому мультипроцессору NVIDIA в традиционных шейдерных расчетах, но вдвое превосходит SM, когда речь идет о тензорных вычислениях, необходимых для обработки данных алгоритмами глубинного обучения.
Более крупной структурной единицей архитектуры, чем Xe-Core, является Render Slice. В рамках семейства Alchemist один Render Slice содержит 4 Xe-Core и практически все остальные детали современного GPU. Среди них элементы фиксированной функциональности — 32 блока наложения текстур и 16 ROP, — геометрический фронтенд, а также 4 блока рейтрейсинга. На последние возложен точно такой же набор функций, как в чипах конкурентов (трассировка луча в иерархической структуре полигонов сцены (BVH) и поиск точки падения луча на полигон), а производительность RT-блоков должна быть как минимум не хуже, чем у графических процессоров AMD. Intel заявляет о впечатляющей пропускной способности в 12 пересечений луча с боксом BVH и 1 пересечение с полигоном за такт GPU, при том что в рамках «красной» архитектуры RDNA 2 эти параметры составляют 4 и 1 соответственно. NVIDIA, в свою очередь, не раскрывает всех данных, необходимых для сравнения, но известно, что RT-блок в Turing находит одно пересечение с полигоном за такт, а в Ampere — уже два. Как бы то ни было, если учесть, что количество RT-блоков и главных организационных единиц программируемой логики (Xe-Core, SM и Compute Unit) в рамках GPU трех компаний находится в соотношении 1:1, то по общему быстродействию в задачах трассировки лучей устройства Intel смогут более уверенно конкурировать с ускорителями NVIDIA, чем представители семейства Radeon RX 6000.
Варьируя количество Render Slice на чипе, Xe-HPG позволяет конструировать графические процессоры необходимого класса быстродействия и потребляемой мощности. Остается добавить лишь глобальный диспетчер инструкций, шину памяти, общий для всех Render Slice кеш второго уровня и массу логики фиксированной функциональности: интерфейс PCI Express, видеокодек, контроллер дисплея и т. д.
Что касается двух последних компонентов, то продукты Intel и ранее умели с высокой скоростью декодировать любые форматы компрессии видео, актуальные для распространения контента, включая AV1. А теперь Intel представила первое в индустрии решение для аппаратного кодирования VP9 и AV1, которое дополняет ранее существующие возможности работы с H.264 и HEVC. Продукты семейства Arc также первыми обрели поддержку интерфейса DisplayPort 2.0. По сравнению с предшествующей версией стандарта (1.4а) он располагает втрое большей пропускной способностью, что позволяет довести максимальное разрешение дисплея вплоть до 10К (10 240 × 4 320) при кадровой частоте 60 Гц и 24-битном цвете без применения компрессии DSC. Более реалистичным сценарием конфигурации DisplayPort 2.0 является подключение нескольких экранов меньшего разрешения, в частности VR-шлемов сверхвысокой четкости. DisplayPort 2.0 на видеокартах Arc ограничен разрешением 8К при частоте кадров 60 Гц, но, в отличие от DisplayPort 1.4a, такой режим больше не требует компрессии. А вот интерфейс HDMI 2.1 здесь почему-то не используется, только 2.0b.
⇡#Программная сторона Intel Arc: большие перспективы и большие проблемы
Дизайнеры архитектуры Xe-HPG сделали основную ставку на обслуживание нейросетей. Для мобильных решений и будущих высокопроизводительных десктопных GPU на чипах Intel актуальна возможность ускорения определенных рабочих задач средствами глубинного обучения, но поскольку Arc — это в первую очередь серия игровых видеокарт, на передний план выходит алгоритм апскейлинга при помощи нейросети XeSS (Xe Superscaling). Как и технология DLSS в ее последних итерациях, XeSS использует кадр сравнительно низкого исходного разрешения, чтобы создать изображение большего размера, а отсутствующие детали восстанавливаются на основе векторов движения, буфера глубины и данных предшествующих кадров. Система не нуждается в тренировке под каждую новую игру и, к чести Intel, является открытым стандартом, которым могут воспользоваться любые разработчики ПО и графических процессоров, включая конкурентов. Алгоритм XeSS способен работать не только на устройствах серии Arc с помощью «родных» инструкций для блоков XMX, но и на всех остальных GPU, знакомых с общепринятым форматом инструкций DP4a. А значит, список потенциально совместимых видеокарт распространяется на ускорители NVIDIA не старше GeForce 10, Radeon серии RX 6000 и даже интегрированную графику Intel в процессорах Core 11-го и 12-го поколения.
Разумеется, остаются открытыми вопросы качества масштабирования и быстродействия XeSS, особенно на «чужом» железе, для которого предполагается использовать упрощенные вычислительные кернелы. Но все же надо признать, что Intel сделала первую и пока единственную попытку создать индустриальный стандарт апскейлинга на основе искусственного интеллекта, не привязанный к продуктам того или иного производителя. Жаль только, что поддержка XeSS еще не реализована хотя бы в единственной игре. Вполне предсказуемая ситуация, если учесть мизерную долю, которую успели занять на рынке интеловские дискретные GPU, и существование двух устоявшихся решений — DLSS и FSR, которые Intel предлагает если не вытеснить, то дополнить третьим. Впрочем, поддержку XeSS уже запланировали в ряде грядущих тайтлов, включая Call of Duty: Modern Warfare II, и собираются внедрить в существующие игры — такие как Shadow of the Tomb Raider и HITMAN III.
Следом за ускорителями NVIDIA на чипах Turing и Ampere, а также Navi второго поколения от AMD, видеокарты Arc приобрели полную поддержку функций интерфейса программирования DirectX 12 Ultimate, который позволяет реализовывать в играх более сложные графические эффекты и эффективнее задействовать ресурсы GPU. Однако складывается впечатление, что в некоторых отношениях Intel бежит впереди паровоза в погоне за новейшими технологиями. Так, чипы Arc первыми среди дискретных GPU избавились от нативной поддержки DirectX 9. Это не значит, что старые игры совершенно не совместимы с Arc, но их придется запускать через прослойку эмуляции D3D9On12. В теории ресурсов современного GPU достаточно, чтобы компенсировать неминуемые потери быстродействия, ведь речь идет о старых играх. И все же у любых средств эмуляции есть свои ограничения, а решать проблемы совместимости теперь придется Microsoft — возможно, раньше, чем предполагали в Редмонде, и только ради Intel, ведь пока нет никакой информации о том, что NVIDIA и AMD тоже собираются пустить DirectX 9 под нож.
В то время как соперники опираются на свои предыдущие решения, Intel пришлось выполнить немало работы с чистого листа, и поддержку устаревших стандартов резонно оставили в конце списка приоритетов. Похоже, именно этим объясняется еще и тот факт, что Intel не советует использовать ускорители Arc в компьютерах, лишенных функции Resizable BAR шины PCI Express. Технически это возможно, но, как покажут бенчмарки, потери быстродействия настолько велики, что лучше все-таки прислушаться к рекомендации Intel.
Что касается багов драйвера и управляющего ПО, то мы уже не столкнулись с такими ужасами, о которых рассказывали западные обозреватели в первые дни после релиза Arc A380. Все тестовые игры работают без каких-либо проблем, за исключением полностью трассированных модификаций Quake II RTX и Minecraft, а также Total War: WARHAMMER III, где появляются визуальные артефакты. Но мы не можем поручиться за совместимость Arc с какими-либо другими тайтлами и железом, а программа настройки Arc Control нуждается как минимум в ревизии, а еще лучше в полной замене. На фоне удобства и богатства функций, которое предлагают утилиты NVIDIA и AMD, Intel застряла в каменном веке, а альтернативных сторонних решений — в частности, для оверклокинга — пока не существует.
Самая раздражающая особенность Arc Control связана с тем, что интерфейс приложения выглядит как обычное окно, но в действительности это полупрозрачный слой поверх всего рабочего стола, который не позволяет одновременно взаимодействовать с какими-либо другими программами. Кроме того, вместе с Arc Control устанавливается старая утилита Graphics Command Center, и неспроста: часть настроек GPU открыты лишь там, а некоторые опции почему-то, наоборот, дублируются. Судя по ранним отзывам, дебютная версия программного комплекта работала еще хуже, но даже в существующем, усовершенствованном виде он определенно не соответствует настолько амбициозному и статусному проекту, как Intel Arc.
⇡#Технические характеристики, цены
Серия видеокарт Arc, начиная с бюджетной модели Arc A380 и заканчивая флагманским ускорителем Arc A770, делится на три группы устройств — Arc 3, Arc 5 и Arc 7, при этом две последних основаны на одном и том же GPU с различным набором действующих вычислительных блоков.
Минимальная конфигурация архитектуры Xe-HPG, реализованная в чипе DG2-128, состоит из двух Render Slice, содержащих в общей сложности 1024 FP32-совместимых шейдерных ALU, 64 блока наложения текстур и 32 ROP. В основе ускорителя Arc A380 лежит полностью функциональная версия DG2-128, а среди его главных соперников точно такой же формулой компонентов обладает Radeon RX 6500 XT. Бросается в глаза лишь то, что графический процессор довольствуется чрезвычайно узкой даже по меркам бюджетных видеокарт 96-битной шиной памяти. Кроме того, если Navi 24 установил новую планку компонентного бюджета в своем классе — 5,4 млрд транзисторов, то что вы скажете про 7,2 млрд транзисторов DG2-128? К счастью, TSMC предоставила в распоряжение Intel фотолитографию N6, которую также использует AMD для выпуска Navi 24. Производственные мощности с нормой 10 нм, которыми сейчас располагает Intel, считаются аналогом 7 нм у TSMC, но по тем или иным причинам оказались не слишком приспособлены для GPU.
Как и все современные центральные либо графические процессоры, DG2-128, способен динамически регулировать тактовую частоту в зависимости от текущего энергопотребления и характера нагрузки. Базовое значение составляет 2 ГГц, а верхнюю границу, судя по всему, оставили на усмотрение партнеров. Другие паспортные характеристики Arc A380 включают 6 Гбайт памяти GDDR6 с пропускной способностью 15,5 Гбит/с на контакт шины, восемь линий интерфейса PCI Express четвертого поколения, а энергопотребление не превышает 75 Вт.
В свою очередь, большой чип Arc объемом в 21,7 млрд транзисторов состоит из восьми Render Slice (что соответствует 4096 шейдерным ALU, 256 TMU и 128 ROP) и обладает 256-битной шиной VRAM. Путем отбраковки кристаллов Intel получила на основе DG2-512 три устройства в диапазоне мощности от 175 до 225 Вт. Если сравнить флагманскую модель — Arc A770 — с предложениями конкурентов по формальным признакам, может сложиться впечатление, будто ей предстоит конкурировать с такими видеокартами, как Radeon RX 6800, но, судя по неподтвержденным прогнозам и результатам нашего тестирования Arc A380, архитектура Xe-HPG в действительности не настолько эффективна, а предел амбиций Intel находится на уровне Radeon RX 6700 и GeForce RTX 3060 Ti.
Как бы то ни было, пока нет никаких твердых данных о сроках релиза и рекомендованных ценах старших представителей семейства Arc, а в последнее время ходят слухи, что Intel и вовсе может поставить на дальнейших планах крест.
Единственный продукт, который успел дойти до покупателя, — это Arc A380, но и его присутствие на ранке можно назвать чисто символическим. Видеокарта долгое время не выходила за пределы испытательного полигона в Китае, где ее продвигает компания GUNNIR — малоизвестный в других частях света партнер Intel. На западных торговых площадках свою модификацию Arc A380 представила только ASRock по минимальной цене в $140, которая — опять-таки согласно результатам наших тестов — хорошо соответствует возможностям устройства. При более высокой стоимости Arc A380 уже играет с огнем, вступая в конфронтацию с подешевевшим до $166 Radeon RX 6500 XT. Увы, именно такая ситуация сложилась в силу ограниченного предложения, а размах цен ASRock Challenger Arc A380 сейчас достигает отметки $191. Новинка больше интересует вендоров как часть предварительно собранных ПК (в частности, подобные системы уже выпустили ASUS и MSI).
То же самое, но с местной спецификой происходит на российском рынке. Никто не поставляет в Россию Arc A380 по официальным каналам, а единственную возможность прикоснуться к экзотике обеспечили продавцы на «Авито», которые заказывают устройства непосредственно в Китае. Мы, например, приобрели видеокарту — тот самый GUNNIR — для теста за сумму в 19 990 руб., в которую входит и стоимость пересылки в Москву. Жителям Китая видеокарта обходится куда дешевле — 1 299 юаней, или, в пересчете на доллар по текущему курсу, $188. Для сравнения: розничные цены GeForce GTX 1650 сейчас опустились на уровень 13 990 руб., а Radeon RX 6500 XT можно взять за 16 362. Ответ на вопрос, стоит ли новинка таких денег, уже наверняка очевиден из тона статьи, однако не будем голословны и — после физического осмотра — продемонстрируем результаты Arc A380 в игровых бенчмарках.
⇡#GUNNIR Intel Arc A380 Photon
У Arc A380 не существует референсного дизайна, но GUNNIR Photon вполне можно считать таковым, если учесть, что китайский производитель фактически является главным партнером Intel по запуску новинки. Несмотря на то, что устройство принадлежит к экономклассу геймерских видеокарт, оно продается в жесткой коробке и подкупает лаконичным дизайном — в актуальной стилистике Intel — без каких-либо признаков кустарщины и дешевизны. Есть даже светодиодная подсветка, расположенная в торце кожуха.
Характеристики Arc A380 рассчитаны на потребляемую мощность 75 Вт, что в теории позволяет обойтись без дополнительного питания, но GUNNIR Photon на всякий случай снабжен даже не шести-, а восьмиконтактным разъемом 12 В — по всей видимости, из-за пометки «OC» в названии продукта. Это довольно крупная видеокарта, которая занимает в корпусе два полных слота расширения и охлаждается парой вентиляторов с диаметром крыльчатки 90 мм. При незначительной загрузке GPU кулер переходит в пассивный режим.
Обратная поверхность печатной платы закрыта бэкплейтом, причем не пластиковым, а металлическим.
Радиатор представляет собой блок алюминия с фрезерованными ребрами, но через него пропустили термотрубку, которая непосредственно контактирует с кристаллом GPU. Чипы локальной памяти передают тепло основанию радиатора, а вот компоненты VRM не имеют активного охлаждения, что, впрочем, при умеренном энергопотреблении Arc A380 не является серьезным поводом для беспокойства.
Регулятор напряжения GPU представлен двумя силовыми каскадами (что опять-таки высоко характеризует GUNNIR Photon, иначе здесь использовали бы дискретные MOSFET’ы) с номинальным током 70 А под управлением ШИМ-контроллера Monolithic Power Systems M2940. Питание чипов памяти GDDR6 — однофазное, с большим резервом тока вплоть до 60 А.
Узкая 96-битная шина VRAM позволяет набрать объем в 6 Гбайт всего лишь тремя микросхемами, и в данном случае они работают с пониженной пропускной способностью 15,5 Гбит/с вместо номинальных 16.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.