Обзор видеокарты NVIDIA GeForce GTX 750 Ti: первый GPU на архитектуре Maxwell / Видеокарты

GeForce GTX 750 Ti, как следует из названия, — это видеоадаптер начального уровня. Одновременно NVIDIA запускает GeForce GTX 750, а название GTX 740 остается зарезервированным для наиболее дешевой и слабой модели. И все же GTX 750 Ti — бюджетный вариант и как таковой не вызвал бы большого интереса, если бы в то же время не являлся первой моделью на базе архитектуры Maxwell. Соответственно, на примере GTX 750 Ti у нас есть возможность изучить Maxwell как в теории, так и на практике, не дожидаясь выхода флагманского GPU.

В основе GTX 750 Ti лежит графический процессор GM107. В существующей номенклатуре NVIDIA позицию 107 занимает наиболее компактное ядро. Соответственно, в будущем следует ожидать появления GM104 и GM110 (или GM101). Однако транзисторный бюджет GM107 не так уж мал для его класса — 1,87 млрд. Для сравнения: GK107 состоит из 1,3 млрд транзисторов.

Количество вычислительных блоков GM107 ощутимо больше, чем у GK107: 640 ядер CUDA и 40 текстурных блоков вместо 384 и 32 соответственно. Однако GM107 по-прежнему обладает 16 блоками ROP и 128-битной шиной памяти. Сами по себе эти числа не удивляют, если бы не тот факт, что GM107 остался в тех же рамках энергопотребления, что и GK107 (заявленный TDP даже немного меньше — 60 против 64 Вт). По сути, это и есть предназначение архитектуры Maxwell — увеличить производительность на ватт.

⇡#Архитектура Maxwell

Если судить по представленным диаграммам, основное новшество Maxwell заключается в незначительной на вид, но потенциально весьма эффективной реорганизации блоков GPU. На глобальном уровне GM107 следует принципам, заложенным еще в Kepler (подробнее о них можно прочитать в обзоре GeForce GTX 680). Вся вычислительная логика сосредоточена в структуре под названием Graphics Processing Cluster (GPC), которая в GM107 всего одна, хотя в более крупных чипах их будет больше. Вне GPC расположен весь back-end процессора в виде блоков ROP и двух 64-битных контроллеров памяти, а также Giga Thread Engine, выполняющий функции смены контекста, одновременного исполнения kernel’ов и распределения потоков нагрузки между GPC (последнее пока — не наш случай). Количественное отличие от Kepler здесь состоит в кеше L2, увеличенном с 256 до 2048 Кбайт, что должно компенсировать узкую, 128-битную шину, а также сократить расход энергии на транзакции с весьма прожорливой памятью, каковой является GDDR5 SDRAM.

На уровне GPC значимых нововведений по сравнению с Kepler не заметно. Есть несколько Stream Multiprocessors, и есть единственный Raster Engine, выполняющий первоначальные стадии рендеринга: определение граней полигонов, проекцию и отсечение невидимых пикселов.

Главные изменения произошли внутри потоковых мультипроцессоров. Идея состоит в том, чтобы сместить соотношение управляющей и вычислительной логики в пользу первого компонента. Как и в Kepler, потоковый мультипроцессор (SMM в терминологии Maxwell) содержит четыре планировщика, но число ядер CUDA уменьшилось с 192 до 128, а текстурных блоков — с 16 до 8. Каждый планировщик привязан к шейдерному блоку, в который, помимо 32 ядер CUDA, входят 8 блоков Load/Store и SFU (Special Function Units, выполняющие, к примеру, тригонометрические операции). Каждая пара таких единиц в пределах SMM имеет общую секцию кеша L1, совмещенного с текстурным кешем, и связана с четырьмя текстурными блоками.

Известно, что отдельно взятый планировщик за такт может обратиться к одному (а при наличии параллелизма в потоке — сразу к двум) из следующих массивов вычислительных блоков:

32 ядра CUDA.
8 блоков Load/Store.
8 SFU.
4 текстурных блока.

В составе шейдерного мультипроцессора Kepler есть ядра CUDA, специализированные для вычислений FP64, но пока неизвестно, есть ли они и в SMM Maxwell. Итак, какие преимущества по сравнению с Kepler дает такая организация? Очевидно, что потоковый мультипроцессор Maxwell, избавившись от 64 ядер CUDA, меньше полагается на параллелизм инструкций: четыре планировщика даже в пессимистичном сценарии способны обслужить 128 ядер CUDA. Эта логика согласуется с тем, что Maxwell унаследовал от Kepler статические планировщики. Вся работа по планированию внеочередного исполнения инструкций выполняется на уровне компилятора. Такой подход позволил существенно сократить энергопотребление GPU и не оказывает большого негативного влияния на собственно шейдерные вычисления. В то же время расчеты, не связанные с графикой, не всегда предсказуемы для компилятора, поэтому чипам Maxwell явно не помешает дополнительный шаг от параллелизма на уровне инструкций к параллелизму на уровне потоков.

Попутно упрощается логика планировщиков, что в конечном счете позволяет сохранить 90% производительности отдельного потокового мультипроцессора при существенно меньшей площади SMM — по сравнению с оной у Kepler — и достигнуть столь впечатляющей энергоэффективности. Планировщики также оптимизированы с целью уменьшения латентности исполнения инструкций.

Финальный штрих к архитектуре Maxwell — усовершенствованный аппаратный кодек H.264 NVENC. Теперь GPU способен кодировать видео на скорости в 6-8 раз быстрее реального времени (4х для Kepler) и декодировать в 8-10 раз быстрее. Кроме того, в Maxwell предусмотрен новый режим энергопотребления GC5, предназначенный для снижения мощности при легкой нагрузке — такой как декодирование видео силами NVENC. Жаль только, что NVIDIA еще не внедрила поддержку стандарта H.265 для проигрывания 4К-видеозаписей.

Обновленный блок NVENC для кодирования видео пригодится прежде всего не в профессиональных приложениях, а в казуальных задачах: таких, например, как запись игрового процесса с помощью NVIDIA ShadowPlay или GameStream — трансляция видеопотока на консоль NVIDIA SHIELD.

⇡#GeForce GTX 750 Ti: технические характеристики

Тактовые частоты GeForce GTX 750 Ti довольно высоки. Базовая частота составляет 1020 МГц. Поскольку здесь используется технология GPU Boost 2.0, то есть и Boost Clock, равная 1085 МГц. Видеопамять работает на эффективной частоте 5400 МГц. Таким образом, по совокупным характеристикам GTX 750 Ti близок к GTX 650 Ti на чипе GK106, даже без учета более эффективной архитектуры Maxwell. Сам 650 Ti, кстати, будет снят с производства, уступив место GTX 750 и 750 Ti.

Известны рекомендованные розничные цены новинок. GeForce GTX 750: в США — от $119 (без налогов), в России — от 4 490 руб. GTX 750 Ti: в США — от $149 (без налогов), в России — от 5 490 руб.

Для проверки GeForce GTX 750 Ti в деле у нас есть на руках две платы — референсный образец NVIDIA и ASUS GeForce GTX 750 Ti OC Edition.

⇡#NVIDIA GeForce GTX 750 Ti

Референсный образец — минималистичная однослотовая плата, которая, благодаря низкому энергопотреблению чипа, обходится без дополнительного питания.

GPU охлаждается простым алюминиевым кулером-таблеткой.

Память набрана чипами SK hynix H5GC4H24MFR-T2C со штатной эффективной частотой 5 ГГц. Система питания максимально примитивная — две фазы для GPU и фаза для микросхем памяти.

⇡#ASUS GeForce GTX 750 Ti OC Edition

Карточка ASUS построена на печатной плате собственного дизайна и оснащена более внушительной системой охлаждения, а также разъемом дополнительного питания. Частоты ядра повышены до 1072/1150 МГц (Base/Boost Clock соответственно). Видеопамять работает на референсной частоте — 5400 МГц.

Кулер с двумя вентиляторами по внешнему виду напоминает модели DirectCU того же производителя, только здесь нет ни тепловых трубок, ни медного основания.

Вы не поверите, но здесь есть отдельный видеовыход VGA.

Чипы памяти Samsung K4G41325FC-HC03 обладают штатной эффективной тактовой частотой 6 ГГц. Формула системы питания: две фазы для GPU, фаза для чипов памяти, фаза PLL.