О том, что в начале лета компания Intel собирается обновить свою высокопроизводительную платформу для энтузиастов, LGA2011-v3, известно уже очень давно. Вполне естественно, что микроархитектура семейства Broadwell вслед за серверными процессорами должна прийти и в многоядерные Core i7, которые, по сути, являются адаптированными для односокетных систем чипами Xeon. Тем не менее от такого обновления никто ничего особенного не ожидал. Действительно, сама платформа LGA2011-v3 и набор логики Intel X99 остаются теми же самыми, а смена микроархитектуры Haswell на Broadwell и перевод производства процессоров на 14-нм технологию с трёхмерными транзисторами, как мы уже знаем по вышедшему год назад четырёхъядерному Core i7-5775С в LGA1150-исполнении, даёт едва заметный прирост в производительности
В конце концов, Broadwell – это всего лишь «тик», и основные улучшения в этом дизайне сделаны на уровне графического ядра, но оно в «больших» высокопроизводительных процессорах не применяется. Не надеялись мы увидеть в Broadwell-E и сколь-нибудь значительное улучшение частотного потенциала: на это явно указывали частоты их серверных родственников поколения Broadwell-EP и отсутствие какого-либо заметного прогресса в рабочих частотах четырёхъядерных Core i7 на базе 14-нм кристаллов Broadwell-C и Skylake-S.
Однако у Intel получилось нас удивить. Начав добавлять в свои флагманские десктопные процессоры дополнительные вычислительные ядра, число которых в Haswell-E два года назад возросло до восьми штук, компания уже не смогла остановиться. В результате выходящий сегодня Core i7-6950X – самый быстрый процессор класса Extreme Edition для настольных систем, основанный на дизайне Broadwell-E, – получил не восемь, а десять стандартных суперскалярных ядер, став первым в истории десктопным десятиядерником.
Впрочем, логику микропроцессорного гиганта понять несложно. Рост тактовых частот натолкнулся на непреодолимые препятствия, и частоты старших процессоров прочно увязли в промежутке от 3 до 4 ГГц. Кардинально улучшить эффективность базовой микроархитектуры Core также давно не удаётся, и её новые версии приносят лишь незначительный рост показателя IPC (числа исполняемых за такт команд).
Зато наращивание количества ядер – сравнительно простой метод, который если и не позволяет сохранить хороший темп роста производительности, то по крайней мере создаёт его видимость. Тем более что ввод в строй более тонких техпроцессов уменьшает геометрические размеры транзисторов и благодаря этому позволяет упаковывать на полупроводниковом кристалле всё возрастающее количество ядер без каких бы то ни было производственных трудностей. Например, в серверных Xeon при переходе от дизайна Haswell-EP к Broadwell-EP максимальное число ядер на полупроводниковом кристалле выросло на 33 процента – с 18 до 24. Неудивительно, что подобный фокус Intel решила провернуть и с высокопроизводительными Core i7.
Другой вопрос, действительно ли такое количество ядер нужно в настольном компьютере. И ответить на него не так просто. Intel, объясняя необходимость развития процессорного параллелизма, постоянно ссылается на программы для обработки медиаконтента, и в первую очередь — на средства видеомонтажа. Однако приложения подобного рода вряд ли можно назвать массовыми. Большинство же пользователей гораздо больше интересует эффективность многоядерных решений в игровых конфигурациях. Но даже не проводя никакого тестирования, можно сказать, что ничего хорошего мы в таких применениях не увидим. Современные игры оптимизируются в лучшем случае под четырёхъядерные CPU, и десять ядер для них более чем избыточны. Таким образом, платформа LGA2011-v3 всё заметнее дрейфует в сторону рабочих станций, и это вряд ли способно порадовать огромную армию геймеров.
Зато добавление в новые процессоры дополнительных ядер позволяет Intel говорить о том, что её флагманские продукты действительно эволюционируют.
К сожалению, эта иллюстрация отражает лишь одну сторону медали. И рядом было бы уместным привести формулировку закона Амдала, который объясняет, что рост числа ядер в пропорциональный рост производительности на самом деле не конвертируется: «В случае, когда задача разделяется на несколько частей, суммарное время её выполнения на параллельной системе не может быть меньше времени выполнения самого длинного фрагмента». В соответствии с этим законом ускорение выполнения программы за счёт распараллеливания на множестве процессорных ядер ограничено временем, необходимым для выполнения её последовательных связанных частей. И в качестве иллюстрации можно привести следующий график теоретически рассчитанного по закону Амдала прироста скорости выполнения программ с долями параллельного кода от 50 до 95 процентов для равночастотных процессоров с числом ядер от 1 до 10.
С ростом количества вычислительных ядер получаемый прирост производительности постепенно снижается. То есть если, например, четырёхъядерный процессор позволяет получить троекратное улучшение быстродействия по сравнению с одноядерным, то это совершенно не означает, что применение для решения той же задачи восьмиядерного CPU позволит довести прирост в быстродействии до шестикратного уровня. Как видно по графику, двукратное увеличение числа ядер в такой ситуации добавит к производительности лишь дополнительные 30 процентов. Более того, увеличение числа ядер выше восьми имеет практический смысл лишь там, где доля распараллеливаемого кода превышает 80 процентов. В противном случае наращивание мощностей CPU окажется совершенно напрасным.
Но ухудшение масштабируемости производительности с ростом числа ядер у многоядерных процессоров – не единственная и не самая большая неприятность, присущая новому десятиядерному Core i7-6950X Extreme Edition. Несмотря на усложнение этого CPU, Intel всё же удалось добиться, чтобы его частоты были не ниже, чем у восьмиядерного предшественника, а значит, какой-никакой прирост производительности он обеспечит в любом случае.
Гораздо же сильнее бьёт по энтузиастам то, что появление Core i7-6950X перечёркивает привычную картину мира, в которой самый быстрый CPU для настольных систем всегда стоил около $1 000. С сегодняшнего же дня для обладания флагманским продуктом придётся потратить на 70 процентов больше. Скорректировать ценовую политику Intel заставило родство Core i7-6950X с процессорами Xeon E5 достаточно высокого уровня, но энтузиастам от этого не легче: обладание непревзойдённой конфигурацией теперь потребует от них существенно больших капиталовложений.
Иными словами, даже поверхностное знакомство с Core i7-6950X Extreme Edition вызывает отнюдь не восхищение предлагаемой им мощью, а серьёзные сомнения в уместности такого CPU. Однако мы не любим делать поспешные выводы, а потому провели подробные тесты новинки.
⇡#Подробнее о Core i7-6950X Extreme Edition
Итак, Core i7-6950X Extreme Edition – это свежее предложение Intel для бескомпромиссных энтузиастов. Как и в предшествующих процессорах класса Extreme Edition, в новинке не зафиксированы никакие множители, и она может стать великолепным объектом для проведения различных экспериментов по разгону. Причём использовать совместно с Core i7-6950X можно в том числе и старые материнские платы на базе набора логики Intel X99 – после обновления BIOS они полностью совместимы с новым CPU.
Впрочем, несмотря на сохранение преемственности с Haswell-E, Core i7-6950X Extreme Edition – это процессор следующего поколения на базе дизайна Broadwell-E, который производится по 14-нм техпроцессу с трёхмерными FinFET-транзисторами. Это обуславливает его отличия как на уровне микроархитектуры, так и по формальным спецификациям. Но главное, чем выделяется Core i7-6950X на фоне своих предшественников, – это десять вычислительных ядер с поддержкой технологии Hyper-Threading. Раньше таких предложений в ассортименте процессоров для настольных систем не существовало, а наиболее передовые Core i7 получали только восемь ядер. Теперь же операционная система сможет увидеть в компьютере, основанном на Core i7-6950X, сразу два десятка логических ядер.
Приятным сюрпризом стали сравнительно неплохие тактовые частоты. Несмотря на то, что по сравнению с восьмиядерным флагманом прошлого поколения у нового Core i7-6950X стало на два ядра больше, его частота назад не откатилась. Номинальный режим для новинки – 3,0 ГГц, но за счёт технологии Turbo Boost 2.0 при неполной нагрузке на вычислительные ресурсы она может автоматически ускоряться до 3,5 ГГц. При этом десятиядерник смог вписаться в стандартный для платформы LGA2011-v3 140-ваттный тепловой пакет.
Увеличение числа ядер не сказалось на частоте и расчётном тепловыделении, но повлияло на размер кеш-памяти третьего уровня. В дизайне Broadwell-E, как и Haswell-E, заложен объём L3-кеша из расчёта 2,5 Мбайт на каждое ядро. В результате десятиядерный Core i7-6950X получил 25-мегабайтный кеш, который функционирует на собственной частоте, приближенной к частоте самого процессора.
Есть в Broadwell-E и другие изменения. В частности, по сравнению с Haswell-E определённые улучшения коснулись контроллера памяти. Формально он остался четырёхканальным и совместимым с DDR4 SDRAM, но официально поддерживаемые им режимы работы теперь включают и DDR4-2400. Это стало следствием внутренней оптимизации, которая к тому же несколько улучшила его производительность и существенно подняла разгонный потенциал. Иными словами, разгонять память в LGA 2011-v3-системах теперь будет можно заметно результативнее, чем раньше.
А вот контроллер PCI Express 3.0 в процессоре остался таким же, как и прежде. Он поддерживает 40 линий PCI Express, которые можно делить на несколько слотов. Это позволяет системам на базе Core i7-6950X не только полноценно обслуживать мульти-GPU-конфигурации, но и работать с высокопроизводительными PCIe NVMe SSD с минимальными латентностями.
Несмотря на то, что в Core i7-6950X есть немало функций, адресованных скорее энтузиастам, этот процессор, как и все предшествующие высокопроизводительные многоядерные интеловские CPU, имеет близкие родственные связи с младшими Xeon E5 v4 поколения Broadwell-EP. Фактически Core i7-6950X базируется на таком же, как и в серверных процессорах, полупроводниковом кристалле LCC (Low Core Count), в котором как раз имеется десять вычислительных ядер, собранных воедино с помощью одной двунаправленной кольцевой шины. В Core i7-6950X лишь аппаратно отключаются блоки, отвечающие за реализацию шины QPI, что лишает десктопные процессоры возможности использования в двухпроцессорных конфигурациях.
Функциональная схема кристалла LCC Broadwell-EP
Стоит заметить, что в семействе Xeon E5 v4 кристалл LCC используется на самом деле лишь в процессорах с числом ядер до восьми штук. Для десятиядерных серверных CPU предназначается более сложный кристалл MCC, в котором реализованы уже две кольцевые шины и два системных агента. Но десктопному процессору высокая эффективность межъядерного взаимодействия ни к чему, поэтому в десятиядерном Core i7-6950X производитель считает вполне уместным использовать вариант конструкции кристалла с самой простой внутренней организацией.
Полупроводниковый кристалл Broadwell-E
Десятиядерный полупроводниковый кристалл Broadwell-E насчитывает порядка 3,2 млрд транзисторов. Благодаря 14-нм техпроцессу их удаётся разместить на площади 246 мм2. Если сравнивать эти числа с показателями 22-нм восьмиядерного Haswell-E, то получится, что кристалл стал примерно на 30 процентов меньше, хотя число транзисторов выросло более чем на 20 процентов.
Внешнее исполнение у новых процессоров несколько отличается от того, к чему привыкли пользователи LGA2011-v3-систем. Изменилась конфигурация процессорной крышки – она стала массивнее и закрывает теперь практически всю поверхность текстолита.
Слева – Core i7-6950X, справа – Core i7-5960X
Обусловлено это тем, что в процессорах Broadwell-E, как и в Skylake, используется тонкая печатная плата. Видоизменённый металлический теплорассеиватель должен защитить её от деформации в процессорном гнезде.
Слева – Core i7-6950X, справа – Core i7-5960X
Перемена эта чисто техническая. Никаких проблем совместимости с разъемами на материнских платах у новых процессоров, естественно, не возникает. Зато историй с изгибом платы и нарушением контакта при чрезмерном прижиме кулера, в которых были замечены Skylake, с Broadwell-E уже наверняка не случится.
А вот как трактует характеристики Core i7-6950X диагностическая утилита CPU-Z.
Под высокой нагрузкой частота Core i7-6950X тяготеет к максимальным 3,5 ГГц, то есть активация турборежима у Broadwell-E может происходить и при работе в многопоточных средах. Частота кеш-памяти в реальных условиях при этом подтягивается к величине 2,8 ГГц.
Но особенно обращает на себя внимание сравнительно невысокое напряжение питания десятиядерного процессора. И это не ошибка: наш экземпляр Core i7-6950X действительно требовал для своей работы около 1,1 В. Надо сказать, что 14-нм процессоры для платформ LGA1150/1151 обычно используют заметно более высокий вольтаж. Однако в Core i7-6950X совсем другая идеология: ядер здесь в два с половиной раза больше, а тактовая частота на четверть меньше.
Ну и под конец – ещё раз о самом грустном. Рекомендованная цена Core i7-6950X Extreme Edition составляет $1 723, что заставляет воспринимать этот процессор не как техническое средство, а скорее как предмет роскоши. До сих пор флагманские десктопные CPU если и выходили своими ценами за тысячедолларовую границу, то лишь чуть-чуть. Даже в тех случаях, когда Intel наращивала в них количество ядер. Дороже продавались лишь решения для серверов. Теперь же микропроцессорный гигант решил, что в мире, где стоимость игровых видеокарт может доходить до $1 500, скромничать нечего и не грех дополнительно заработать и на обычных пользователях, которые хотят иметь в своём распоряжении уникальный продукт высочайшего уровня.
⇡#О линейке Broadwell-E целиком
Хотя этот обзор посвящён лишь старшему процессору Broadwell-E, нельзя не упомянуть и о том, что вместе с Core i7-6950X Extreme Edition компания Intel выводит на рынок ещё трех представителей того же семейства. Core i7-6950X с его десятью вычислительными ядрами – явно имиджевый и чрезмерно дорогой продукт, спрос на который вряд ли окажется высоким. Поэтому для тех, кто хочет получить нечто попроще и подоступнее, предусмотрены свои варианты.
Вместо Core i7-5960X Extreme Edition поколения Haswell-E, который стоил $999, в линейке Broadwell-E предусмотрена почти равноценная замена – Core i7-6900K. Это, правда, уже не десятиядерник, а, как и Core i7-5960X Extreme Edition двухлетней давности, процессор с восемью ядрами. Но зато у новинки более новая микроархитектура и выше таковые частоты – 3,2-3,7 ГГц против 3,0-3,5 ГГц. Поэтому вполне возможно, что именно Core i7-6900K станет наиболее популярным решением из семейства Broadwell-E в среде энтузиастов. Ведь восемь ядер и 20 Мбайт L3-кеша кажутся достаточно разумным вариантом для высокопроизводительного компьютера. К тому же Core i7-6900K предлагает практически тот же список преимуществ, что и флагман: в нём есть полный набор свободных множителей, 40 линий PCI Express и обновлённый контроллер памяти.
Есть в линейке LGA2011-v3-процессоров Broadwell-E и более доступные варианты. Правда, все они лишь шестиядерные. Core i7-6850K с ценой $617 сменяет на своём посту Core i7-5930K, а на место LGA2011-v3-процессора начального уровня, которое раньше занимал Core i7-5820K, приходит 434-долларовый Core i7-6800K. Новинки похожи по базовым характеристикам на предшественников поколения Haswell-E и предлагают то же число ядер, тот же объём кеш-памяти и прежнее число линий PCI Express. Однако частоты у младших Broadwell-E несколько выше. Базовая частота Core i7-6850K установлена на отметке 3,8 ГГц, тогда как Core i7-5930K имел частоту 3,5 ГГц. Core i7-6800K же работает на 3,4 ГГц, то есть он на 100 МГц быстрее Core i7-5820K. Новые Broadwell-E с шестью ядрами, как и их более навороченные собратья, тоже разрешают разгон: заблокированных процессоров для платформы LGA2011-v3 не существует вообще.
Спецификации всех четырёх представителей линейки Broadwell-E приведены в таблице ниже.
|
Core i7-6950X |
Core i7-6900K |
Core i7-6850K |
Core i7-6800K |
Ядра/потоки |
10/20 |
8/16 |
6/12 |
6/12 |
Тактовая частота |
3,0 ГГц |
3,2 ГГц |
3,6 ГГц |
3,4 ГГц |
Макс. частота в турборежиме |
3,5 ГГц |
3,7 ГГц |
3,8 ГГц |
3,6 ГГц |
Поддержка Turbo Boost Max 3.0 |
Есть |
Есть |
Есть |
Есть |
Разблокированные множители |
Есть |
Есть |
Есть |
Есть |
L3-кеш |
25 Мбайт |
20 Мбайт |
15 Мбайт |
15 Мбайт |
Число линий PCI Express 3.0 |
40 |
40 |
40 |
28 |
Память |
4 канала DDR4-2400 |
4 канала DDR4-2400 |
4 канала DDR4-2400 |
4 канала DDR4-2400 |
TDP |
140 Вт |
140 Вт |
140 Вт |
140 Вт |
Процессорное гнездо |
LGA2011-v3 |
LGA2011-v3 |
LGA2011-v3 |
LGA2011-v3 |
Цена |
$1 723 |
$1 089 |
$617 |
$434 |
Стоит отметить, что с появлением процессоров Broadwell-E «цена входа» в экосистему LGA2011-v3 в очередной раз немного повышается. Теперь младший процессор Core i7-6800K оценён в $434, в то время как официальная цена Core i7-5820K составляла $389. Причём это увеличение стоимости не сопровождается никакими принципиальными изменениями в характеристиках. Как и раньше, младший процессор для LGA2011-v3 получил урезанный контроллер PCI Express, который располагает лишь 28 линиями.
⇡#Broadwell-E: микроархитектурные улучшения
Казалось бы, что может быть принципиально нового в процессорах класса Broadwell? Ведь это – далеко не самая последняя микроархитектура Intel, к тому же ещё и «тик», то есть она представляет собой редизайн Haswell, сделанный в связи с внедрением 14-нм техпроцесса. Однако это вовсе не значит, что Broadwell-E не смогут предложить по сравнению с Haswell-E никакого заметного прогресса в производительности, даже если говорить о CPU с одинаковым количеством вычислительных ядер.
Современный 14-нм техпроцесс, пришедший в высокопроизводительные многоядерные процессоры спустя почти два года после своего внедрения в чипы с меньшим количеством ядер, сегодня позволяет получать достаточно сложные высокочастотные полупроводниковые кристаллы с небольшим уровнем брака. В результате Intel в новых многоядерных Core i7 смогла немного нарастить тактовые частоты. Кроме того, сама микроархитектура Broadwell содержит некоторое количество небольших улучшений, которые в сумме способны дать ещё примерно 5-процентное улучшение удельного быстродействия. Плюс есть и ещё один момент: дизайн Broadwell-E содержит пару уникальных возможностей, которые тоже способны повысить привлекательность и производительность основанных на нём продуктов.
Подробно о тех оптимизациях, которые были сделаны в микроархитектуре Broadwell, мы говорили в нашем специальном материале, где рассказывали о LGA1150-процессорах Broadwell-C. Если же коротко, то по сравнению c Haswell в них ускорен блок выполнения делений чисел с плавающей точкой, уменьшены задержки при выполнении AVX-умножений, в полтора раза увеличен буфер ассоциативной трансляции, в очередной раз слегка оптимизирована схема предсказания ветвлений, а также расширено окно планировщика.
Но в дополнение к этому процессоры Broadwell-E получили усовершенствованный блок управления питанием, который научился новому трюку: изменять частоту вычислительных ядер в рамках турборежима независимо друг от друга. И инженеры Intel нашли для этой возможности сразу три практических применения.
Во-первых, в Broadwell-E было оптимизировано исполнение вычислительных потоков, которые задействуют AVX-команды. Векторные инструкции, входящие в различные AVX-подмножества, отличаются существенной энергоёмкостью. Это хорошо известно оверклокерам, которые обычно проверяют стабильность процессоров при помощи утилит, реализующих различные счётные алгоритмы с применением AVX-команд.
Известно это было и конструкторам процессоров, поэтому любое включение в процесс вычислений векторных блоков принудительно отключало турборежим и снижало частоту процессора на несколько шагов по меньшей мере на 1 мс. В новых процессорах с дизайном Broadwell-E процедура снижения частоты осталась, но работает она теперь не глобально, а избирательно – для каждого ядра в отдельности. То есть при выполнении AVX-инструкций частота снижается только у тех ядер, которые непосредственно заняты AVX-вычислениями. Остальные же ядра, работающие с традиционными скалярными командами, могут продолжать пользоваться преимуществами турборежима и функционировать на повышенной частоте.
Во-вторых, в Broadwell появилась весьма любопытная функция поядерного разгона. Теперь для каждого ядра процессора можно настроить собственный, независимый множитель. И это открывает достаточно широкий оперативный простор перед оверклокерами-экспериментаторами, поскольку ядра, соседствующие на одном полупроводниковом кристалле в многоядерных процессорах, действительно могут разгоняться по-разному из-за различного расположения, неравномерного прилегания теплорассеивателя, непостоянства характеристик техпроцесса и тому подобного.
Третье применение новой возможности ещё более любопытно. Это новая технология Intel Turbo Boost Max Technology 3.0. Суть данной технологии состоит в выделении отдельных процессорных ядер с форсированным турборежимом и направлении критических нагрузок в первую очередь на такие ядра. Конкретная реализация Intel Turbo Boost Max Technology 3.0 в процессорах семейства Broadwell-E представляет собой целый комплекс, который работает не только на аппаратном уровне — он также добавляет в операционную систему собственный дополнительный драйвер. Иными словами, Turbo Boost Max Technology 3.0 явно заслуживает отдельного рассказа.
⇡#Технология Intel Turbo Boost Max Technology 3.0
Анонс нового флагманского процессора, подобного Core i7-6950X, не оставляет никаких сомнений в том, что Intel взяла курс на рост параллелизма, то есть на наращивание производительности за счёт добавления вычислительных ядер. Однако такой экстенсивный путь развития даёт явные результаты не всегда. Да, программное обеспечение, которое основано на многопоточных алгоритмах, безусловно, получит ускорение, однако существует огромное число задач, которые распараллеливаются с большим трудом. Среди программ, которые используются в массовых настольных системах, таких немало, и самый распространённый пример – это игры. В этом случае рост производительности мог бы быть достигнут за счёт увеличения тактовой частоты процессоров, но на данном этапе он невозможен. Более того, частоты даже приходится откатывать назад, чтобы новые многоядерные процессоры не выходили за рамки допустимых тепловых пакетов.
Проблема производительности при работе с плохо распараллеливаемыми алгоритмами волнует Intel уже давно. И современные процессоры имеют механизмы, которые позволяют смягчить негативный эффект, вызванный невысокими частотами многоядерных процессоров. Например, именно для этой цели в современных CPU Intel была введена технология Turbo Boost 2.0. Её суть заключается в увеличении тактовой частоты на несколько шагов в те моменты, когда процессорные ядра загружены работой лишь частично и температурный режим полупроводникового кристалла находится в допустимых рамках.
Однако для процессоров с высоким числом ядер, вроде десятиядерного Core i7-6950X или восьмиядерного Core i7-6900K, эффективность Turbo Boost 2.0 оказывается недостаточной. Например, максимальная частота Core i7-6950X в турборежиме в лучшем случае доходит лишь до 3,5 ГГц, в то время как у старших процессоров в LGA1151-исполнении, которые относятся к более низкому классу, 4,0 ГГц – это номинальная частота.
Поэтому в новых процессорах инженеры Intel решили реализовать более хитрый турборежим – технологию Intel Turbo Boost Max Technology 3.0. И в этом им помог улучшенный менеджер управления питанием, который в Broadwell-E получил возможность независимого управления частотой отдельных ядер. Идея Turbo Boost Max 3.0 заключается в том, что частоту единичных ядер при невысокой нагрузке на вычислительные ресурсы допустимо поднимать выше общей тактовой частоты даже в том случае, если процессор уже работает в режиме Turbo Boost 2.0. И в новых LGA2011-v3-процессорах семейства Broadwell-E одному из вычислительных ядер разрешили разгоняться сильнее, чем всем остальным.
Например, процессор Core i7-6950X имеет номинальную тактовую частоту 3,0 ГГц, и при тяжёлой многопоточной нагрузке он функционирует именно на ней. Старая технология Turbo Boost 2.0 позволяет ему поднимать частоту до 3,4-3,5 ГГц. И если нагрузка на процессор не слишком велика, то процессор переходит в турборежим с такой частотой. Однако одно из ядер у этого процессора в турборежиме за счёт новой технологии Turbo Boost Max 3.0 увеличивает свою частоту не до 3,5 ГГц, а до 4,0 ГГц. Если такое ускоренное ядро всегда использовать для выполнения малопоточных задач, то производительность платформ LGA2011-v3 и LGA1151 в приложениях, не создающих большого числа параллельных вычислительных потоков, естественным образом сблизится.
Правда, есть одна проблема: диспетчер задач Windows (да и других операционных систем) понятия не имеет о существовании процессоров, ядра которых работают на разной тактовой частоте. Поэтому в общем случае нет никакой гарантии, что нагрузка в первую очередь будет направляться на то ядро, которое работает с самой высокой тактовой частотой, а уже потом на остальные процессорные ресурсы.
Но Intel предусмотрела и это. Для решения данной проблемы разработчики компании создали специальный драйвер – Turbo Boost Max Driver, который работает как надстройка над диспетчером задач и перераспределяет нагрузку по ядрам процессора, отправляя её в первую очередь на те из них, которые работают быстрее.
Таким образом, для полноценной работы технологии Turbo Boost Max 3.0 необходимы три составляющие. Во-первых, эта технология работает исключительно с процессорами Broadwell-E, и никакими другими CPU она не поддерживается. Во-вторых, она требует поддержки со стороны BIOS материнской платы. В частности, плата должна позволять включать независимое управление частотой отдельных ядер. Например, вот как это выглядит на нашей тестовой плате ASUS X99-Deluxe.
Обратите внимание: ядро, которому разрешено поднимать частоту выше, чем остальным, в оболочке UEFI BIOS даже помечено звёздочкой.
В-третьих, в системе должен быть установлен и настроен драйвер Intel Turbo Boost Max Driver.
Стоит отметить, что разработанное Intel программное обеспечение предлагает достаточно гибкие настройки. В правой части окна управляющей панели отображается список ядер, отсортированных в соответствии с приоритетом направления на них нагрузки (список формируется автоматически, на первое место ставится «быстрое» ядро). В левой части пользователь может сформировать свой список приложений, которые должны быть перенесены на более быстрые ядра в первую очередь. В противном случае приоритетными считаются те приложения, которые работают на переднем плане.
Кроме того, в панели управления драйвером есть и расширенные настройки. В соответствующем окне можно изменить частоту, с которой драйвер проверяет ситуацию с нагрузкой, задать границу, по которой отсекается невысокая нагрузка, а также внести изменения в стандартный алгоритм перераспределения нагрузки.
Intel обещает, что включение программно-аппаратного комплекса Turbo Boost Max Technology 3.0 способно увеличить производительность системы более чем на 15 процентов. И для Core i7-6950X это действительно так. Причём наличие одного ускоренного до 4,0 ГГц ядра, на которое направляется критическая нагрузка, сильно помогает не только в однопоточных, но и в многопоточных задачах. Ведь даже в тех приложениях, которые могут эффективно распараллеливать свою работу, один из потоков обычно несёт на себе дополнительные управляющие и координирующие функции. Поэтому перемещение его на более быстрое ядро увеличивает скорость выполнения всей задачи в целом.
Для того чтобы собственноручно оценить эффективность работы Turbo Boost Max Technology 3.0, мы воспользовались комплексным тестом SYSmark 2014, который оценивает средневзвешенную производительность в типичных пользовательских сценариях, исполняемых в реальных приложениях.
Как видно по приведённым данным, в среднем в реальных пользовательских сценариях технология Turbo Boost Max Technology 3.0 даёт увеличение производительности порядка 8 процентов. И это, на самом деле, только подтверждает ценность данной технологии. Фактически за счет динамического увеличения частоты одного ядра Intel смогла добиться такого же прироста в быстродействии, как от увеличения общей тактовой частоты на 200-300 МГц.
И кстати, в отдельных приложениях технология Turbo Boost Max 3.0 может обеспечивать и гораздо более заметное улучшение производительности.
Как видите, увеличение скорости работы может превышать и 10-процентный уровень. Причём прирост можно наблюдать не только в приложениях, работающих на ограниченном числе ядер, но и в задачах, которые мы привыкли относить к числу многопоточных и способных эффективно распределять свою нагрузку по большому массиву вычислительных ядер.
⇡#Разгон
Появившаяся в Broadwell-E возможность управления частотой отдельных ядер меняет многое и в разгоне. Фактически новые процессоры становятся более сложной, но и более интересной игрушкой для оверклокеров, позволяя в каждом конкретном случае подобрать для себя наиболее благоприятный режим, заточенный под индивидуальный сценарий использования платформы.
В первую очередь отметим появившуюся в Broadwell-E возможность независимого разгона отдельных процессорных ядер. В этом режиме каждому ядру процессора можно назначить свой собственный множитель. Такой разгон может быть интересен тем, что вкупе с драйвером Turbo Boost Max Driver, который перенаправляет критическую нагрузку на наиболее быстрые ядра, можно получить конфигурацию, которая будет показывать высокую производительность при работе как с многопоточными, так и с малопоточными приложениями.
Второе важное нововведение – появление настройки, автоматически снижающей частоту ядер, которые работают над исполнением AVX-инструкций. Дело в том, что обычно разгон процессора ограничен из-за перегрева, возникающего при работе именно с очень затратными в энергетическом плане векторными командами с шириной 256 бит. Поэтому, например, большинство утилит для проверки стабильности разогнанных систем используют библиотеку Linpack, в которой AVX-команды задействуются очень активно. Но теперь у оверклокеров появляется инструмент, который позволит разгонять процессоры дальше границы, устанавливаемой AVX-блоками.
В BIOS тестовой материнской платы ASUS X99 Deluxe соответствующая настройка получила название AVX Instruction Core Ratio Negative Offset. Через неё можно задать степень уменьшения множителя частоты для тех ядер, которые заняты исполнением AVX-инструкций. Причём значение вычитаемого может достигать величины 31х.
Также в числе нововведений для оверклокеров Intel указывает появившуюся возможность изменять напряжение VccU. Влияние этого параметра на разгон ещё предстоит изучить, но сразу стоит сказать, что в теории это напряжение способно оказать воздействие при увеличении частоты кеш-памяти третьего уровня.
Что же касается самого обычного разгона, то определённых улучшений можно ждать и здесь. Когда мы ставили эксперименты по разгону Broadwell-C для LGA1151, результаты были далеки от удовлетворительных. Эти процессоры разгонялись заметно хуже Haswell. Однако Broadwell-E – это совсем другой процессорный дизайн, который изначально нацелен на высокую производительность. К тому же 14-нм техпроцесс с трёхмерными транзисторами второго поколения, который применяется при производстве новых Core i7, к сегодняшнему дню набрал уже достаточную зрелость. И поэтому, подходя к тестированию десятиядерного Core i7-6950X, мы ожидали, что разгоняться он будет по меньшей мере не хуже восьмиядерного Core i7-5960X поколения Haswell-E.
Но на практике ситуация с разгоном получилась всё же не такой радужной. Как оказалось, достаточно низкое рабочее напряжение выбрано для Core i7-6950X не просто так. И уже при увеличении напряжения до 1,2 В наш экземпляр процессора во время тестирования в LinX 0.6.8 перегревался, несмотря на то, что в тестовой системе был установлен один из лучших двухбашенных кулеров — Noctua NH-D15. В результате для того, чтобы избежать перегрева процессора, нам пришлось довольствоваться увеличением напряжения питания лишь до 1,175 В. А в этом случае максимальной частотой, при которой Core i7-6950X сохранял свою способность к стабильному функционированию и проходил тесты без ошибок, оказались скромные 3,9 ГГц.
И даже при таком достаточно скудном разгоне максимальная температура процессорных ядер доходила до 98 градусов, а это – почти предельно допустимое значение, ведь троттлинг у Core i7-6950X включается по достижении 100 градусов.
Это подводит нас к выводу, что возможность сбавить частоту для ядер, работающих с AVX-инструкциями, введена для многоядерных Broadwell-E более чем своевременно. И достичь в разгоне обычных для современных процессоров частот можно лишь с её применением. Так, например, если при проверке стабильности Core i7-6950X пользоваться версией LinX 0.6.4, в которой используется старая, не задействующая AVX-инструкции библиотека Linpack, то разгон Core i7-6950X можно очень легко довести до частоты 4,3 ГГц.
Стабильность в таком состоянии достигается с повышением напряжения на процессоре до 1,3 В, но кулер Noctua NH-D15 прекрасно справляется с теплоотводом, так как обычные скалярные инструкции не могут разогреть CPU столь же сильно, сколь широкие векторные команды. И более того, температура процессора во время теста стабильности не превышает 85 градусов, что оставляет некоторый простор для дополнительного разгона, который можно провести с более сильным увеличением напряжения питания.
Для того же, чтобы система с разогнанным до такого состояния процессором не сбоила в приложениях, использующих AVX-блоки, остаётся лишь подобрать подходящую степень снижения частоты для ядер, сталкивающихся с векторными командами. В нашем случае, например, подошло уменьшение множителя на 13х: при периодическом уменьшении частоты до 3,0 ГГц и при напряжении 1,3 В тестовый экземпляр Core i7-6950X спокойно проходил тест в утилите LinX 0.6.8, которая базируется на последней версии пакета Linpack с поддержкой AVX.
Такой «гибридный» разгон действительно имеет практический смысл. Многие приложения AVX не используют, а если они и обращаются к этим расширениям, то делают это не так уж и часто. В результате в реальных условиях большую часть времени процессор обеспечивает повышенный уровень производительности, лишь изредка откатывая на пониженную частоту отдельные ядра, которые сталкиваются с необходимостью выполнять редкие AVX-инструкции.
Кстати, замедление исполнения AVX-инструкций при разгоне мы уже встречали и раньше. Это был неминуемый побочный эффект, который наблюдается при нелегальном разгоне процессоров Skylake с заблокированным множителем в LGA1151-системах. И тогда наше тестирование показало, что на самом деле от него гораздо больше пользы, чем вреда. Теперь же этот вывод косвенно подтвердила сама Intel: она передала соответствующий инструмент, позволяющий предсказуемо вызывать этот эффект, в руки энтузиастов.
⇡#Описание тестовых систем и методики тестирования
Провести сравнительное тестирование нового процессора Core i7-6950X Extreme Edition оказалось не слишком простой задачей. Дело в том, что это – первый десятиядерный процессор для настольных систем и первый процессор такого класса, который стоит серьёзно больше $1000. То есть подходящих соперников той же весовой категории для совместного тестирования с ним попросту не существует. Поэтому в наших тестах фигурировало лишь три CPU: главный герой; прошлый старший процессор для той же платформы LGA2011-v3 – тысячедолларовый восьмиядерный Core i7-5960X; а также старший четырёхъядерник для массовой платформы LGA1151 – Core i7-6700K с официальной ценой $339.
В итоге, в составе немногих тестовых конфигураций использовались комплектующие из следующего набора:
- Процессоры:
- Intel Core i7-6950X Extreme Edition (Broadwell-E, 10 ядер + HT, 3,0-3,5 ГГц, 25 Мбайт L3);
- Intel Core i7-6700K (Skylake, 4 ядра + HT, 4,0-4,2 ГГц, 8 Мбайт L3);
- Intel Core i7-5960X Extreme Edition (Haswell-E, 8 ядер + HT, 3,0-3,5 ГГц, 20 Мбайт L3).
- Процессорный кулер: Noctua NH-D15.
- Материнские платы:
- ASUS X99-Deluxe (LGA 2011-v3, Intel X99);
- ASUS Maximus VIII Ranger (LGA 1151, Intel Z170).
- Память: 4 × 8 Гбайт DDR4-3000 SDRAM, 16-16-16-36 (2 × Patriot Viper 4 PV416G300C6K).
- Видеокарта: NVIDIA GeForce GTX 980 Ti (6 Гбайт/384-бит GDDR5, 1000-1076/7010 МГц).
- Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
- Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 10240 с использованием следующего комплекта драйверов:
- Intel Chipset Driver 10.1.2.19;
- Intel Management Engine Interface Driver 11.0.0.1172;
- Intel Turbo Boost Max Driver Beta Version 1.0.0.1025;
- NVIDIA GeForce 364.72 Driver.
⇡#Описание использовавшихся для измерения вычислительной производительности инструментов:
Бенчмарки:
- BAPCo SYSmark 2014 ver 1.5 – тестирование в сценариях Office Productivity (офисная работа: подготовка текстов, обработка электронных таблиц, работа с электронной почтой и посещение интернет-сайтов), Media Creation (работа над мультимедийным контентом — создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео) и Data/Financial Analysis (статистический анализ и прогнозирование инвестиций на основе некой финансовой модели).
- Futuremark 3DMark Professional Edition 2.0.2067 — тестирование в сценах Sky Diver 1.0, Cloud Gate 1.1 и Fire Strike 1.1.
Приложения:
- Adobe After Effects CC 2015 — тестирование скорости рендеринга методом трассировки лучей. Измеряется время, затрачиваемое системой на обсчёт в разрешении 1920 × 1080@30fps заранее подготовленного видеоролика.
- Adobe Photoshop CC 2015 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
- Adobe Photoshop Lightroom 6.4 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает пост-обработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 12-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Nikon D300.
- Adobe Premiere Pro CC 2014 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.
- Autodesk 3ds max 2016 — тестирование скорости финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920 × 1080 с применением рендерера mental ray стандартной сцены Hummer.
- Blender 2.77a – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
- Microsoft Edge 20.10240.16384.0 – тестирование производительности при работе интернет-приложений, построенных с использованием современных технологий. Применяется специализированный тест WebXPRT 2015, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.
- WinRAR 5.31 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.
- x264 r2692 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с.
- x265 1.9+140 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.
Игры:
- Company of Heroes 2. Настройки для разрешения 1280 × 800: Maximum Image Quality, Anti-Aliasing = Off, Higher Texture Detail, High Snow Detail, Physics = Off. Настройки для разрешения 1920 × 1080: Maximum Image Quality, High Anti-Aliasing, Higher Texture Detail, High Snow Detail, Physics = High.
- Grand Theft Auto V. Настройки для разрешения 1280 × 800: DirectX Version = DirectX 11, FXAA = Off, MSAA = Off, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = Off, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum. Настройки для разрешения 1920 × 1080: DirectX Version = DirectX 11, FXAA = Off, MSAA = x4, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum.
- F1 2015. Настройки для разрешения 1280 × 800: Ultra High Quality, 0xAA, 16xAF. Настройки для разрешения 1920 × 1080: Ultra High Quality, SMAA + TAA, 16xAF. В тестировании используется трасса Melbourne.
- Hitman™. Настройки для разрешения 1280 × 800: DirectX 12, Super Sampling = 1.0, Level of Detail = Ultra, Anti-Aliasing = Off, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = On, Shadow Maps = Ultra, Shadow Resolution = High. Настройки для разрешения 1920 × 1080: DirectX 12, Super Sampling = 1.0, Level of Detail = Ultra, Anti-Aliasing = FXAA, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = On, Shadow Maps = Ultra, Shadow Resolution = High.
- Rise of the Tomb Raider. Настройки для разрешения 1280 × 800: DirectX 11, Anti-aliasing = Off, Preset = Very High. Настройки для разрешения 1920 × 1080: DirectX 11, Anti-aliasing = SSAA 4x, Preset = Very High.
- Thief. Настройки для разрешения 1280 × 800: Texture Quality = Very High, Shadow Quality = Very High, Depth-of-field Quality = High, Texture Filtering Quality = 8x Anisotropic, SSAA = Off, Screenspace Reflections = On, Parallax Occlusion Mapping = On, FXAA = Off, Contact Hardening Shadows = On, Tessellation = On, Image-based Reflection = On. Настройки для разрешения 1920 × 1080: Texture Quality = Very High, Shadow Quality = Very High, Depth-of-field Quality = High, Texture Filtering Quality = 8x Anisotropic, SSAA = High, Screenspace Reflections = On, Parallax Occlusion Mapping = On, FXAA = On, Contact Hardening Shadows = On, Tessellation = On, Image-based Reflection = On.
- Total War: Attila. Настройки для разрешения 1280 × 800: Anti-Aliasing = Off, Texture Resolution = Ultra; Texture Filtering = Anisotropic 4x, Shadows = Max. Quality, Water = Max. Quality, Sky = Max. Quality, Depth of Field = Off, Particle Effects = Max. Quality, Screen space reflections = Max. Quality, Grass = Max. Quality, Trees = Max. Quality, Terrain = Max. Quality, Unit Details = Max. Quality, Building Details = Max. Quality, Unit Size = Ultra, Porthole Quality = 3D, Unlimited video memory = Off, V-Sync = Off, SSAO = On, Distortion Effects = On, Vignette = Off, Proximity fading = On, Blood = On. Настройки для разрешения 1920 × 1080: Maximum Quality.
Важно отметить, что тестирование процессора Intel Core i7-6950X выполнялось с активированной технологией Turbo Boost Max 3.0. Кроме того, этот процессор был протестирован дважды: в своём номинальном режиме и при разгоне до 4,3 ГГц (с откатом частоты ядер, исполняющих AVX-инструкции, до 3,0 ГГц), описанном в соответствующем разделе статьи.
⇡#Производительность в комплексных тестах
Комплексный тест SYSmark 2014 измеряет средневзвешенную производительность систем при исполнении большинства свойственных персональным компьютерам задач. И согласно полученным в этом бенчмарке результатам, новый Core i7-6950X предлагает в целом более высокий уровень быстродействия, чем старшие процессоры семейств Haswell-E и Skylake-S. Собственно, в этом нет ничего удивительного: десять вычислительных ядер и технология Turbo Boost Max 3.0 действительно предлагают огромные вычислительные ресурсы.
Однако при этом всё же необходимо отметить, что в сценарии Office Productivity, который оценивает скорость типичной офисной работы в приложениях типа Adobe Acrobat, Google Chrome, Microsoft Excel, OneNote, Outlook, PowerPoint, Word и WinZip Pro 17.5 Pro, флагманский Core i7-6950X всё же уступает старшему четырёхъядерному процессору Skylake-S. И это значит, что Core i7-6950X, несмотря на его запредельную стоимость, нельзя расценивать как универсальное решение, способное выдавать наилучшую скорость в абсолютно любом случае. Таким образом, даже после сегодняшнего обновления платформа LGA2011-v3 сохраняет свой особый статус – она подходит для использования в рабочих станциях. А для компьютеров, нацеленных на решение типовых повседневных задач, лучше использовать варианты попроще.
Зато показатели производительности Core i7-6950X Extreme Edition в тесте 3DMark вызывают глубокое уважение. Этот бенчмарк, ориентированный на оценку игровой производительности систем, серьезно оптимизирован для многоядерных процессоров. И это находит отражение в результатах: Core i7-6950X получает заметно более высокий рейтинг и по сравнению с Core i7-6700K, и по сравнению с Core i7-5960X. И более того, с Core i7-6950X не смог бы посоперничать на равных даже разогнанный Core i7-6700K.
⇡#Производительность в приложениях
В целом Core i7-6950X выглядит как весьма впечатляющее по производительности решение. В ресурсоёмких приложениях преимущество этого процессора относительно прошлого флагмана поколения Haswell-E доходит до 40-процентного уровня. Дополнительная пара вычислительных ядер, обновлённая микроархитектура и технология Turbo Boost Max 3.0 в сумме представляют собой очень мощный коктейль, который даже в среднем делает Core i7-6950X быстрее своего предшественника на 25 процентов. На фоне того, какой прогресс в производительности мы обычно наблюдаем при смене поколений процессоров в массовых системах, выход Broadwell-E кажется чуть ли не революцией.
Хорошо смотрится Core i7-6950X и рядом с Core i7-6700K. Конечно, преимущество старшего Broadwell-E не сопоставимо с кратной разницей в цене этих решений, но для тех пользователей, которые серьёзно работают с профессиональными приложениями для создания контента, Core i7-6950X подходит как нельзя лучше. При рендеринге и обработке видео превосходство нового десятиядерника над старшими массовыми решениями может доходить до величины в 80 процентов.
Попутно обратим внимание на несколько случаев, когда разогнанный Core i7-6950X оказывается медленнее самого себя в номинальном режиме. Такое случается не часто, но всё же случается – при перекодировании видео кодеками x264 и x265 и при рендеринге в Blender. Причина – в особенностях нашего разгона, который подразумевает замедление ядер процессора до 3,0 ГГц при исполнении AVX-инструкций.
⇡#Игровая производительность
Как известно, производительность платформ, оснащенных современными процессорами, в подавляющем большинстве актуальных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы пользуемся флагманскими видеокартами, выбираем наиболее процессорозависимые игры, а измерение количества кадров выполняем дважды.
Первым проходом тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки дают возможность оценить, насколько хорошо проявляют себя процессоры с игровой нагрузкой в целом, а значит, позволяют строить догадки о том, как будут вести себя тестируемые вычислительные платформы в будущем, когда на рынке появятся более быстрые варианты графических ускорителей.
Второй проход выполняется с реалистичными установками – при выборе Full HD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд, такие результаты не менее интересны, так как они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности могут обеспечить процессоры прямо сейчас – в современных условиях.
⇡#Тесты в Full HD-разрешении
Говоря о производительности флагманских процессоров в играх, нужно иметь в виду две вещи. Во-первых, большинство современных игровых приложений оптимизируется под процессоры с четырьмя вычислительными ядрами, и CPU с большей степенью параллелизма для них по большому счёту не нужны. Во-вторых, огромное влияние на игровую производительность оказывает тактовая частота, на которой работает процессор. Если учесть такие вводные, Core i7-6950X представляется далеко не идеальной основой для современной игровой системы, даже несмотря на более совершенный (по сравнению с тем, что можно найти в Skylake-S) контроллер шины PCI Express. И мы уже сталкивались с тем, что флагманские многоядерные процессоры Intel, например Core i7-5960X, по своей игровой производительности уступают массовым четырёхъядерным процессорам Core i7.
Но в Core i7-6950X производитель попытался исправить эту ситуацию технологией Turbo Boost Max 3.0, которая предоставляет приложениям, не оптимизированным под широкую многоядерность, выделенные ядра с максимально высокой тактовой частотой. И отчасти это помогает. В целом Core i7-6950X смотрится в игровых тестах лучше своего предшественника, хотя до уровня Core i7-6700K он всё же не дотягивает.
Впрочем, нужно понимать, что все эти рассуждения об игровой производительности старших процессоров Intel имеют лишь теоретическую ценность. На практике любой из участвующих в тесте CPU полностью раскроет производительность сколь угодно мощной современной видеокарты. Иными словами, система, основанная на Core i7-6950X, в играх будет аналогична конфигурации на базе Core i7-6700K. Использование же более простого процессора позволит получить такой же результат при гораздо меньших финансовых вложениях, и поэтому Core i7-6950X стоит расценивать как явно неоптимальный вариант для гейминга.
⇡#Тесты со сниженным разрешением
Если же говорить о чисто процессорной игровой производительности, которая не ограничивается мощностью графической карты, то выводы, сделанные нами ранее, кажутся ещё более очевидными. Core i7-6950X – это более правильный геймерский процессор по сравнению с прошлым флагманом, Core i7-5960X. Его преимущество очень хорошо заметно, однако нужно понимать, что объясняется оно, естественно, не возросшим числом вычислительных ядер, а более совершенной микроархитектурой и внедрением технологии Turbo Boost Max 3.0. Однако в сравнении с Core i7-6700K новый десятиядерник всё-таки проигрывает. Хотя отставание оказывается не слишком сильным, и разгон Core i7-6950X позволяет его наверстать.
⇡#Энергопотребление
Core i7-6950X Extreme Edition по сравнению с предшественниками получил увеличенное количество ядер. Однако Intel обещает, что этот процессор не стал более прожорливым в энергетическом плане и он продолжает вписываться в 140-ваттный тепловой пакет, чему способствует перевод производства на 14-нм технологию с трёхмерными транзисторами второго поколения. Однако процессоры Xeon, основанные на дизайне Broadwell-EP и использующие тот же, что и Core i7-6950X, полупроводниковый кристалл LCC, имеют расчётное тепловыделение 135 Вт. При этом они обладают не более чем восемью вычислительными ядрами, а их частота не выходит за отметку 3,2 ГГц. На этом фоне кажется, что старший Broadwell-E должен потреблять заметно больше. Но на практике это не подтверждается. Очень похоже, что для производства Core i7-6950X компании Intel ко всему прочему приходится достаточно жёстко отбирать наиболее удачные полупроводниковые кристаллы.
Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и воспользуемся для практических измерений. На следующем ниже графике приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Для правильной оценки энергопотребления мы активировали турборежим и все имеющиеся у процессоров энергосберегающие технологии.
Любопытно, что в состоянии простоя Core i7-6950X потребляет больше электроэнергии, чем его предшественник, Core i7-5960X. Вероятно, связано это как с увеличением числа ядер и объёма L3-кеша, так и с изменениями, внесёнными в контроллер памяти Broadwell-E.
При практической многопоточной нагрузке Core i7-6950X вновь оказывается немного более прожорливым чипом по сравнению с восьмиядерным представителем семейства Broadwell-E.
На следующей диаграмме приводится максимальное потребление при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.8 с поддержкой набора инструкций AVX2, которая базируется на пакете Linpack, отличающемся непомерными энергетическими аппетитами.
Максимально достижимое на практике энергопотребление системы на базе Core i7-6950X чуть выше, чем потребление этой же платформы, но при использовании процессора Core i7-5960X. Однако различие в измеренных величинах совсем небольшое, и его скорее следует расценить как победу Intel. Компания смогла на 20 процентов увеличить число вычислительных ядер и не ухудшила тактовые частоты, но новый процессор потребляет под нагрузкой всего лишь на 5-10 Вт больше предшественника.
⇡#Выводы
Давать итоговые оценки флагманским процессорам компании Intel с каждым разом становится всё сложнее. Их просто невозможно поставить в один ряд с какими-то другими предложениями: по своим потребительским характеристикам и по стоимости они уходят от массовых продуктов всё дальше и дальше, становясь совершенно обособленным классом чипов где-то между процессорами для десктопов, рабочих станций и серверов. Core i7-6950X Extreme Edition продолжает движение тем же курсом, и поэтому его попросту не с чем сравнить.
Фактически он позиционируется как решение премиального уровня внутри экосистемы LGA2011-v3, которая и так уже представляет собой платформу премиального уровня. Поэтому на этот раз мы воздержимся от вынесения какого бы то ни было однозначного вердикта. С полной определённостью можно сказать лишь одно: с сегодняшнего дня место самого мощного и самого дорогого процессора для высокопроизводительных настольных компьютеров по праву будет принадлежать именно Core i7-6950X Extreme Edition.
Впрочем, если подходить к Core i7-6950X как к более современной замене Core i7-5960X, то новинка выглядит определённо лучше. Благодаря внедрению нового технологического процесса Intel смогла добавить в свой флагманский процессор дополнительную пару ядер. Вместе с переходом на более совершенную микроархитектуру и внедрением технологии Turbo Boost Max 3.0 это позволило поднять производительность платформы LGA2011-v3 примерно на 25 процентов. В итоге получился значительный рывок вперёд, ведь подобного улучшения интеловских процессоров за один шаг мы не видели уже очень давно.
Интересно смотрится Core i7-6950X и при сопоставлении с Core i7-6700K. Однако тут далеко не всё так однозначно, потому что эти процессоры различаются в два с половиной раза по числу вычислительных ядер, и более чем впятеро – по цене. При этом массовый Core i7-6700K способен предложить как минимум не худшую производительность в играх и лучшую – в типовых офисных задачах. Преимущество же десятиядерника проявляется главным образом в ресурсоёмких приложениях для создания контента, что сразу же отправляет его в другую нишу – решений для профессионалов. Для большинства же домашних пользователей, типовые сценарии работы которых ограничиваются играми, офисными приложениями, потреблением медиаконтента и различными интернет-сервисами, Core i7-6950X – не просто совершенно избыточный, а откровенно бессмысленный вариант.
Однако не стоит забывать, что Core i7-6950X Extreme Edition приходит на рынок не в одиночестве. Одновременно с ним проанонсированы и более дешёвые процессоры для LGA2011-v3-систем, располагающие шестью и восемью вычислительными ядрами. И поскольку их стоимость выходит за границы разумного не слишком дерзко, они могут представлять определённый интерес для более широкой аудитории. Посудите сами: по сравнению с Haswell-E младшие представители семейства Broadwell-E обладают увеличившимися тактовыми частотами, а кроме того, они поддерживают технологию Turbo Boost Max 3.0 и базируются на более современной микроархитектуре. На первый взгляд, такого сочетания усовершенствований может быть вполне достаточно, чтобы стать привлекательным вариантом для высокопроизводительных ПК уже без всяких оговорок. К сожалению, пока нам не удалось протестировать такие новинки и убедиться в сказанном на практике, но мы непременно сделаем это в самое ближайшее время.
И в заключение хотелось бы особо подчеркнуть ещё одну немаловажную деталь: Broadwell-E оказался неожиданно интересной игрушкой для оверклокеров. В процессорах этого семейства появилось то, чего до сих пор нигде ещё не было, – возможность независимого управления частотой ядер. И эта функция при умелом обращении способна стать очень гибким инструментом для раскрытия частотного потенциала и скрытой производительности. Даже несмотря на то, что представители семейства Broadwell-E вряд ли окажутся способны установить новые абсолютные рекорды разгона, вдумчивая оптимизация рабочих параметров их отдельных ядер по многим критериям вполне может стать ключом к покорению недостижимых доселе рубежей быстродействия.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.