С момента первого выпуска Intel Pentium II Xeon прошло чуть меньше трех лет. Процессор базировался на том же ядре, что и Pentium II и Celeron тех дней, и позиционировался в роли процессора для high-end рабочих станций и серверов, на место Pentium Pro.
Одним из главных преимуществ Xeon было то, что процессор был достаточно мощным для большинства интенсивных серверных задач, и в то же время он сохранял функции ядра P6 для быстрого выполнения домашних/офисных приложений. Таким образом, благодаря Pentium II Xeon исчезла идея использования специализированного компьютера для работы, который не мог бы выполнять домашние/игровые приложения. Также Pentium II Xeon помог дальнейшему продвижению Intel на рынке многопроцессорных рабочих станций, который был захвачен не-x86 архитектурой.
Самый первый Pentium II Xeon был оснащен полноскоростным кэшем L2 до 2 Мб. Однако по причине использования 0,25 мкм технологии в Pentium II, кристалл был уже достаточно большим, и L2 кэш пришлось вынести за ядро и поместить на отдельном чипе, связанном внешней шиной с ядром процессора. Серия Xeon прошла долгую дорогу со своих первых дней в 1998 году. В Pentium III Xeon технология ядра уменьшилась до 0,18 мкм, поэтому кэш L2 (до 2 Мб) уже смог поместиться на кристалле процессора, что значительно улучшило производительность кэша.
Сегодня Intel продолжает свой курс по сегментированию своих флагманских процессоров и анонсирует процессор Xeon следующего поколения, который базируется на ядре Pentium 4 Willamette. Процессор называется по-старому, Intel Xeon, и выпускается в трех вариантах: 1,4 ГГц, 1,5 ГГц и 1,7 ГГц. Ядро процессора почти полностью идентично обычной (desktop) версии Pentium 4 за исключением незначительных деталей.
Архитектура Intel Xeon
Процессор Intel Xeon основан на точно таком же ядре, что и обычная версия Pentium 4. А это означает, что все то, чем гордится Pentium 4, есть и в Xeon. Но точно также это означает, что все недостатки Pentium 4 остались и в Xeon.
Мы не будем подробно останавливаться на архитектуре Pentium 4, а лишь вкратце пробежимся по основным чертам Pentium 4 и Xeon.
Гиперконвейерная технология (Hyper Pipelined Technology). У Xeon конвейер значительно длиннее, чем у Pentium III или Athlon. К сожалению, это означает, что Xeon выполняет меньше операций за такт, однако это обеспечивает путь для достижения значительно более высоких тактовых частот. В теории, работа на больших тактовых частотах позволит Xeon-у продемонстрировать весомое преимущество в производительности перед своими предшественниками, потому что факт выполнения меньших вычислений за такт не сильно заметен при умопомрачительных частотах. По этой же причине Pentium III мог достичь только 1 ГГц при использовании 0,18 мкм техпроцесса, и в то же время Xeon работает на 1,7 ГГц при том же самом техпроцессе. И как вы увидите, между ними ясно видна разница в производительности.
Улучшенное предсказание ветвлений (Improved Branch Prediction). Очевидно, что при таком длинном конвейере необходимо использовать улучшенный модуль предсказания ветвлений (BPU), как и сделано в Xeon. Можно утверждать, что BPU в Xeon является самым лучшим из всех существующих, и именно этот модуль сдерживает производительность Athlon. В любом случае, BPU в Xeon должен быть достойным, иначе недостатки гиперконвейерной архитектуры в P4 испортят всю картину.
Ядро быстрого выполнения (Rapid Execution Engine). Два ALU (арифметико-логический модуль) работают в Xeon с удвоенной скоростью (double pumped), они могут обрабатывать в два раза больше данных за такт чем обычно. Это дает ALU эффективную пропускную способность, аналогичную ALU, работающему с удвоенной тактовой частотой. В случае с 1,7 ГГц Xeon это означает, что ALU функционируют как обычные ALU (не с удвоенной скоростью) на частоте 3,4 ГГц. Такое ускорение необходимо для обеспечения у Xeon достойной производительности при работе с целыми числами. В целочисленном коде чаще всего происходят ошибки предсказания ветвлений, поэтому менее эффективное ALU привело бы к плохой производительности в целых числах, учитывая очень длинный конвейер Xeon.
Кэш с отслеживанием 12 тысяч инструкций (12K micro-op trace cache). Этот специальный кэш заменяет и улучшает традиционный кэш инструкций L1. 8-канальный ассоциативный кэш с отслеживанием выполнения кэширует операции после их декодирования и также кэширует операции по предсказанному пути выполнения. Это позволяет скрыть некоторые недостатки столь длинного конвейера.
256 кб улучшенный кэш передачи (256KB Advanced Transfer Cache). Подсистема кэша L2 в Xeon просто потрясающая, если не сказать больше. Она отличается не только 256-битной шиной от L2 кэша до процессора, но и способностью передавать данные их кэша на каждый такт, что означает превосходство по пиковой пропускной способности кэша в сравнении с другими процессорами в этом классе. У Xeon 1,7 ГГц пиковая пропускная способность при чтении/записи в кэш L2 составляет 54,4 Гбайт/с. Если сравнить с Pentium III 1,0 ГГц, то у него пропускная способность составляет 16 Гбайт/с, а у Athlon 1,33 ГГц - 10 Гбайт/с (Athlon ограничен 64-битной шиной до кэша L2).
Аппаратная упреждающая выборка (Hardware Prefetch). Xeon способен предсказывать, какие данные ему понадобятся перед реальным запросом из основной памяти, и он может заранее перевести эти данные в кэш. Таким образом, на момент запроса данных, они уже будут находиться в кэше. Если же данные так и не будут востребованы, место в кэше будет использовано вхолостую, и точно такая же ситуация произойдет и с частью пропускной способности FSB и шины памяти. В любом случае, аппаратная упреждающая выборка сводится к загрузке пропускной способности FSB/шины памяти, но благодаря следующей особенности архитектуры Xeon она так и не смогла стать серьезной проблемой.
Четырехскоростная (quad pumped) 100 МГц FSB и двухканальная RDRAM. Xeon использует 100 МГц FSB, скорость которой увеличена в четыре раза (quad pumped), таким образом она обеспечивает пропускную способность, эквивалентную 400 МГц FSB, то есть 3,2 Гбайт/с. FSB синхронно работает с двумя каналами RDRAM чипсета i850 на частоте 400 МГц используя две 16-битные шины. Таким образом, пиковая пропускная способность шины памяти составляет 3,2 Гбайт/с. Если для платформы Pentium III RDRAM была не так уж необходима, то для использования совместно с Xeon, такая память очень хорошо подходит.
SSE2. В Xeon добавлены новые 144 SSE2 инструкции к имеющимся в первом SSE 70 инструкциям. Под SPEC CPU2000 улучшение производительности с использованием одной только оптимизации под SSE2 находится в пределах 5%. Учитывая синтетическую природу теста SPEC CPU2000, очень непохоже, что SSE2 покажет нам какой-либо стоящий прирост производительности в современных приложениях. Единственное что мы не учли -SSE2 может использовать две 64-битные SIMD-Int и SIMD-FP операции. Эта возможность не используется в SPEC CPU2000 и она, возможно, еще покажет себя.
Технология Jackson - не в этот раз
Еще во время IDF существовало достаточно много причин поверить в то, что Intel Xeon будет первым процессором с использованием технологии Jackson (это ее внутреннее имя). Технология предназначена для использования одновременной многопоточности (Simultaneous Multithread, SMT) в ядре процессора. Говоря вкратце, процессор имеет аппаратное ограничение выполнения только одного потока в один момент времени. Если сравнить теоретическое число инструкций, которые процессор может выполнить за определенный такт (IPC), то оно будет намного выше действительного IPC при выполнении реальных задач. Связано это с тем, что процессор не всегда максимально загружен, и часть вычислительной мощности теряется.
Эффективность работы процессора многократно повысилась бы, если бы он был способен выполнять на аппаратном уровне несколько потоков одновременно. В этом и заключается основное преимущество технологии одновременной многопоточности.
Было бы очень логично, если бы технология Jackson начала использоваться в двухпроцессорных рабочих станциях на базе Xeon, так как приложения, которые обычно запускаются на таких станциях, должны были бы получить значительное преимущество от использования SMT ядра. К сожалению, процессор Intel Xeon, который вышел на днях, не задействует технологию Jackson.
Однако, как ясно видно по информации с IDF и по сообщениям некоторых источников, близких к Intel, технология Jackson значится в планах Intel. Эта технология должна стать большим шагом вперед для Intel, она открывает весьма любопытные возможности для увеличения производительности. Также не следует забывать, что Intel имеет обыкновение выпускать одно ядро и адаптировать его для самых важных сегментов рынка. Существует вероятность, что технология Jackson будет использоваться и в обычной версии Pentium 4, а не только в версии Xeon для рабочих станций и серверов.
Как вариант, может получиться ситуация, когда текущее ядро Willamette содержит технологию Jackson, но она не задействована ядром. Существует некоторое число проблем, которые Intel должна разрешить перед анонсом/включением поддержки Jackson, например, поддержка технологии программным обеспечением.
Мы с нетерпением ждем выхода технологии Jackson, однако, нам придется еще немного потерпеть. Не будем забывать, что к концу года планируется уменьшение технологии изготовления ядра, а в следующем году будет выпущен Xeon MP (4+ процессора) с L3 кэшем на кристалле ядра. Оба этих события могут послужить хорошей причиной для анонса технологии Jackson.
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.