реклама
Процессоры и память

Intel Xeon 1,7 ГГц - король High-End?

⇣ Содержание

С момента первого выпуска Intel Pentium II Xeon прошло чуть меньше трех лет. Процессор базировался на том же ядре, что и Pentium II и Celeron тех дней, и позиционировался в роли процессора для high-end рабочих станций и серверов, на место Pentium Pro.

Одним из главных преимуществ Xeon было то, что процессор был достаточно мощным для большинства интенсивных серверных задач, и в то же время он сохранял функции ядра P6 для быстрого выполнения домашних/офисных приложений. Таким образом, благодаря Pentium II Xeon исчезла идея использования специализированного компьютера для работы, который не мог бы выполнять домашние/игровые приложения. Также Pentium II Xeon помог дальнейшему продвижению Intel на рынке многопроцессорных рабочих станций, который был захвачен не-x86 архитектурой.

Самый первый Pentium II Xeon был оснащен полноскоростным кэшем L2 до 2 Мб. Однако по причине использования 0,25 мкм технологии в Pentium II, кристалл был уже достаточно большим, и L2 кэш пришлось вынести за ядро и поместить на отдельном чипе, связанном внешней шиной с ядром процессора. Серия Xeon прошла долгую дорогу со своих первых дней в 1998 году. В Pentium III Xeon технология ядра уменьшилась до 0,18 мкм, поэтому кэш L2 (до 2 Мб) уже смог поместиться на кристалле процессора, что значительно улучшило производительность кэша.

Сегодня Intel продолжает свой курс по сегментированию своих флагманских процессоров и анонсирует процессор Xeon следующего поколения, который базируется на ядре Pentium 4 Willamette. Процессор называется по-старому, Intel Xeon, и выпускается в трех вариантах: 1,4 ГГц, 1,5 ГГц и 1,7 ГГц. Ядро процессора почти полностью идентично обычной (desktop) версии Pentium 4 за исключением незначительных деталей.



Архитектура Intel Xeon

Процессор Intel Xeon основан на точно таком же ядре, что и обычная версия Pentium 4. А это означает, что все то, чем гордится Pentium 4, есть и в Xeon. Но точно также это означает, что все недостатки Pentium 4 остались и в Xeon.

Мы не будем подробно останавливаться на архитектуре Pentium 4, а лишь вкратце пробежимся по основным чертам Pentium 4 и Xeon.

Гиперконвейерная технология (Hyper Pipelined Technology). У Xeon конвейер значительно длиннее, чем у Pentium III или Athlon. К сожалению, это означает, что Xeon выполняет меньше операций за такт, однако это обеспечивает путь для достижения значительно более высоких тактовых частот. В теории, работа на больших тактовых частотах позволит Xeon-у продемонстрировать весомое преимущество в производительности перед своими предшественниками, потому что факт выполнения меньших вычислений за такт не сильно заметен при умопомрачительных частотах. По этой же причине Pentium III мог достичь только 1 ГГц при использовании 0,18 мкм техпроцесса, и в то же время Xeon работает на 1,7 ГГц при том же самом техпроцессе. И как вы увидите, между ними ясно видна разница в производительности.

Улучшенное предсказание ветвлений (Improved Branch Prediction). Очевидно, что при таком длинном конвейере необходимо использовать улучшенный модуль предсказания ветвлений (BPU), как и сделано в Xeon. Можно утверждать, что BPU в Xeon является самым лучшим из всех существующих, и именно этот модуль сдерживает производительность Athlon. В любом случае, BPU в Xeon должен быть достойным, иначе недостатки гиперконвейерной архитектуры в P4 испортят всю картину.

Ядро быстрого выполнения (Rapid Execution Engine). Два ALU (арифметико-логический модуль) работают в Xeon с удвоенной скоростью (double pumped), они могут обрабатывать в два раза больше данных за такт чем обычно. Это дает ALU эффективную пропускную способность, аналогичную ALU, работающему с удвоенной тактовой частотой. В случае с 1,7 ГГц Xeon это означает, что ALU функционируют как обычные ALU (не с удвоенной скоростью) на частоте 3,4 ГГц. Такое ускорение необходимо для обеспечения у Xeon достойной производительности при работе с целыми числами. В целочисленном коде чаще всего происходят ошибки предсказания ветвлений, поэтому менее эффективное ALU привело бы к плохой производительности в целых числах, учитывая очень длинный конвейер Xeon.

Кэш с отслеживанием 12 тысяч инструкций (12K micro-op trace cache). Этот специальный кэш заменяет и улучшает традиционный кэш инструкций L1. 8-канальный ассоциативный кэш с отслеживанием выполнения кэширует операции после их декодирования и также кэширует операции по предсказанному пути выполнения. Это позволяет скрыть некоторые недостатки столь длинного конвейера.

256 кб улучшенный кэш передачи (256KB Advanced Transfer Cache). Подсистема кэша L2 в Xeon просто потрясающая, если не сказать больше. Она отличается не только 256-битной шиной от L2 кэша до процессора, но и способностью передавать данные их кэша на каждый такт, что означает превосходство по пиковой пропускной способности кэша в сравнении с другими процессорами в этом классе. У Xeon 1,7 ГГц пиковая пропускная способность при чтении/записи в кэш L2 составляет 54,4 Гбайт/с. Если сравнить с Pentium III 1,0 ГГц, то у него пропускная способность составляет 16 Гбайт/с, а у Athlon 1,33 ГГц - 10 Гбайт/с (Athlon ограничен 64-битной шиной до кэша L2).

Аппаратная упреждающая выборка (Hardware Prefetch). Xeon способен предсказывать, какие данные ему понадобятся перед реальным запросом из основной памяти, и он может заранее перевести эти данные в кэш. Таким образом, на момент запроса данных, они уже будут находиться в кэше. Если же данные так и не будут востребованы, место в кэше будет использовано вхолостую, и точно такая же ситуация произойдет и с частью пропускной способности FSB и шины памяти. В любом случае, аппаратная упреждающая выборка сводится к загрузке пропускной способности FSB/шины памяти, но благодаря следующей особенности архитектуры Xeon она так и не смогла стать серьезной проблемой.

Четырехскоростная (quad pumped) 100 МГц FSB и двухканальная RDRAM. Xeon использует 100 МГц FSB, скорость которой увеличена в четыре раза (quad pumped), таким образом она обеспечивает пропускную способность, эквивалентную 400 МГц FSB, то есть 3,2 Гбайт/с. FSB синхронно работает с двумя каналами RDRAM чипсета i850 на частоте 400 МГц используя две 16-битные шины. Таким образом, пиковая пропускная способность шины памяти составляет 3,2 Гбайт/с. Если для платформы Pentium III RDRAM была не так уж необходима, то для использования совместно с Xeon, такая память очень хорошо подходит.

SSE2. В Xeon добавлены новые 144 SSE2 инструкции к имеющимся в первом SSE 70 инструкциям. Под SPEC CPU2000 улучшение производительности с использованием одной только оптимизации под SSE2 находится в пределах 5%. Учитывая синтетическую природу теста SPEC CPU2000, очень непохоже, что SSE2 покажет нам какой-либо стоящий прирост производительности в современных приложениях. Единственное что мы не учли -SSE2 может использовать две 64-битные SIMD-Int и SIMD-FP операции. Эта возможность не используется в SPEC CPU2000 и она, возможно, еще покажет себя.


Технология Jackson - не в этот раз

Еще во время IDF существовало достаточно много причин поверить в то, что Intel Xeon будет первым процессором с использованием технологии Jackson (это ее внутреннее имя). Технология предназначена для использования одновременной многопоточности (Simultaneous Multithread, SMT) в ядре процессора. Говоря вкратце, процессор имеет аппаратное ограничение выполнения только одного потока в один момент времени. Если сравнить теоретическое число инструкций, которые процессор может выполнить за определенный такт (IPC), то оно будет намного выше действительного IPC при выполнении реальных задач. Связано это с тем, что процессор не всегда максимально загружен, и часть вычислительной мощности теряется.

Эффективность работы процессора многократно повысилась бы, если бы он был способен выполнять на аппаратном уровне несколько потоков одновременно. В этом и заключается основное преимущество технологии одновременной многопоточности.

Было бы очень логично, если бы технология Jackson начала использоваться в двухпроцессорных рабочих станциях на базе Xeon, так как приложения, которые обычно запускаются на таких станциях, должны были бы получить значительное преимущество от использования SMT ядра. К сожалению, процессор Intel Xeon, который вышел на днях, не задействует технологию Jackson.

Однако, как ясно видно по информации с IDF и по сообщениям некоторых источников, близких к Intel, технология Jackson значится в планах Intel. Эта технология должна стать большим шагом вперед для Intel, она открывает весьма любопытные возможности для увеличения производительности. Также не следует забывать, что Intel имеет обыкновение выпускать одно ядро и адаптировать его для самых важных сегментов рынка. Существует вероятность, что технология Jackson будет использоваться и в обычной версии Pentium 4, а не только в версии Xeon для рабочих станций и серверов.

Как вариант, может получиться ситуация, когда текущее ядро Willamette содержит технологию Jackson, но она не задействована ядром. Существует некоторое число проблем, которые Intel должна разрешить перед анонсом/включением поддержки Jackson, например, поддержка технологии программным обеспечением.

Мы с нетерпением ждем выхода технологии Jackson, однако, нам придется еще немного потерпеть. Не будем забывать, что к концу года планируется уменьшение технологии изготовления ядра, а в следующем году будет выпущен Xeon MP (4+ процессора) с L3 кэшем на кристалле ядра. Оба этих события могут послужить хорошей причиной для анонса технологии Jackson.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
WhatsApp научился расшифровывать голосовые сообщения в текст — русский язык поддерживается 42 мин.
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 2 ч.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 3 ч.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 3 ч.
OpenAI обдумывает создание собственного интернет-браузера и поисковых систем для противостояния Google 4 ч.
Apple разрабатывает LLM Siri — она будет больше похожа на человека и выйдет с iOS 19 5 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 11 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 12 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 13 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 14 ч.
Kioxia подала заявку на IPO — третьего крупнейшего производителя флеш-памяти оценили всего в $4,85 млрд 31 мин.
«Джеймс Уэбб» первым в истории нашёл «зигзаг Эйнштейна» — уникальное искривление пространства-времени 33 мин.
Второй электромобиль Xiaomi выйдет через год после первого и будет заметно от него отличаться 2 ч.
Oracle объявила о доступности облачного ИИ-суперкомпьютера на базе NVIDIA H200 2 ч.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 3 ч.
Google снова уходит с рынка планшетов, сворачивая разработку Pixel Tablet 2 4 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 12 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 12 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 12 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 14 ч.