реклама
Процессоры и память

45-нм процессоры Intel Penryn и Nehalem: особенности архитектуры

⇣ Содержание

Вступление

Одна из наиболее интригующих тем новостей и публикаций этого сезона – выпуск компанией Intel процессоров с соблюдением норм 45 нм техпроцесса. На страницах нашего сайта, по мере поступления подробностей о новых чипах, прошёл ряд публикаций соответствующего профиля. Сегодня мы попробуем детально рассказать о нововведениях и технологиях в новых процессорах. Попытаемся подвести некую черту под теоретическими выкладками, после которой, как известно, следуют практические испытания инженерных и розничных образцов процессоров.

Микроархитектуры ближайших лет

Прежде всего, расскажем читателям о последних планах Intel по внедрению процессорных микроархитектур в ближайшие пару лет. Процессоры для настольных ПК нового поколения с рабочим названием Penryn будут построены на базе усовершенствованной микроархитектуры Intel Core. Основным их отличием станет переход на 45-нм техпроцесс и некоторые архитектурные новшества, вследствие чего повысится энергоэффективность, расширится частотный потенциал, увеличится количество выполняемых команд за такт и прочее.
После наладки массового производства чипов Penryn, Intel планирует представить процессоры Nehalem с новой одноименной микроархитектурой - на смену Intel Core. Примерно через два-три года после анонса 45-нм процессоров – ориентировочно, ближе к 2009-2010, Intel надеется представить новый, более прецизионный 32-нм техпроцесс. Пока эти планы довольно туманны: даже переход на 45 нм сопровождался большими трудностями и потребовал задействования совершенно новых материалов (high-k диэлектрики и металлические затворы). В рамках 32 нм техпроцесса будут представлены процессоры с рабочим названием Westmere, ранее известные как Nehalem-C, с той же микроархитектурой Nehalem. Через два года после появления Nehalem на смену придет микроархитектура Gesher. О ней пока очень мало сведений. Известно лишь, что первые процессоры Gesher будут выпускаться по 32-нм техпроцессу. На этом прогнозы относительно развития процессоров заканчиваются. Судя по этим планам, Intel придерживается прежней стратегии смены микроархитектур и перехода на новый техпроцесс каждые два года. Удастся ли лидеру процессорной индустрии удерживать такие высокие темпы развития, сказать сложно. В Intel такую стратегию выпуска продукции называет “tick-tock” (“тик-так”). Каждый “тик” отражает новый этап развития полупроводниковых производственных технологий и усовершенствования в области микроархитектуры (например, Penryn). Каждый “так” соответствует созданию новой микроархитектуры (например, Nehalem).

Подробнее о процессорах Penryn

Процессоры семейства Penryn хронологически появятся раньше Nehalem, с них и начнём. Сегодня на разных стадиях разработки находятся более 15 продуктов семейства Penryn. В числе первых мы увидим чипы, ориентированные на разные секторы рынка.
До недавнего времени было известно о готовящихся к выпуску двухъядерном процессоре для ноутбуков, 2- и 4-х ядерных моделях для настольных ПК, а также 2- и 4-х ядерных процессорах для серверного сегмента. В дни Форума Intel для разработчиков в Пекине мы также узнали о планах компании по выпуску 45-нм чипов и для устройств класса UMPC (Ultra Mobile PC). Новые процессоры станут серьёзной заявкой и могут пошатнуть позиции таких производителей, как AMD, VIA Technologies и других.
Усовершенствования, которые принесет переход на новый техпроцесс, интересно рассмотреть с позиций количественного сравнения. Например, четырехъядерные процессоры Penryn будут включать около 820 млн. транзисторов, которые разместятся на двух кристаллах площадью 107 мм2. Для сравнения, современные четырехъядерные процессоры Intel Kentsfield имеют 582 млн. транзисторов, при этом площади кристаллов четырехъядерных процессоров, выпускающихся по 65-нм нормам, составляют 143 мм2.
Новшества, которые принесет следующее поколение процессоров, можно рассматривать по отношению к пяти современным технологиям Intel: Wide Dynamic Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost, Intelligent Power Capability.
Механизм Wide Dynamic Execution обеспечивает выполнение большего числа команд за один тактовый цикл, что увеличивает производительность и помогает добиться повышения энергоэффективности. В рамках этой технологии компания Intel представит усовершенствованный более быстрый блок деления, основанный на базе методики radix-16, а также улучшенную технологию виртуализации Enhanced Intel Virtualization Technology. Инновационная архитектура на базе radix-16 позволит существенно уменьшить задержки при выполнении целочисленных операций деления, а также операций деления с плавающей запятой. На нижеприведенной диаграмме вы видите красноречивые результаты, которые не требуют комментариев.
Технология Advanced Smart Cache нацелена на обеспечение более высокой производительности и эффективности кэш-памяти. В процессорах семейства Penryn компания Intel решила увеличить объем кэша. Так, двухъядерные процессоры будут оснащаться кэшем L2 емкостью до 6 Мб, а отдельные четырехъядерные модели обзаведутся 12-Мб кэш-памятью. О частотных характеристиках пока говорится в ключе преодоления планки 3 ГГц.
В рамках технологии Smart Memory Access говорится об увеличении пропускной способности шины. Подтверждается информация об освоении шины FSB 1600 МГц. Сообщается, что шина FSB 1600 МГц появится в некоторых моделях процессоров для серверов и рабочих станций; когда будут выпущены модели с высокоскоростной шиной для настольных ПК, пока не уточняется. Технология Advanced Digital Media Boost применяется для ускорения обработки видео, изображения и речевых потоков. Для повышения производительности при обработке медиаданных Intel решила добавить к архитектуре ISA набор расширений SSE4 (Streaming SIMD Extensions 4), который станет доступным для большинства массовых секторов рынка ПК с появлением 45-нм процессоров. Этот новый набор команд включает множество инновационных инструкций (их насчитывается около 50), которые условно можно разделить на две группы:
  • Примитивы векторизации для компиляторов и ускорители мультимедийных приложений;
  • Ускорители обработки строк и текстовой информации.
Пожалуй, на SSE4 остановимся детальнее, поскольку технология является одним из ключевых нововведений. Для начала опишем приложения, которые затронет это усовершенствование. Улучшения коснутся графики, кодирования и обработки видео, создания трехмерных изображений, игр, Web-серверов, серверов приложений. Как утверждает Intel, увеличится производительность приложений с высокой интенсивностью вычислений - анализа хранилищ данных, СУБД, сложных алгоритмов поиска и сопоставления, алгоритмов сжатия звука, видео, изображений и данных, алгоритмов синтаксического анализа и анализа логических состояний, а также многих других.
По словам Intel, SSE4 – самое масштабное и значительное расширение архитектуры Intel ISA со времени появления SSE2. Набор команд SSE4 содержит несколько примитивов векторизации для компиляторов, обеспечивающих дальнейшее увеличение производительности и эффективности мультимедийных приложений. Имеются также и новые инновационные инструкции для обработки строк. Еще одним усовершенствованием является механизм перестановок - Super Shuffle Engine. Новый блок умеет выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при обработке операций, связанных с перестановкой (упаковка, распаковка, сдвиг упакованных значений, вставка). Сравнение количества тактов, нужных для выполнения базовых операций SSE, приведено на диаграмме. В среднем наблюдается двукратное увеличение производительности.
Интересные новшества касаются уменьшения уровня потребления мощности и увеличения показателя «производительность на ватт». В связи с этим Intel представила две новые технологии: Deep Power Down Technology и Enhanced Dynamic Acceleration Technology. Технология Deep Power Down Technology будет внедрена, в первую очередь, в процессоры для мобильных платформ (Mobile Penryn). Для понижения энергопотребления в режиме бездействия добавлено еще одно особое состояние процессора, именуемое как Deep Power Down Technology State, или C6. В этом режиме предусмотрено отключение ядер, при этом также полностью отключается кэш-память. Это позволяет существенно понизить напряжение ядра и потребляемой мощности, что, в свою очередь, увеличивает время работы батареи.
Интересным нововведением является технология Enhanced Dynamic Acceleration Technology (EDAT). Её идея состоит в следующем. Для простоты возьмем случай с двухъядерным процессором. Поскольку в однопоточных приложениях от многоядерности толку мало, основную роль здесь играет производительность отдельно взятого ядра. Поэтому Intel предусмотрела увеличение частоты работающего ядра (non-idle core), в то время как второе (idle core) находится в одном из состояний бездействия (C3-C6) и его тепловыделение резко сокращается. Эту разницу использует работающее ядро и повышает свою частоту до достижения процессором граничного уровня TDP. Для наглядности приводим следующую иллюстрацию.
Теперь об уровне TDP 45-нм процессоров. К сожалению, пока нет данных о тепловыделении мобильных чипов. Двухъядерные Penryn для настольных ПК попадут в энергетический класс 65 Вт, а для их четырехъядерных родственников предусмотрены тепловые пакеты 95 и 130 Вт. В серверном сегменте для двухъядерных Intel Xeon уровни TDP составят 40, 65 и 80 Вт, а для четырехъядерных – 50, 80 и 120 Вт. Согласно внутренним тестам Intel, в игровых приложениях наблюдается 20-ти процентный прирост производительности новых чипов, а в операциях с декодированием видео (при условии использования SSE4) – более 40% прирост. Если сравнивать серверный процессор Penryn с частотой более 3 ГГц и самый мощный четырехъядерный Xeon (Xeon X5355, 2,66 ГГц, FSB 1333 МГц), прирост в приложениях, интенсивно использующих операции с плавающей запятой и чувствительных к пропускной способности, составит около 45%.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
window-new
Soft
Hard
Тренды 🔥
Nvidia выпустила драйвер с поддержкой дополнения The Order of Giants к Indiana Jones and the Great Circle и DLSS 4 в Wuthering Waves 15 мин.
Автосохранение в Microsoft Word теперь включено по умолчанию — но копии сохраняются не на ПК 3 ч.
В Elden Ring Nightreign скоро появятся экспедиции повышенной сложности — анонсирован режим Deep of Night для самых смелых 3 ч.
Нелинейный шутер Judas от создателя BioShock вернулся из небытия с новыми подробностями и ключевой иллюстрацией 4 ч.
Xiaomi представила HyperOS 3 — углубленная совместимость с Apple, редизайн, Super Island и многое другое 4 ч.
Apple добилась удаления приложение iTorrent из альтернативного магазина AltStore PAL 5 ч.
Представлен Avanpost CA — российский аналог Microsoft Certificate Authority 6 ч.
Capcom добавила в Resident Evil Requiem вид от третьего лица потому, что Resident Evil 7 оказалась «даже слишком страшной» 8 ч.
Новые меры по борьбе с киберпреступниками могут ударить по «белым хакерам» в России 8 ч.
Разработчик Dread Delusion анонсировал Entropy — олдскульную пошаговую ролевую игру про актёра театра, на мир которого напали демоны 9 ч.
Новый рекорд многоразовости SpaceX — первая ступень Falcon 9 совершила 30-й полёт 2 мин.
Видео: первые демо-полёты электролёта SkyDrive от компании Suzuki 43 мин.
Килограммовый ноутбук Honor MagicBook Art 14 (2025) дебютировал на международном рынке за £1500 48 мин.
Материнские платы ASRock наконец перестанут портить процессоры Ryzen 9000X3D, но это не точно 60 мин.
Honor представила глобальную версию тончайшего складного смартфона Magic V5 — от €1999 в Европе 3 ч.
xMEMS Labs показала прототип умных очков с ультратонким динамиком и твердотельным кулером 4 ч.
Foxconn инвестировала более $200 млн в производство в Мексике, вероятно — для выпуска ИИ-серверов 5 ч.
В России стартовали продажи крайне доступного смартфона Infinix Smart 10 5 ч.
Tokyo Electron открестилась от участия в краже секретных разработок TSMC 5 ч.
AMD прекратила выпуск коробочных кулеров Wraith Prism и Wraith Spire для Ryzen 5000, 7000 и 8000G 5 ч.