реклама
Процессоры и память

Процессор Cell: шаг в будущее

⇣ Содержание

Шина Взаимосвязываемых Элементов

Данная шина связывает в единую систему PPE, SPE, а также контроллеры MIC и BIC. Она представляет собой четыре концентрических кольца (шириной 128 бит на кольцо), проходящих через все элементы Cell. Для уменьшения возникающих шумов одна пара "колец" передаёт данные в одном направлении, а вторая - в обратном. Данные, проходящие из одного SPE в другой, используют установленные в них специальные буферы/повторители, обеспечивающие беспрерывное движение данных по шине. Передавая по 96 байт за цикл, EIB способна обрабатывать более 100 уникальных запросов.

Дизайн EIB был создан специально для возможности дальнейшего масштабирования Cell. Длина маршрута сигнала не изменяется в зависимости от количества SPE. Так как данные путешествуют от одного SPE к другому, увеличение их количества приводит лишь к увеличению латентности транспортировки данных от одного элемента Cell к другому.

В текущей версии архитектуры Cell шина EIB организована таким образом, что SPE устанавливаются лишь по горизонтальной оси. Благодаря этому существует возможность легко добавлять/убирать дополнительные SPE, доводя их общее количество до максимально возможного на том или ином производственном тех. процессе (с добавлением SPE увеличивается длина кристалла процессора, что видно на рисунке ниже).


"Ядро Cell под электронным микроскопом. Обратите внимание на расположение шины EIB и SPE относительно её"

PPE, SPE и EIB представляют собой основу архитектуры Cell, единое трио, работающее вместе. Кратко его и рассмотрим. Сразу напомним, что SPE - отдельный процессор с собственным ОЗУ, пусть и не такой продвинутый, как современные Pentium или PowerPC. Поэтому и выполняет SPE свои собственные инструкции. Синергический процессорный элемент является "подчинённым" POWER-процессора, выполняя те задачи, которые на него возложит PPE. Тем не менее, работают они параллельно.

Вместе с Cell на свет появляется термин "апулет" (APUlet), произошедший от старого названия SPE. Он представляет собой объединённый в единое целое код векторной программы и обрабатываемые ею данные.

При необходимости использования "подчинённого" процессора PPE направляет апулет по EIB в предназначенный для этого SPE, где тот выполняется. Затем обработанный SPE апулет отправляется либо в RAM (если они необходимы PPE), либо в локальную память векторного процессора, из которой они могут быть перенаправлены через EIB в следующий SPE одного и того же Cell-чипа (архитектура Cell позволяет SPE работать конвейерно - один за другим).

Контроллер Интерфейса Памяти

Для непрерывного обеспечения PPE и SPE данными необходима память с очень высокой пропускной способностью. Разрабатывая PlayStation 2, Sony и Toshiba учли способность компании Rambus создавать высокоскоростные интерфейсы и память, приняв решение использовать Direct RDRAM в консоли.

"Эксперимент" удался. И теперь, во время создания Cell, сотрудничество с компанией Rambus продолжается. Во время открытия ISSCC 2005 7 февраля президент компании Дэйв Муринг (Dave Mooring) объявил о лицензировании STI технологий памяти XDR RAM и высокоскоростной шины Flex I/O.


Дэйв Муринг

Двухканальная память XDR RAM (Ранее носившая кодовое название Yellowstone), используемая с Cell, обеспечивает суммарную пропускную способность в 25,2 Gb/sec. В подсистеме памяти каждый канал способен обслуживать до 36 чипов памяти, соединённых одними шинами команд (ШК) и данных (ШД). ШД каждого чипа подключается к контроллеру памяти через набор двунаправленных соединений типа "точка-точка". Сигналы передаются по ШК и ШД со скоростью 800 Мбит/с. Скорость передачи интерфейса "точка-точка" составляет 3,2 Гбит/с. При использовании устройств с разрядностью ШД 16 бит каждый канал XDR RAM может обеспечивать максимальную пропускную способность в 102,4 Гбит/с (умножаем 2 канала на 16-битную ШД и на проп. способность интерфейса "точка-точка" 3,2 Гбит/с) или 12,6 Gb/sec. Поэтому контроллер памяти текущей версии процессора Cell, использующего двухканальную память XDR RAM и 4 чипа памяти, обеспечивает пропускную способность в 25,2 Gb/sec.

К сожалению, чипы XDR RAM, в данный момент доступные на рынке, обладают ёмкостью лишь 512 Мбит, так что максимальный объём RAM в системе на базе Cell не может превышать 256 Мбайт. К счастью микросхемы памяти XDR RAM могут быть сконфигурированы таким образом, что 36 чипов будут подключены к одному 36-битному каналу. В такой конфигурации двухканальная XDR RAM может поддерживать до 32 Гбайт памяти (512 Мбит чипы) с коррекцией ошибок (ECC). Да-да, Дэйв Барски (Dave Bursky) из журнала Electronic Design Magazine заявляет, что подсистема XDR RAM использует 72 пары сигналов для ШД, что говорит о поддержке памятью ECC. Конечно, игровой консоли она не пригодится, но вот для рабочих станций и серверов будет, как говорится - "в самый раз".

Контроллер Интерфейса Шины ввода/вывода

Второй технологией, лицензированной STI, является интерфейс высокоскоростной шины Flex I/O (ранее носившей кодовое название Redwood), применённый в BIC. Flex I/O состоит из 12-байтных каналов (разрядностью 8 бит каждый). Шина использует 96 дифференцированных сигнальных пар для достижения пропускной способности в 6,4 Гбайт/с по одному каналу. Конфигурация канала асимметрична: 7 байт отводится на передачу, а 5 байт - на приём. Благодаря этому пропускная способность 12-битной пары составляет 44,8 Гбайт/с на передачу и 32 Гбайт/с на приём. В результате суммарная пропускная способность шины ввода/вывода составляет 76,8 Гбайт/с. Во Flex I/O реализованы две интересные технологии - FlexPhase и DRSL (Differential Rambus Signaling Level, дословно - дифференциальный уровень сигналов Rambus).

При размещении дорожек на печатной плате, инженерам необходимо соблюдать идентичность их длины (например, дорожки шины адреса Flex I/O). Благодаря этому сигналы, идущие по ним, будут приходить к приёмнику с одинаковой скоростью. Опоздание сигнала может привести к некорректной работе всей системы. Поэтому инженерам приходится закручивать дорожки в невероятные спирали, лишь бы сигналы по ним приходили в назначенное время.

FlexPhase представляет собой технологию выравнивания сигналов, приходящих не в заданное для них время. Достигается это путём задержки сигнала на приёмнике. Несмотря на возникающую латентность, такой приём позволяет намного упростить разводку печатной платы.

Вторая технология, DRSL, похожа на ту, что применяет корпорация Intel для уменьшения тепловыделения арифметико-логических устройств в своих Pentium 4. Не вдаваясь в технические подробности, объясним её так: при уменьшении напряжения питания устройства становится всё труднее отличать высокий уровень сигнала (или логическая "1") от низкого (логический "0"). Допустим, если 5В ещё можно отличить от 0В, то при величинах 0,09В и 0В сделать это намного труднее. Вместо поиска различий DRSL осуществляет "вычитание" напряжения двух величин и использует результат в качестве сигнального. Используя низковольтные сигнальные величины, можно свести тепловыделение к минимуму (даже несмотря на высокоскоростную шину).

Вполне возможно, что с распространением Cell и XDR RAM, и Flex I/O перекочуют в персональные компьютеры, дав компании Rambus второй шанс на этом рынке.


"Так, по мнению сайта AnandTech, может выглядеть будущая архитектура PC с применением технологий XDR RAM и Flex I/O"

Общие сведения о Cell

Разобравшись с архитектурой Cell, поговорим о его характеристиках. Продемонстрированный на ISSCC 2005 прототип процессора был изготовлен по 0,09 мкм тех. процессу (8-слоёв медных соединений) с использованием "кремния-на-изоляторе" (SOI, Silicon-on-Insulator). Количество транзисторов в чипе составляет 234 миллиона, площадь кристалла - 221 мм2 (приблизительно таким же был прототип Emotion Engine).


"Прототип Cell в корпусе BGA"

Каждый SPE в Cell состоит из 21 млн. транзисторов, из которых 14 млн. отводится на локальную память, а 7 млн. - на логику. При этом его размеры составляют 5,81 мм * 2,8 мм (0,09 мкм тех. процесс с применением SOI).

Кристалл Cell размещён внутри BGA-корпуса с размерами 42,5 * 42,5 мм. Из 1236 контактов процессора 506 являются сигнальными, а остальные предназначены для питания и "земли".


"30-мм пластина с кристаллами Cell"

На ISSCC 2005 был продемонстрирован прототип, работающий на частоте 4 ГГц. При этом пиковая производительность восьми SPE, по заявлениям инженеров STI, составляет 250 Гигафлоп/с, или 250 миллиардов операций с числами с плавающей запятой (сравните это число с 851 Гигафлоп/с наименее быстрого суперкомпьютера из списка Top500). В лабораториях же STI "трудятся" Cell'ы с частотами от 3,2 до 5,3 ГГц (напряжение питания от 0,09В до 1,3В). Энергопотребление 5,3 ГГц чипа составляет около 180 Вт, 4 ГГц чипа - 80 Вт. При этом стоит учитывать, что эти процессоры - тестовые экземпляры, и изготовлены по "старой" технологии, которая при массовом производстве использоваться не будет.


"Температура ядра прототипа Cell"

Так, SCEI заявила, что процессор Cell, изготовленный по тех. процессу 0,065 мкм с использованием технологий SOI и "напряжённого кремния" (strained silicon) будет потреблять 30-40 Вт при частоте 4,6 ГГц. К тому же в Cell встроены один линейный и десять цифровых датчиков тепла, а также интеллектуальная система динамического понижения частоты процессора с пятью ступенями, позволяющая ещё более уменьшить тепловыделение и потребляемую мощность.

Начало массового производства Cell должно начаться в третьем квартале этого года. К тому времени завод IBM в Ист-Фишкилле (штат Нью-Йорк), построенный во времена 0,13 мкм тех. процесса, сможет производить 0,065 мкм пластины с кристаллами Cell. Завод же Sony в г. Нагасаки был изначально построен для Cell. Кроме того, IBM и Sony объявили о готовности вложить 2,5 млрд. долл в завод компании Infineon, строительство которого будет начато во второй половине этого года. Он поможет разгрузить производственные мощности партнёров и увеличить суммарный объём производства. IBM и Sony планируют выпускать вначале по 15 тыс. 30-мм пластин ежемесячно, постепенно увеличивая цифру.

Благодаря большим объёмам производства (десятки и сотни миллионов чипов в год) цена на процессоры Cell должна быть на приемлемом уровне. Желание STI конкурировать с Intel/AMD означает, прежде всего, ценовую войну. Даже после запуска в производство первых чипов Cell разработка архитектуры будет продолжаться. К 2010 году частоту процессоров, благодаря использованию всё более совершенного тех. процесса, а также оптических соединений между транзисторами, планируется поднять до 10 ГГц.

Cell в каждый дом!

Для какой же техники предназначен Cell?

Ещё 29 ноября прошлого года IBM, Sony Corporation и SCEI объявили о создании первой рабочей станции на базе прототипов процессора. Через некоторое время такие станции начали поставлять разработчикам "стартовых" игр для консоли PlayStation 3.

"Рабочая станция на базе Cell полностью изменит среду создания цифрового контента", - заявил Масаюки Чатани (Masayuki Chatani), технический директор (CTO) SCEI, - "Её невероятная мощь будет проявлять себя в разработке всех видов цифрового контента, начиная с фильмов и програм широковещательного ТВ, и заканчивая играми нового поколения для PlayStation".


"Одноклеточный организм среди своих собратьев"

Именно так. Рабочие станции на базе Cell предназначены не только для создания консольных игр. Они должны найти применение во всех областях, требующих больших вычислительных возможностей, таких как: видеомонтаж, создание компьютерных спецэффектов, научные расчёты и моделирование, большие базы данных, CAD-системы. Но не рабочие станции являются основным применением Cell. Главный продукт, для которого он разработан - PlayStation 3.

Прибыль, получаемая SCEI от PlayStation 2, составляет до 60% от общего дохода Sony (10% дохода компании, 3,59 мрд. долл. уходит на полупроводниковый бизнес ежегодно), так что компания старается из всех сил, чтобы консоль нового поколения получилась революционной. Судя по имеющейся информации, SCEI движется в правильном направлении. Судите сами: PlayStation 3 будет оснащена четырьмя чипами Cell с частотой 4,6 ГГц (пиковая производительность 32 SPE - 1 Терафлоп! И это не считая четырёх PPE и их блоков VMX!). Благодаря использованию четырёх процессоров пропускная способность подсистемы памяти составит 100 Гбайт/с. Правда, по имеющимся данным, объём XDR RAM составит "всего" 256 Мбайт, но будем надеяться, что компании, создающие игры, будут использовать эту память "с умом" (вспомним о 32 Мбайтах RAM, установленных в PlayStation 2, и о качестве игр для неё). Каждая консоль будет обладать портом интерфейса Flex I/O, благодаря чему подключать к ней аналогичные PlayStation 3 и другие устройства, оснащённые Cell, не составит особого труда.


"Вполне возможно, что архитектура PlayStation 3 будет выглядеть именно так"

Как уже сообщалось на 3Dnews, SCEI намерена продемонстрировать рабочий прототип PlayStation 3 до начала выставки E3 2005, что говорит о желании компании не отставать от Microsoft с её Xbox 2.

Уже упоминавшаяся ориентация Cell не только на консоли, но и на сервера "на руку" IBM. "Голубой гигант" уже неоднократно заявлял, что "клетки" могут применяться в различных компьютерах: от ПК и рабочих станций до серверов и суперкомпьютеров. Не будем забывать и о словах IBM, согласно которым стандартная стойка двухпроцессорных серверов на базе Cell обеспечит производительность в 16 Терафлоп.

Но сервера - не единственное применение Cell в качестве "серьёзного" чипа. Благодаря высокой производительности, малому энергопотреблению и изначальной ориентированности на распределённые вычисления, новый процессор может найти применение и в суперкомпьютерах. Вспомним "клеточную архитектуру" IBM 2000 года. На её основе был создан суперкомпьютер Blue Gene/L, с 16 сентября 2004 года и до недавнего времени (до появления SGI Columbia supercomputer) занимавший первую позицию в списке Top500. 36 Терафлоп его производительности обеспечивают 32 тысячи основанных на базе улучшенного 32-разрядного ядра PowerPC 440 SoC-микропроцессоров с частотой 700 МГц. Посредством высокоскоростных шин чипы соединены с другими, образуя символический "гиперкуб". Теперь подсчитайте, какая производительность была бы достигнута, замени IBM старые процессоры Blue Gene/L на Cell?

Применение Cell в суперкомпьютерах позволит, по словам Кена Кутараги, поднять их производительность до 1 Петафлопа/с, тем самым, дав зелёный свет для появления настоящего ИИ (искусственного интеллекта).

Следующая область применения Cell - компьютеры Macintosh. Несмотря на конкуренцию между Apple и Sony, на выставке MacWorld 2005 на сцене со Стивом Джобсом (Steve Jobs) присутствовал сам президент японской корпорации Кунитаке Ано (Kunitake Ando). Джобс собирался: "поговорить о сотрудничестве между Apple и Sony для создания в этом году видео высокой чёткости", на что Андо ответил: "стратегически для Sony очень важна возможность работы с Apple, компанией, выпускающей отличные приложения, работающие со всеми продуктами Sony. И новое ПО, которое вы только что представили - просто сделайте это. На Mac-платформе".

Трудности IBM с выпуском мобильных процессоров PowerPC 970FX заставляют Apple, планирующую выпустить PowerBook G5 уже второй год, искать выход из сложившейся ситуации. И, вполне возможно, Cell, являясь, по сути, PowerPC-процессором с DSP-чипами в придачу, призван её разрешить. Присутствие же в PPE блока VMX при наличии восьми самостоятельных векторных процессоров SPE наводит на мысль о том, что STI хотела бы, чтобы Cell работал со "старым" ПО. А большая часть программ в мире, использующих VMX, являются MacOS-программами.

Кроме того, сама Apple разрабатывает технологии Core Image и Core Video (MacOS X Tiger), направленные на использование не AltiVec (VMX), а графического процессора видеокарты, что может говорить о желании компании оставить VMX в покое.

Существует три варианта развития событий. Первый - Apple будет продолжать использовать процессоры PowerPC 970FX/970MP. Второй - Cell будет применён в ноутбуках компании, тогда как PowerPC 970FX/970MP - в остальных продуктах. И, наконец, третий - Apple полностью перейдёт на Cell, используя его во всех своих компьютерах.

Правильный ответ даст нам конференция WWDC 2005 летом или MacWorld 2006 следующей зимой. Кроме Apple представители STI заявляют, что Cell будет поставляться всем производителям, желающим использовать его в своей продукции. Трио гигантов индустрии (STI) и "процессор нового поколения" заставляют задуматься многих. Например, известно, что компания Genesi, производящая материнские платы Pegasos, всерьёз задумывается об использовании Cell в своих будущих продуктах.

Но не только в полноценных компьютерах может использоваться "клетка". Многие говорят о возможности выпуска PCI/PCI-E-карт с установленным на них Cell. Работая параллельно с основным процессором под различными ОС (той же WindowsXP), он будет выполнять роль ускорителя (попросту - "числодробилки"). Правда, есть и те, кто предсказывает возможное игнорирование Microsoft нового процессора. Опасения их не беспочвенны, так как множество высокопроизводительных чипов, созданных небольшими компаниями и предназначенных в качестве "сопроцессора" к основному CPU, канули в свет именно из-за недостаточной программной поддержки. Но надежда, причём весьма большая, есть: благодаря намного большей распространённости Cell в мире написание необходимого ПО не должно заставить себя долго ждать.

Большой объём статьи не позволяет описать все устройства, где может применяться Cell. Но Вы можете сделать это самостоятельно: представьте себе технику начала XXI века, которой необходим сверхбыстрый, экономичный и дешёвый процессор. Cell как раз для неё.


"Размеры 0,09 мкм кристалла Cell"

Свет в конце туннеля

На сегодняшний день продажи PlayStation 2 составляют свыше 80 миллионов штук, что, само собой разумеется, означает продажу такого же количества Emotion Engine. Вследствие дальнейшего развития архитектуры Cell, цифра продаж PlayStation 3 может быть ещё выше. Для создания Sony и Toshiba десятков миллионов HDTV-телевизоров, Blu-Ray-рекордеров и прочей цифровой техники потребуется такое же количество Cell. Ориентация новой архитектуры на серверы и суперкомпьютеры подразумевает необходимость в большом количестве Cell для их создания/производства (вспомним про 32 тысячи процессоров в Blue Gene/L).

Если догадки экспертов окажутся верны, при использовании нового чипа Apple количество Cell в мире может достигнуть сотен миллионов штук. При этом "за кадром" осталась возможность "поштучной" продажи Cell на манер Pentium/Athlon, использование процессора в качестве DSP-чипа и т.д. В итоге можно сделать вывод: Cell будет намного более распространённым процессором, чем Emotion Engine. Пусть не в персональных компьютерах и серверах (побудем скептиками), но количество - есть количество.

И если в далёком 2000 году Кен Кутараги, как ребёнок, кричал, что выступит один против непобедимой на протяжении уже второго десятка лет Intel, то сегодня SCEI - уже не та "самонадеянная девчонка", затеявшая "дразниться со взрослыми". Теперь за её плечами не только Toshiba и IBM, но и другие компании. Расклад изменился. Осталось лишь дождаться и посмотреть, что же произойдёт при "вскрытии карт"?

Послесловие, или P.S

Для того чтобы статья не казалась чересчур радужной, позаимствуем для неё пару "чёрных пятен" с Солнца. Некоторые обозреватели опасаются того, что Cell, как и Emotion Engine, будет очень тяжело программировать. Обеспечение одновременной работы, по сути, девяти процессоров сведёт на "нет" все технические достоинства нового чипа. Однако IBM довольно долгое время работает над средствами разработки программ для Cell. На данный момент SDK представляет собой широко распространенный компилятор GCC, обогащённый макросами для копирования информации между SPE и памятью (как локальной самого SPE, так и оперативной). Кроме того, в состав пакета будут входить специальные алгоритмы, распределяющие задачи между SPE, и облегчающие тем самым перенос приложений из других архитектур/операционных систем. Разработка SDK продолжается, и к моменту выхода Cell должна быть полностью завершена.

Слышатся крики по поводу поддержки Cell рынком программного обеспечения и, в первую очередь, операционными системами. Скажем следующее: недавно IBM продала свой бизнес по производству ПК китайской компании Lenovo, сосредоточив все усилия на разработке Linux, и именно IBM занимается переносом этой ОС на Cell. Мягко говоря, довольно распространённая система, особенно среди программистов, да и новые программы к ней появляются, "как грибы после дождя". Перенос их на Cell не составит особых проблем (оптимизация под SPE потребует некоторых усилий, но это уже другой вопрос).

У Apple есть MacOS X, самая приветливая и лёгкая в использовании операционная система, которую, по словам самого Стива Джобса, с недавних пор производители ПК первого эшелона хотят видеть на своих компьютерах. Если Cell будет использован в продукции Apple, MacOS X (а вместе с ней и ПО ведущих компаний-разработчиков) будет перенесена на этот процессор .

В конце концов, даже сама Microsoft перенесла WindowsXP (или её родственницу) на PowerPC, чтобы использовать в своей Xbox 2. Авось "умелые руки" заставят её работать с "клеткой"?

Так что не всё так плохо, как сперва кажется. Перевернём страницу прошлого и, с надеждой на светлое будущее, будем смотреть вперёд, где Cell светит яркой звёздочкой.

Примечание: В статье использованы фотографии и блок-схемы с сайта pc.watch.impress.co.jp

 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
window-new
Soft
Hard
Тренды 🔥
WhatsApp научился расшифровывать голосовые сообщения в текст — русский язык поддерживается 30 мин.
Новая игра создателей The Invincible отправит в сердце ада выживать и спасать жизни — первый трейлер и подробности Dante’s Ring 2 ч.
Центр ФСБ по компьютерным инцидентам разорвал договор с Positive Technologies 3 ч.
Android упростит смену смартфона — авторизовываться в приложениях вручную больше не придётся 3 ч.
OpenAI обдумывает создание собственного интернет-браузера и поисковых систем для противостояния Google 4 ч.
Apple разрабатывает LLM Siri — она будет больше похожа на человека и выйдет с iOS 19 5 ч.
Новая статья: Верные спутники: 20+ полезных Telegram-ботов для путешественников 10 ч.
Итоги Golden Joystick Awards 2024 — Final Fantasy VII Rebirth и Helldivers 2 забрали больше всех наград, а Black Myth: Wukong стала игрой года 12 ч.
В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of Chernobyl и Call of Pripyat, а Clear Sky — на подходе 13 ч.
Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением про Лэндо Калриссиана 14 ч.
Kioxia подала заявку на IPO — третьего крупнейшего производителя флеш-памяти оценили всего в $4,85 млрд 19 мин.
«Джеймс Уэбб» первым в истории нашёл «зигзаг Эйнштейна» — уникальное искривление пространства-времени 21 мин.
Второй электромобиль Xiaomi выйдет через год после первого и будет заметно от него отличаться 2 ч.
Oracle объявила о доступности облачного ИИ-суперкомпьютера на базе NVIDIA H200 2 ч.
Positive Technologies получила сертификат ФСТЭК на межсетевой экран PT NGFW 3 ч.
Google снова уходит с рынка планшетов, сворачивая разработку Pixel Tablet 2 4 ч.
Представлен внешний SSD SanDisk Extreme на 8 Тбайт за $800 и скоростной SanDisk Extreme PRO с USB4 12 ч.
Представлен безбуферный SSD WD_Black SN7100 со скоростью до 7250 Мбайт/с и внешний SSD WD_Black C50 для Xbox 12 ч.
Новая статья: Обзор ноутбука ASUS Zenbook S 16 (UM5606W): Ryzen AI в естественной среде 12 ч.
Redmi показала флагманский смартфон K80 Pro и объявила дату его премьеры 14 ч.