Оригинал материала: https://3dnews.kz/636011

AMD Trinity для десктопа. Часть 2. Платформа и процессор

Платформа и процессоры Socket FM2

Несколько дней тому назад мы начали знакомство с процессорами семейства AMD Trinity, пришедшими, наконец, и в настольные системы. Уже опубликованная на сайте первая посвящённая им статья рассказывала исключительно о графической части этих подающих большие надежды продуктов. Мы пошли на небольшую сделку с AMD: обнародование первого обзора до даты официального анонса требовало от нас старательно обходить тему процессорного быстродействия. Логика производителя при этом такова: приходя к пользователям с обновкой, имеющей как сильные, так и слабые стороны, AMD хотела начать с самых хороших известий. Собственно, все их мы, по возможности, и осветили в предшествующем обзоре. Графика в процессорах Trinity по сравнению с прошлым поколением APU — Llano — ускорилась примерно на треть, в результате чего с точки зрения 3D-производительности новинки не только отправили в нокдаун самые современные интегрированные предложения конкурента, но и поставили вопрос об актуальности дискретных видеокарт стоимостью до $60-70.

Однако бесконечно оттягивать знакомство со всеми остальными сторонами своей новинки AMD, конечно, не может. И сегодня, в день официального анонса первой группы десктопных процессоров семейства AMD Trinity, мы предлагаем разобраться и с прочими аспектами их эксплуатации: с особенностями новой платформы Socket FM2, с производительностью x86-ядер и с разгонным потенциалом.

#Платформа Socket FM2

Первая связанная с вводом процессоров AMD Trinity в сегмент настольных компьютеров неприятность – это появление ещё одной новой платформы – Socket FM2 (кодовое имя Virgo). В результате по количеству разнообразных актуальных процессорных гнёзд AMD переплюнула даже Intel, которую традиционно было принято ругать за отсутствие тяги к унификации. Конечно, AMD объясняет появление еще одной платформы тем, что теперь у неё образовывается чёткая и понятная структура предложений. И это отчасти правда: для энтузиастов, использующих высокопроизводительные дискретные видеокарты, предназначается платформа Socket AM3+ и процессоры серии FX; для решений среднего уровня (как их представляет себе AMD) – новая платформа Socket FM2 и процессоры A-серии; а в компактные системы предполагается устанавливать платы с интегрированными на них процессорами E-серии.

Однако подобное деление существовало и раньше, а ввод Socket FM2 никакого дополнительного порядка в модельный ряд процессоров AMD не добавил. Напротив, притом что процессоры в Socket FM1- и Socket FM2-исполнении не совместимы ни на электрическом, ни на механическом уровне, а предназначенные для обоих сокетов продукты продаются в составе одних и тех же серий, всё это способно вызвать немалую путаницу. При этом совершенно непонятно, зачем вообще понадобилась замена Socket FM1 на Socket FM2. На примере Socket AM3+ хорошо видно, что процессоры AMD с различной микроархитектурой вполне могут сохранять совместимость с одной и той же платформой, а появление Trinity никаких принципиально новых возможностей, требующих наличия дополнительных контактов, в употребление не вводит. Количество каналов памяти и линий PCI Express, а также шина, связывающая APU с набором системной логики, остались теми же самыми. При этом оба процессорных гнезда – старое и новое – очень похожи друг на друга внешне и имеют почти одинаковое количество контактов – 905 и 904.

Слева– Socket FM1; справа – Socket FM2

Закономерно, что для процессоров, относящихся к поколению Trinity, подходят и старые чипсеты, которые использовались в Socket FM1-платформах. Поэтому большое количество недорогих материнских плат для Socket FM2 будет основываться на давно известных чипах AMD A75 или A55. Конечно, с выпуском новых процессоров AMD выпустила и свежий Fusion Controller Hub, A85X, но, по большому счёту, это – ещё одна вариация на ту же тему.

Отличия, действительно, малозначительные. По сравнению с прошлыми чипсетами, появившимися вместе с Socket FM1, набор логики AMD A85X предлагает дополнительные два порта SATA 6 Гбит/сек, доводя их общее количество до восьми, поддерживает режим RAID 5, а также открывает доступ к технологии CrossFireX. Актуальность этих нововведений кажется, мягко говоря, очень сомнительной, если вспомнить о том, что речь идёт о недорогой платформе для APU, которая в первую очередь предполагает использование интегрированной в процессор графики.

Чтобы как-то скрасить негативное впечатление, вызванное утратой совместимости между Socket FM1 и Socket FM2, AMD клятвенно обещает не менять платформу при следующей смене поколений APU.

#

Процессоры для Socket FM2

Внедряя новую платформу с несовместимым с предыдущими продуктами сокетом, компания AMD должна сразу обеспечить широкое разнообразие процессоров в Socket FM2-исполнении. Все такие процессоры основываются на дизайне Trinity. То есть объединяют в себе один или два двухъядерных модуля с микроархитектурой Piledriver и графическое ядро Devastator.

Фактически это «калька» с процессоров Trinity для мобильных компьютеров, представленных ранее в этом году. Отличия десктопных модификаций в том, что, не ограничивая себя жёсткими рамками ноутбучных тепловых пакетов, AMD смогла разогнать свои новые APU до более высоких частот. Иными словами, в процессорной части мы имеем немного улучшенный Bulldozer, а в графической – Cayman-подобное графическое ядро с высокоэффективной VLIW4-архитектурой. Но в сравнении с предыдущим APU компании, Llano, это можно расценить как большой шаг вперёд, так как там использовались компоненты, основанные на более ранних разработках. При этом AMD не внедрила новую производственную технологию, оставив производство Trinity на 32-нм процессе с SOI. В результате количество транзисторов в полупроводниковом кристалле новинок осталось близким с Llano, то есть всё улучшение производительности Trinity произошло путём интенсификации, без роста транзисторного бюджета.

Техпроцесс, нмЧисло транзисторов, млрдПлощадь ядра, мм2

AMD Llano

32

1,178

228

AMD Trinity

32

1,303

246

Intel Ivy Bridge

22

1,4

160

Intel Sandy Bridge

32

1,16

216

AMD разделяет представленные Trinity на четыре семейства: A10, A8, A6 и A4. A10 – это четырёхъядерники с максимальной версией графического ядра; A8 – APU с четырьмя ядрами, но с уменьшенным количеством потоковых процессоров в GPU, работающих на более низкой частоте; а A6 и A4 – двухъядерники, где ресурсы графического ядра по сравнению с A10 урезаны примерно вдвое. В предыдущей статье мы уже показывали таблицу с формальными характеристиками APU, входящих в модельный ряд Trinity, повторим её, дополнив официальными ценами, снова:

A10-5800KA10-5700A8-5600KA8-5500A6-5400KA4-5300

Встроенная графика

HD 7660D

HD 7660D

HD 7560D

HD 7560D

HD 7540D

HD 7480D

TDP, Вт

100

65

100

65

65

65

Число унифицированных шейдерных процессоров

384

384

256

256

192

128

Частота GPU, МГц

800

800

760

760

760

723

Количество ядер

4

4

4

4

2

2

Частота CPU, ГГц (базовая/турбо)

3,8/4,2

3,4/4,0

3,6/3,9

3,2/3,7

3,6/3,8

3,4/3,6

L2-кеш, Мбайт

4

4

4

4

1

1

Максимальная частота памяти

DDR3-1866

DDR3-1866

DDR3-1866

DDR3-1866

DDR3-1866

DDR3-1600

Цена

$122

$122

$101

$101

$67

$53

Как видим, цены очень демократичны. Процессоры A10 производитель противопоставляет младшим интеловским Core i3, представители же серий A8, A6 и A4, очевидно, будут конкурировать с Pentium и, возможно, даже с Celeron.

Однако, как оказалось, одними только A10, A8, A6 и A4 дело не ограничивается. В дополнение к ним AMD будет выпускать и Socket FM2-процессоры Trinity с деактивированным графическим ядром. Они будут продаваться под раскрученной торговой маркой Athlon. На данный момент есть информация о трёх таких моделях:

Athlon X4 750KAthlon X4 740Athlon X2 340

Встроенная графика

Нет

Нет

Нет

TDP, Вт

100

65

65

Количество ядер

4

4

2

Частота CPU, ГГц (базовая/турбо)

3,4/4,0

3,2/3,7

3,2/3,6

L2-кеш, Мбайт

4

4

1

Максимальная частота памяти

DDR3-1866

DDR3-1866

DDR3-1600

Цена

$81

$71

НД

Идея AMD представить Athlon X4 в Socket FM2-исполнении вызывает некоторое недоумение. Ведь это фактически аналоги четырёхъядерных FX, но их, в отличие от своих Socket AM3+ собратьев, впоследствии нельзя заменить на что-то более быстродействующее из-за позиционирования платформы. Трудно представить, на кого могут быть рассчитаны подобные предложения. Конечно, на данный момент эти Athlon X4 имеют более выгодную цену, чем почти такие же процессоры FX четырёхтысячной серии, но старые Athlon II X4 или Phenom II X4 для Socket AM3, основанные на микроархитектуре поколения Stars, в качестве бюджетного предложения выглядят ещё интереснее. Имея полноценные четыре ядра, а не пару «спрессованных» в модули двухъядерных сборок, они не уступают базирующимся на дизайне Trinity новым Athlon X4 по производительности и к тому же работают в той же платформе, что и шестиядерные или восьмиядерные Bulldozer/Piledriver, то есть подразумевают широкие возможности для последующей модернизации системы.

Пример Socket FM2-платы: ASUS F2A85-V Pro

Компания AMD поставила перед производителями материнских плат достаточно непростую задачу. С одной стороны, платы под Socket FM2 должны иметь достаточно неплохую функциональность: на это недвусмысленно намекают заложенные в новый набор логики AMD A85X возможности, а также имеющийся в Trinity оверклокерский потенциал. Однако с другой – процессоры в Socket FM2-исполнении стоят не дороже $130, что ставит востребованность плат, не попадающих под понятие бюджетных и обладающих какими-то возможностями шире базовых, под вопрос. Очевидно, что искать зыбкую грань между качеством исполнения, богатством характеристик и невысокой ценой производители материнских плат будут по-разному, так что различных реализаций платформы Socket FM2 на рынке ожидается превеликое множество.

Так, уже на этапе подготовки этой статьи мы столкнулись с тем, что предоставить свои воплощения платформы Virgo нам были готовы сразу несколько производителей. Но для проведения тестирования мы выбрали материнскую плату компании ASUS – F2A85-V Pro.

Данная плата – отличная иллюстрация всего того, что было сказано про баланс возможностей и цены, ведь ASUS F2A85-V Pro – это самая старшая Socket FM2-модель ASUS, но при этом мы не видим типичного для других платформ буйства фантазии инженеров компании. Характеристики достаточно сдержанны: на плате почти нет дополнительных контроллеров, а схема питания и система охлаждения имеют не слишком навороченный дизайн.

В подтверждение этих слов предлагаем ознакомиться с официальными спецификациями платы:

ASUS F2A85-V Pro

Процессорный разъём

Socket FM2

Набор логики

AMD A85X FCH(Hudson D4)

Память

4 x DDR3 DIMM

Двухканальная DDR3-1067/1333/1600/1866/2133/2400 SDRAM
Максимальный объём – 64 Гбайт

Слоты расширения

2 x PCI Express 2.0 x16 (логически - 1x16 или 2x8)

1 x PCI Express 2.0 x16 (логически x4)

2 x PCI Express 2.0 x1

Звуковой контроллер

8-канальный HD audio кодек Realtek ALC892

Сетевые контроллеры

Гигабитный сетевой контроллер Realtek 8111F

Контроллер Firewire

Нет

Дополнительные контроллеры накопителей

Нет

Дополнительный USB 3.0 контроллер

ASmedia USB 3.0

Количество и тип вентиляторов

5, из них четырёхконтактных – 5

Форм-фактор

ATX, 305x244 мм

Дополнительные возможности и особенности

– переключатель TPU (TurboV Processing Unit)

– переключатель EPU (Energy Processing Unit)

– кнопки MemOk и DirectKey

– функция USB BIOS Flashback

Внутренние порты

USB 2.0

4 (дополнительно 8 портов)

USB 3.0

1 (дополнительно 2 порта)

IEEE-1394

Нет

Serial Port

1

Parallel Port

Нет

Floppy

Нет

Ultra-ATA 133

Нет

SATA 3 Гбит/с

Нет

SATA 6 Гбит/с

7

Внешние порты

PS/2

1

USB 2.0

2

USB 3.0

4

IEEE-1394

Нет

RJ-45

1

eSATA

1

Аналоговое аудио

6

Цифровое аудио

Оптический S/PDIF-выход

Видео

HDMI, DVI, RGB, DisplayPort

Список получился достаточно скудным. Если вы представляете себе, как формируется линейка продуктов ASUS, то прекрасно понимаете, что ASUS F2A85-V Pro не дотягивает даже до уровня «Pro» по меркам материнок для процессоров Intel. Ну а между возможностями ASUS F2A85-V Pro и старших плат для LGA1155, относящихся к сериям Deluxe или Premium, вообще целая пропасть. Всё это, конечно, результат позиционирования платформы Socket FM2. В итоге ASUS F2A85-V Pro должна стоить не дороже $120: более дорогой продукт вряд ли бы пользовался популярностью у покупателей.

Впрочем, стремление к снижению цены, к счастью, совершенно не сказалось на качестве. По опыту тестирования можно сказать, что ASUS F2A85-V Pro – вполне добротная материнка, во многом благодаря которой наше знакомство с платформой Socket FM2 прошло очень гладко.

Более того, на базе ASUS F2A85-V Pro вполне можно построить настолько мощный компьютер, насколько это могут позволить процессоры семейства AMD Trinity. В части возможностей расширения к плате ASUS нельзя предъявить никаких претензий: на ней даже есть три слота PCI Express x16, которые можно занять видеокартами: одной, двумя или тремя. Правда, следует иметь в виду, что в режиме x16 первый (синий) слот работает только в том случае, если свободен его белый напарник. В CrossFireX-конфигурациях первые два слота переходят в режим x8, а третий слот чёрного цвета всегда логически работает как x4. При этом шина PCI Express функционирует лишь в режиме 2.0, но ASUS тут ни при чём, реализация PCI Express 3.0-контроллера в Trinity почему-то оказалась инженерам AMD неподвластна.

Упор в конструкции ASUS F2A85-V Pro сделан не только с прицелом на дискретные видеокарты. Если вы собираетесь использовать эту плату со встроенным в процессор графическим ядром, взгляните на её заднюю панель – вам понравится. Там представлены все четыре разновидности портов для соединения с дисплеями: аналоговый D-Sub, поддерживающий режимы до 1920x1600@60Hz; Dual-Link DVI-D; HDMI; а также высокоскоростной Display Port с поддержкой разрешений до 4096x2160@60Hz. Следует лишь иметь в виду, что процессоры Trinity способны только на три одновременных подключения мониторов, так что на рассматриваемой плате выходы DVI-D и HDMI нельзя задействовать синхронно.

Среди плюсов материнской платы ASUS F2A85-V Pro следует отметить и фирменный цифровой дизайн схемы питания процессора. Он позволяет с высокой точностью устанавливать напряжения для всех блоков APU, а кроме того, поддерживает дозированное противодействие падению напряжения под нагрузкой. В целом же конвертер питания состоит из шести каналов, отведённых на вычислительную часть APU, и двух каналов для графического ядра. Конечно, на фоне многоканальных преобразователей, применяемых в LGA1155-материнках, это не производит особого впечатления. Но благодаря тому, что в схеме питания применены высококачественные электронные компоненты, она имеет очень хорошую эффективность, а в процессе работы под нагрузкой её нагрев незначителен. Поэтому-то к схеме охлаждения, применённой на ASUS F2A85-V Pro, у нас никаких претензий нет. Да, она простовата, к тому же для крепления радиаторов на силовых элементах использованы не очень надёжные подпружиненные защёлки, но со своей основной функцией она справляется хорошо.

Питание слотов памяти на ASUS F2A85-V Pro осуществляется посредством выделенного двухканального контроллера, а подключение слотов DIMM к процессорному гнезду выполнено по фирменному дизайну с T-топологией, выравнивающей длину проводников в различных каналах. Это позволяет добиваться лучшей стабильности работы при использовании высокочастотных модулей DDR3-памяти, что очень актуально для платформы Socket FM2, так как производительность встроенной в процессор графики сильно зависит от скорости работы DDR3 SDRAM.

Платы ASUS традиционно нравились нам своим вниманием к различного рода мелочам. У рассматриваемой ASUS F2A85-V Pro всяких интересностей не так много, но в целом её компоновка заслуживает положительного отзыва. По крайней мере, никаких проблем при сборке системы не возникает. Да, энтузиастам на этой плате будет недоставать POST-контроллера, удобных распаянных кнопок включения, сброса и очистки настроек BIOS и, возможно, точек для контроля напряжений мультиметром. Всё это – атрибуты дорогих плат, к числу которых продукт для Socket FM2 относиться не может по определению. Однако на F2A85-V Pro нашлось место для функциональности немного другого рода: плата оборудована кнопками [MemOk!] для устранения проблем с настройками памяти, [DirectKey] для автоматического входа в интерфейс BIOS и [BIOS Flashback] для автономной заливки прошивок.

К графическому же интерфейсу конфигурирования UEFI BIOS претензий не может быть никаких. Он типичен для всех плат ASUS, а значит, многофункционален, хорошо отлажен и удобен в использовании. Базовый раздел с настройками основных узлов системы – процессора и памяти – выглядит следующим образом:

Пользователи получают в свои руки самые широкие возможности, позволяющие отнести F2A85-V Pro в том числе и к числу плат, хорошо подходящих для оверклокинга. Изменять можно как базовую частоту (с шагом 1 МГц), так и все процессорные множители. Имея в распоряжении разблокированный процессор с суффиксом K в названии модели, мы получаем доступ к конфигурированию множителей для частоты вычислительных ядер процессора, его объединённого северного моста и графического ядра. Память же допускается разгонять с любым процессором. Доступны и работоспособны режимы от DDR3-800 до DDR3-2400 с 266-МГц дискретностью.

К числу изменяемых параметров относится и полный набор таймингов памяти. Причём при настройке подсистемы памяти платой поддерживаются не только редко встречающиеся профили AMD Memory Profile, но и повсеместно используемые интеловские XMP.

Нет никаких ограничений в части выбора напряжений, отличающихся от положенных спецификациями. Питание процессора можно «задрать» аж до 1,9 В, до 2,1 В увеличивается и напряжение на слотах DIMM. Немаловажно, что при этом допустима установка величин ниже номинальных значений – это позволяет эксплуатировать модули памяти стандарта DDR3L или искусственно снижать потребление и тепловыделение платформы.

Неплохо выглядят возможности материнки и в части аппаратного мониторинга. Для контроля доступны две температуры – общесистемная и процессора (причём, учитывая непрекращающийся бардак с внутрипроцессорными датчиками в CPU компании AMD, плата использует собственный), а также обороты всех пяти вентиляторов, которые можно подключить к F2A85-V Pro.

Скоростью всех этих вентиляторов можно управлять как через BIOS, так и посредством прилагаемого к плате программного обеспечения. Однако следует иметь в виду, что регулировка возможна лишь при четырёхконтактном подключении.

Микроархитектура Piledriver: правда ли лучше Bulldozer?

В прошлом обзоре Trinity мы подробно знакомились с архитектурой графического ядра Devastator и пришли к выводу, что произошедшая смена его архитектуры на VLIW4 – положительный шаг. Теперь настало время поговорить про вычислительные ядра. По сравнению с Llano изменения в них тоже крупномасштабные. Вместо x86-ядер Husky с микроархитектурой Stars теперь используются модули с микроархитектурой Piledriver – очередная итерация в развитии Bulldozer. Как известно, при внедрении Bulldozer процессорная команда AMD сменила приоритеты. Эта микроархитектура по сравнению со Stars уменьшила количество исполняемых за такт инструкций, но зато позволила развивать более высокие тактовые частоты. Однако достигнутым эффектом остались довольны далеко не все, поэтому спустя три квартала с момента появления на рынке первых версий Bulldozer, AMD подготовила обновление микроархитектуры – своеобразную работу над ошибками – Piledriver.

В процессорах Trinity как раз и используются ядра с дизайном Piledriver, и это – первое появление данной микроархитектуры на публике. AMD считает, что сделанных усовершенствований вполне достаточно для того, чтобы Trinity работали заметно быстрее процессоров Llano. Означает ли это, что новая версия вычислительных ядер позволит продукции AMD полноценно конкурировать с интеловскими предложениями? Актуальность этого вопроса связана в первую очередь с тем, что буквально через три-четыре недели будут представлены свежие процессоры серии FX, использующие аналогичные ядра Piledriver. И если про Trinity ещё можно говорить, что их производительность в традиционных задачах «вполне достаточна», скрывая реальный уровень x86-быстродействия за высокой скоростью графического ядра, то с процессорами FX этот фокус не пройдёт. Поэтому начать знакомство с Piledriver мы решили с выяснения превосходства этой версии микроархитектуры над «классическим» Bulldozer.

Впрочем, не стоит возлагать на Piledriver какие-то особенные ожидания. Структурно эта микроархитектура полностью повторяет Bulldozer, то есть основывается на использовании условно-двухъядерных модулей, в которых имеется по два набора целочисленных исполнительных устройств, но часть ресурсов представлена лишь в единственном на два ядра экземпляре. К числу таких разделяемых компонентов относится кеш-память, блок выборки инструкций, их декодер и блок операций с плавающей точкой. В результате, модуль может обрабатывать два потока одновременно, но его пиковая производительность ограничена пропускной способностью объединённого декодера, способного декодировать не более четырёх инструкций за такт на два ядра. Для сравнения: в интеловских процессорах семейства Core декодер имеет сравнимый темп работы, но там он для каждого ядра индивидуален. Это значит, что число обрабатываемых за такт инструкций в Piledriver серьёзно увеличиться не могло. Качественные изменения произойдут только в следующем поколении микроархитектуры, Steamroller: предполагается, что в будущем AMD снабдит собственным декодером инструкций каждое из двух ядер в модуле. Пока же все улучшения Piledriver основываются на оптимизациях в алгоритме работы отдельных внутренних блоков, но не затрагивают дизайн в целом.

AMD к основным усовершенствованиям, выполненным в Piledriver, относит:

  • Улучшение точности предсказания переходов за счёт внедрения гибридного двухуровневого предсказателя;
  • Расширение набора инструкций трёхоперандными 128- и 256-битными инструкциями FMA3 (fused multiply–add) и инструкциями из подмножества SSE5 – преобразованием вещественных данных с половинной точностью F16C;
  • Оптимизацию работы планировщиков;
  • Ускорение выполнения операций деления за счет переделки соответствующего исполнительного устройства;
  • Увеличение L1 TLB;
  • Улучшение алгоритмов предварительной выборки данных в L1- и L2-кеши, позволяющих работать с паттернами переменной длины, в том числе и находящимися на границах страниц;
  • Увеличение эффективности L2-кеша за счёт более агрессивного его освобождения от неиспользуемых данных, ошибочно загруженных вследствие работы алгоритмов предварительной выборки.

Темп декодирования инструкций все перечисленные нововведения нарастить не в состоянии, но, тем не менее, определённое ускорение они обеспечить могут. Для того чтобы представить себе, насколько микроархитектура Piledriver эффективнее своей предшественницы, мы провели небольшое сравнение на практических бенчмарках. В нём один на один сошлись четырёхъядерный процессор A10-5800K с микроархитектурой Piledriver и четырёхъядерный процессор FX-4170 с микроархитектурой Bulldozer. Для наглядности сравнения оба процессора были настроены на работу при фиксированной частоте 4,0 ГГц, а технология Turbo Core была выключена. Заметим, что в отличие от A10-5800K, имеющего двухуровневую кеш-память, FX-4170 снабжён 8-мегабайтным L3-кешем, который никак нельзя деактивировать. Поэтому просто будем иметь в виду, что носитель микроархитектуры Bulldozer выступал с небольшим гандикапом. В обеих сравниваемых системах была установлена память DDR3-1867 с таймингами 9-11-9-27-1T и видеокарта NVIDIA GeForce GTX 680.

В первую очередь взглянем на скорость работы подсистемы памяти, измеренную тестом Cache & Memory Benchmark из пакета Aida64.

Bulldozer

Trinity

У процессора A10-5800K, как видим, дела со скоростью работы с данными обстоят не самым лучшим образом. Bulldozer обеспечивает более высокие практические пропускные способности и более низкие латентности. Но дело тут, конечно, не в каких-то недостатках микроархитектуры Piledriver. Просто мы сравниваем процессоры, работающие в разных платформах. Особенность же Trinity в том, что их дизайн оптимизирован в первую очередь под совместное использование памяти графическим и вычислительными ядрами. Более сложные алгоритмы работы контроллера DDR3 SDRAM, учитывающие необходимость дополнительного арбитража запросов, вносят определённые задержки, и как раз из-за этого Trinity и уступает Bulldozer. К сожалению, даже в том случае, когда в Socket FM2-системе установлена дискретная графическая карта, а встроенное в APU графическое ядро не используется, скорость работы x86-ядер Trinity с системной памятью остаётся на том же недостаточно высоком уровне.

Давайте посмотрим теперь, как обстоит дело с вычислительной производительностью.

Piledriver
4 ядра, 4,0 ГГц

Bulldozer
4 ядра, 4,0 ГГц

Преимущество Piledriver

PCMark 7

4309

4147

+3,9%

PCMark 7, Computation

3462

3228

+7,2%

3DMark 11, Physics

4176

4105

+1,7%

Fritz Chess Benchmark

7009

7064

-0,8%

TrueCrypt 7.1, AES-Twofish-Serpent, MB/s

127

122

+4,1%

7-zip 9.20 Benchmark, MIPS

11533

11660

-1,1%

WinRAR 4.2 Benchmark, KB/s

4148

4594

-9,7%

x264 FHD Benchmark 1.0.1, fps

11,47

10,91

+5,1%

SVPmark 3.0.2, Real-life/FHD

1019

989

+3,0%

Cinebench R11.5, CPU

3,35

3,31

+1,2%

FRYbench

653,12

664,72

-1,7%

Crysis 2, 1280x800 DX11 UHQ

75,1

73,5

+2,2%

Far Cry 2, 1280x800 UHQ

95,74

91,86

+4,2%

Metro 2033, 1280x800 DX11 UHQ

58,4

58,6

-0,3%

F1 2012, 1280x800 UHQ

67,4

64,6

+4,3%

Borderlands 2, 1280x800 UHD

63,1

67,2

-6,1%

Как можно судить по результатам, микроархитектура Piledriver с практической точки зрения превосходит Bulldozer незначительно. Максимальный наблюдаемый прирост скорости достигает лишь 7 процентов, а в среднем превосходство нового дизайна выражается примерно в полуторапроцентном преимуществе в бенчмарках. Впрочем, из внимания не следует упускать отсутствие в протестированном нами варианте Piledriver кеш-памяти третьего уровня, а также его более медленный контроллер памяти. Именно из-за этого в некоторых тестах, интенсивно работающих с большими объёмами данных, наблюдается не увеличение, а падение производительности. Однако мы не склонны полагать, что с появлением процессоров с новой микроархитектурой в Socket AM3+ исполнении ситуация серьёзно изменится. Заметному увеличению числа обрабатываемых за такт инструкций взяться попросту неоткуда, так что 5-10 процентов прироста в удельной производительности – это, пожалуй, тот максимум, на который могут рассчитывать поклонники продукции AMD и при предстоящем появлении на рынке процессоров с кодовым именем Vishera.

Тестирование. Выводы

#Как мы тестировали

Прошлое тестирование Trinity было целиком посвящено исследованию их графического ядра. Думается, на его счёт никаких вопросов не осталось: производительность предложенного AMD интегрированного видеоускорителя очень хороша. Но на практике не менее важна и остальная часть гибридного процессора – его вычислительные ядра. Эта тема и станет центральной для нашего второго тестирования. Соответственно, основная часть бенчмарков, с результатами которых мы предлагаем ознакомиться далее, выполнена с внешней графической картой, и встроенный в процессоры Trinity GPU на них, естественно, никакого влияния не оказывает. Иными словами, мы посмотрим на то, как x86-ядра с новой микроархитектурой Piledriver могут проявить себя при типичных задачах.

В реальном мире нам придётся столкнуться с серийными продуктами, которые не просто используют различные микроархитектуры, но и работают на разной тактовой частоте, в разных платформах и используют разнообразные технологии авторазгона. Поэтому подбирать участников для тестирования приходится исходя не столько из характеристик процессоров, сколько из их рыночного позиционирования.

Компания AMD предоставила нам для опытов процессор A10-5800K это старший представитель десктопной линейки Trinity. При этом AMD преподносит свою линейку A10 как альтернативу интеловскому семейству Core i3, на что указывают и установленные на них цены. Следовательно, основными соперниками для главного героя этого обзора должны стать двухъядерники Intel, причём как поколения Ivy Bridge, так и остающегося популярным предыдущего поколения Sandy Bridge. Мы выбрали две наиболее близкие к A10-5800K по цене модели: Core i3-3220 и Core i3-2130. Кроме этого, в тестах приняли участие и продукты AMD, представляющие другие платформы. Естественно, Trinty был сопоставлен со своим предшественником, Socket FM1-процессором A8-3870K с дизайном Llano. А также с двумя моделями, живущими в Socket AM3+ инфраструктуре. Во-первых, с четырёхъядерным Bulldozer FX-4170, который эквивалентен A10-5800K по цене. А, во-вторых, со старинным носителем микроархитектуры K10, процессором Phenom II X4 970 образца середины 2010 года, который не только всё ещё продаётся, но и сравним с A10-5800K по цене.

В результате в тестах были задействованы следующие аппаратные и программные компоненты:

  • Процессоры:
    • AMD A10-5800K (Trinity, 4 ядра, 3,8-4,2 ГГц, 4 Мбайт L2);
    • AMD A8-3870K (Llano, 4 ядра, 3,0 ГГц, 4 Мбайт L2);
    • AMD FX-4170 (Zambezi, 4 ядра, 4,2-4,4 ГГц, 4 Мбайт L2 + 8 Мбайт L3);
    • AMD Phenom II X4 (Deneb, 4 ядра, 3,5 ГГц, 2 Мбайт L2 + 6 Мбайт L3);
    • Intel Core i3-2130 (Sandy Bridge, 2 ядра + HT, 3,4 ГГц, 0,5 Мбайт L2 + 3 Мбайт L3).
    • Intel Core i3-3220 (Ivy Bridge, 2 ядра + HT, 3,3 ГГц, 0,5 Мбайт L2 + 3 Мбайт L3).
  • Материнские платы:
    • ASUS Crosshair V Formula (Socket AM3+, AMD 990FX + SB950);
    • ASUS P8Z77-V Deluxe (LGA1155, Intel Z77 Express);
    • ASUS F2A85-V Pro (Socket FM2, AMD A85);
    • Gigabyte GA-A75-UD4H (Socket FM1, AMD A75).
  • Видеокарта: NVIDIA GeForce GTX 680 (2 Гбайт/256-бит GDDR5, 1006/6008 МГц).
  • Память: 2 x 4 Гбайт, DDR3-1866 SDRAM, 9-11-9-27 (Kingston KHX1866C9D3K2/8GX).
  • Дисковая подсистема: Crucial m4 256 Гбайт (CT256M4SSD2).
  • Блок питания: Corsair AX1200i (80 Plus Platinum, 1200 Вт).
  • Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
  • Драйверы:
    • AMD Catalyst 12.8 Driver;
    • AMD Chipset Driver 12.8;
    • Intel Chipset Driver 9.3.0.1019;
    • Intel Graphics Media Accelerator Driver 15.26.12.2761;
    • Intel Management Engine Driver 8.1.0.1248;
    • Intel Rapid Storage Technology 11.2.0.1006;
    • NVIDIA GeForce 306.23 Driver.

При тестировании платформы, основанной на процессоре AMD A10-5800K, патчи операционной системы KB2645594 и KB2646060, адаптирующие поведение планировщика под микроархитектуры Bulldozer и Piledriver, были установлены.

Следует заметить, что вся гибридность процессоров Trinity (это же относится и к интеловским предложениям) при использовании дискретного графического ускорителя исчезает. В такой конфигурации встроенный в процессор GPU отключается, так что задействование его мощностей посредством OpenCL или DirectCompute становится невозможным. Впрочем, в приложениях, способных работать с этими интерфейсами, доступными становятся вычислительные ресурсы дискретной видеокарты.

#Результаты вычислительных тестов

Всё в этом мире относительно, так что полученные результаты можно трактовать двояко. С одной стороны, хочется отметить, что выполненный компанией AMD перевод APU с микроархитектуры Stars на более современную Piledriver – это шаг, давший положительный эффект. Производительность Trinity по сравнению с Llano подросла примерно на 8 процентов: по крайней мере на такую величину A10-5800K в среднем обгоняет A8-3870K. Конечно, от этого правила есть и отклонения как в ту, так и в другую сторону, но это уже – издержки принципиальных различий микроархитектур.

С другой стороны, чтобы сделать процессор Trinity немного быстрее Llano, AMD пришлось установить ему почти в полтора раза более высокую частоту. То есть проведённое сравнение явно указывает и на недостатки ядер Piledriver. А ещё сильнее подчёркивает их то, что A10-5800K проигрывает Phenom II X4 970. Очевидно, что число исполняемых за такт инструкций в Piledriver тоже находится на низком уровне, как и в Bulldozer. Собственно, FX-4170 даже немного обгоняет A10-5800K, хотя в целом он имеет примерно такие же характеристики, превосходя Socket FM2-процессор лишь по тактовой частоте (незначительно) и наличию кеш-памяти третьего уровня.

Если же сравнивать A10-5800K с процессорами Intel, то можно сказать, что AMD оценила свою новинку весьма трезво. Средневзвешенно, в вычислительных бенчмарках старший Trinity работает по скорости примерно так же, как и представители семейства Core i3. Правда, не следует забывать, что Core i3 – это двухъядерные процессоры, в то время как A10-5800K считается четырёхъядерником. Хотя, конечно, ничего удивительного в этом нет. То, что два современных ядра AMD примерно равны по быстродействию одному интеловскому, мы говорили ещё при тестировании Bulldozer.

#Результаты игровых тестов

В данном случае мы исследуем производительность x86-ядер в играх в отрыве от встроенного в гибридные процессоры графического ядра. Поэтому тесты выполнялись со внешней графической картой и в разрешении 1280х800 с высокими настройками качества. Такой подход позволяет оценить именно процессорную игровую мощь, не ограниченную возможностями каких бы то ни было видеоускорителей.

А вот тут представитель семейства Trinity смотрится значительно хуже. Нет, Llano на положенные 8 процентов он обгоняет. Вот только это не даёт ему ни малейшего шанса приблизиться к интеловским Core i3, которые при игровой нагрузке способны показать заметно более высокие результаты. Можно было бы возразить, что тут мы поместили Trinity в нетипичную среду и их в первую очередь предполагается использовать с интегрированной графикой, для которой скорости x86-ядер будет заведомо хватать. Но мы так не считаем. AMD явно рассчитывает на использование своих новых APU в том числе и с дискретной графикой. Иначе зачем было выпускать набор логики A85X с поддержкой CrossFireX и дополнять модельный ряд процессорами с аппаратно деактивированной графикой?

В общем, для геймерской системы с достаточно производительным видеоускорителем платформа Socket FM2 подходит, как мы видим, плохо. Дело тут, в первую очередь, в низкой производительности ядер Piledriver в играх. Но также напомним и ещё один момент: процессорами Trinity не поддерживается шина PCI Express 3.0.

#Разгон

Платформа Socket FM1 была не очень-то дружественна к оверклокингу. Llano имели невысокий разгонный потенциал, повышение частоты базового тактового генератора нередко приводило к нестабильности, диапазон доступных делителей для частоты памяти был достаточно узким. Да и вообще, AMD не особенно-то и приветствовала разгон своих APU прошлого поколения, не адаптировав для них даже фирменную утилиту Overdrive. Но с выпуском новой платформы Socket FM2 и предназначенных для неё APU отношение у AMD существенно изменилось. Теперь оверклокерские возможности – это официально обозначенная сильная сторона гибридных процессоров. И с этой точки зрения представители семейства Trinity безоговорочно превосходят конкурирующие Core i3, которые вообще разгону не подвержены.

Дружественность платформы Socket FM2 к разгону проявляется во многом. В частности, в том, что среди процессоров для неё немало моделей с разблокированными множителями – они обозначаются литерой «K» в конце своего номера. Но и при разгоне частотой базового тактового генератора никаких особенных препятствий возникать не должно. В большинстве случаев её можно беспрепятственно поднимать на величину до 80% выше номинала без нарушения стабильного функционирования системы. Учитывать при этом надо лишь два момента: серьёзное изменение частоты тактового генератора приводит к неработоспособности D-Sub-вывода на материнских платах; а чтобы избежать сбоев в работе дисковой подсистемы в режиме AHCI, необходимо пользоваться драйвером AMD, а не штатным микрософтовским драйвером из комплекта поставки операционной системы. К этому необходимо добавить доступность широкого набора делителей для установки частоты памяти и то, что многострадальная утилита Overdrive наконец-то заработала — правда, со скрипом — и с гибридными процессорами.

Все перечисленные оверклокерские улучшения относятся к числу теоретических. На практике же энтузиасты, естественно, ожидают от Trinity увеличения разгонного потенциала, ведь в основе этих процессоров лежит микроархитектура Piledriver – наследница Bulldozer, способная к работе на достаточно высоких частотах.

Однако при практической проверке никакие особенно выдающиеся результаты разгона получить не удалось. Да, Trinity, как и Bulldozer, очень чутко реагирует на увеличение напряжения питания на вычислительных ядрах, отодвигая предел стабильной работоспособности каждый раз с его повышением. Однако серьёзно возрастает и тепловыделение, требуя неординарных методов охлаждения. При этом следить за допустимостью температурного режима практически невозможно. Если и раньше-то встроенные в ядра процессоров AMD термодатчики не отличались особенной аккуратностью в показаниях, то в Trinity они просто чудовищны. Например, в моменты простоя процессора они запросто могут выдавать температуру, близкую к нулевой, а демонстрация под нагрузкой температуры ниже комнатной для них – обычное дело. Поэтому обращаться приходится к показаниям датчика, реализованного на материнской плате, а он чрезмерно инерционен.

Как бы то ни было, в тестовой системе на базе материнской платы ASUS F2A85-V Pro, где процессор охлаждался воздушным кулером NZXT Havik 140, имеющийся A10-5800K удалось разогнать до 4,5 ГГц. Причём это – не предельный разгон, а частота, пригодная для использования в режиме 24х7. Для обеспечения стабильной работоспособности в таком состоянии напряжение питания процессорных ядер было увеличено на 0,15 В свыше штатного для нашего экземпляра CPU значения – до 1,5 В.

Таким образом, с точки зрения результирующих частот разгон вычислительных ядер Trinity похож на разгон Bulldozer. Схожая микроархитектура выливается и в схожий частотный потенциал. Принципиально иная платформа тут никаких существенных корректив не вносит.

Что же отличает Trinity, так это возможность разгона не только его вычислительной части, но и графического ядра. Причём с практической точки зрения – это вполне логичный для интегрированных систем сценарий. Встроенный в Trinity видеоускоритель подобен по производительности дискретной видеокарте Radeon HD 6570 и в целом далёк от пределов мечтаний. Поэтому многие продвинутые пользователи, которые купят новые Socket FM2-процессоры, вполне вероятно, захотят увеличить скорость графики через разгон. И это, действительно, способно принести определённые дивиденды. Нужно лишь помнить о том, что серьёзного увеличения 3D-производительности встроенного в Trinity графического ядра можно достичь и разгоном оперативной памяти, так что параллельно с увеличением частоты работы графики не следует пренебрегать и этой возможностью.

В процессе наших экспериментов нам удалось добиться стабильной работоспособности встроенного в A10-5800K графического ускорителя Radeon HD 7660D на частоте 1085 МГц, которая превышает номинальную величину на 285 МГц. Заметим, что для такого или подобного разгона графики требуется повышать соответствующее напряжение питания, которое в BIOS материнских плат обычно обозначается как напряжение встроенного в процессор северного моста, но по факту применяется и к графическому ядру. В нашем случае оно повышалось с номинальных 1,175 до 1,4 В.

Параллельно разгону графического ядра мы повысили до DDR3-2400 и частоту памяти. Это – предельный для процессоров Trinity режим при использовании номинальной частоты базового тактового генератора. Эксперименты показали, что к его стабильности нет никаких претензий, приходится лишь переводить параметр Command Rate в значение 2T.

Итоговый разгон проиллюстрируем скриншотом.

Разгон вычислительных ядер, графики и памяти позволил в тесте 3DMark'11 перевалить через границу 2000 очков (с профилем Performance). Таким образом, по сравнению с номинальным для A10-5800K состоянием графическая производительность возросла примерно на 25 процентов и достигла уровня дискретного видеоускорителя Radeon HD 6670. Неплохое достижение, не правда ли?

Разгон же вычислительной части сам по себе, похоже, не имеет столь же выраженной практической ценности. Сравнение показателей Physix Score говорит о том, что увеличение тактовой частоты A10-5800K до 4,5 ГГц приводит лишь к 11-процентному росту вычислительного быстродействия. AMD уже установила для процессоров Trinity высокие номинальные частоты, так что серьёзный прирост скорости при разгоне можно получить, разве только применяя экстремальные методы охлаждения. Например, по мнению производителя, с использованием жидкого азота должны быть достижимы частоты порядка 6,5 ГГц, но уже существуют свидетельства и о покорении процессором A10-5800K частоты 7,3 ГГц.

#Выводы

В своё время мы не слишком оптимистично отнеслись к попыткам AMD вывести на рынок десктопных продуктов свои первые гибридные процессоры Llano. Они, конечно, были по-своему интересны, но скорее с теоретических позиций. В реальности же представить тот класс настольных систем, в котором они могли бы занять господствующее положение, было достаточно трудно.

Зато с Trinity – совсем другое дело. Их графическая производительность не просто высока по меркам интегрированных решений, она позволяет запускать 3D-игры в FullHD-разрешении. А это – настоящий качественный скачок, означающий, что Trinity может служить основой настольной игровой системы начального уровня без всяких оговорок. Неплохо, как мы убедились, обстоят дела и с вычислительной производительностью x86-ядер. Старшие представители этого семейства во многих случаях обеспечивают примерно такое же быстродействие, как процессоры Core i3. То есть предлагают вполне достаточную мощность для современных массовых систем.

Просуммировав эти оба факта, получаем, что платформа Socket FM2 и процессоры Trinity имеют шанс отвоевать себе немалое место в домашних системах. Конечно, энтузиасты новых технологий и заядлые геймеры вряд ли одобрят подобное решение. Но для среднестатистических пользователей, для которых игры составляют лишь небольшую часть активности наряду с Интернетом, потреблением мультимедийного контента и, возможно, какими-то несложными специфическими задачами, Trinity выглядит отличным выбором. В этом случае платформа Socket FM2 позволяет не только сэкономить средства, но и получить в итоге компактный, тихий и экономичный компьютер (в том числе и SFF или HTPC). Правда, для полноценной реализации такой возможности AMD не должна ограничивать поставки процессоров с 65-ваттным тепловым пакетом, как она почему-то поступала с Llano, а производители плат должны позаботиться о выпуске приемлемых по цене миниатюрных материнок.

При этом следует иметь в виду, что, как показали наши тесты, процессоры Trinity привлекательны лишь до тех пор, пока в систему с ними не ставится дискретная видеокарта. Дело в том, что в игровых приложениях скорость x86-ядер Piledriver на фоне конкурирующих предложений остаётся, мягко говоря, посредственной. И если при задействовании встроенного видеоядра это не столь важно, так как быстродействие игр в этом случае всё равно упирается в 3D-ускоритель и не ограничивается вычислительными ресурсами, то при использовании более производительной внешней графики эта неприятная особенность может легко выплыть наружу.

Что же касается заложенной в гибридные процессоры AMD идеи гетерогенных вычислений, то на данный момент мы не можем сказать, что в её силах существенно помочь продвижению Trinity на рынок. В целом программная экосистема пока не особенно готова к ускорению вычислений через OpenCL или Direct Compute. И хотя определённые подвижки в этом направлении есть, например способность задействования ресурсов графического ядра появилась в архиваторе WinZIP, нескольких фильтрах в Photoshop CS6 и в GIMP, а также в некотором количестве утилит для обработки изображений и видео (в частности, Musemage или vReveal), пока что принимать идеологию APU за новый стандарт ещё рановато. Подавляющее большинство ресурсоёмкого программного обеспечения, с которым пользователи компьютеров сталкиваются ежедневно, продолжает опираться в первую очередь на x86-ядра. К тому же AMD пока не предложила никакого решения проблемы с недоступностью ресурсов своего встроенного GPU при установке внешней видеокарты, а технологии сторонних разработчиков, такие как LucidLogix Virtu MVP, не отличаются ни удобством, ни гибкостью, ни стабильностью.



Оригинал материала: https://3dnews.kz/636011