X

Новые попытки AMD в hi-end

В low-end секторе, в отличие от high-end, позиции AMD по-прежнему достаточно сильны. Младшие двухъядерники условно можно считать равными по производительности, да и Sempron, хоть и отстаёт от Celeron, но всё же не настолько фатально, как в случае с Phenom X4 vs. Core 2 Extreme. Правда, небольшая ложка дёгтя всё же присутствует: процессоры AMD не только медленнее, но и существенно горячее. Разумеется, это не знаменитые NetBurst-печки, но всё же уровень энергопотребления у ядра K8 существенно выше, чем у Intel Core. Впрочем, при абсолютных значениях в районе 40 ватт в пике, найдётся масса людей, которые просто не придадут этому большого значения.

В high-end дела у AMD обстоят значительно хуже. AMD почти успешно пытается перейти на 45-нм технормы производства для производства 4 ядер на заводе Fab 36 в Дрездене. Итак, под названием Deneb скрываются четырехъядерные процессоры AMD для настольных систем, выпускаемые по нормам 45 нм. Первые образцы этих изделий были отгружены партнерам компании еще в марте текущего года, а появление на рынке первых моделей Phenom X4, работающих на частотах 2,5-2,8 и 2,4-2,7 ГГц, ожидается в ноябре.

Напомним, что по измерениям коллег с iXBT, топовый процессор от AMD AMD Phenom X4 9850 отстаёт от топового процессора Intel Core 2 Extreme QX9770 на 45%.

И это при том, что AMD Phenom X4 9850 степпинга B3 уже не содержит ошибки, выявленной в ранних версиях Phenom X4. С исправленной ошибкой, частотой 2,5 ГГц, усовершенствованным встроенным северным мостом, работающим на частоте 2 ГГц, и даже поддержкой ещё не совсем официального стандарта памяти DDR2-1066, это действительно самое быстрое решение, которое способна выпустить компания AMD на данный момент времени.

Перечислим вкратце особенности архитектуры ядра Phenom (К10) в сравнении с предыдущей архитектурой AMD (Athlon 64 X2 / K8).

  • Реализация 128-битных (против 64-битных у AMD K8) исполнительных устройств с плавающей точкой (FP);
  • Расширение шины L1-LSU (Load-Store Unit) до 2×128 бит (чтение) и 2×64 бит (запись);
  • Расширение шины L1-L2 кэша ядра процессора до 128 бит;
  • Реализация предвыборки данных в L1-кэш процессора;
  • Наличие объединенного кэша инструкций/данных третьего уровня (L3) эксклюзивной (неинклюзивной) архитектуры, расположенного в интегрированном контроллере памяти и общего по отношению к ядрам процессора;
  • Наличие интегрированного двухканального контроллера памяти (2×64-бит, с возможностью «спаренного» (ganged) либо «распаренного» (unganged) режимов работы), поддерживающего память типа DDR2 и DDR3 (в первых моделях процессоров — только DDR2);
  • Усовершенствованный блок предсказания ветвлений, который теперь в состоянии предсказывать косвенные переходы;
  • Блок Sideband Stack Optimizer, входящий в состав декодера (аналог блока Stack Pointer Tracker в терминах архитектуры Intel Core);
  • Существенно усовершенствованный (ускоренный) механизм исполнения SSE-команд.

Звучит внушительно, но работает не так хорошо, как звучит…

Phenom X3 8750 — это отбраковка Phenom X4, у которых не заработало как нужно одно из ядер. Не скрывает этого даже сама AMD. Напомним, что в отличие от четырёхъядерников Intel, которые представляют собой, фактически, «склейку» из двух двухъядерных процессоров, помещённую в корпус, четырёхъядерники AMD — это действительно единый кристалл. Соответственно — площадь у кристалла получается относительно большая, а где большая площадь — там большой процент брака.

Позиционирование для этого процессора, не обладающего хорошей производительностью, было принято следующее: трехъядерные Phenom X3 будут конкурировать с двухъядерными Core 2 Duo. Что стало очевидным промахом AMD!

Посмотрим на конкурентов:

Процессор

Phenom X3 8750

Phenom X4 9850

Core 2 Duo E6600

Core 2 Duo E7200

Core 2 Quad Q6600

Core 2 Quad Q9300

Название ядра

Toliman

Agena

Conroe

Wolfdale

Kentsfield

Yorkfield

Технология пр-ва

65 нм

65 нм

65 нм

45 нм

65 нм

45 нм

Частота ядра, ГГц

2,4

2,5

2,4

2,53

2,4

2,5

Кол-во ядер

3

4

2

2

4

4

Кэш L1, I/D, КБ*

64/64

64/64

32/32

32/32

32/32

32/32

Кэш L2, КБ**

3×512

4×512

4096

3072

8192

6144

Кэш L3, КБ

2048

2048

Частота шины***, МГц

533 (1066)

533 (1066)

266 (1066)

266 (1066)

266 (1066)

333 (1333)

Коэффициент умножения

12

12,5

9

9,5

9

7,5

Сокет

AM2+

AM2+

LGA775

LGA775

LGA775

LGA775

Тепловыделение****

95 Вт

125 Вт

65 Вт

65 Вт

95 Вт

95 Вт

* — в многоядерных процессорах — для одного ядра
** — если указано X x Y, подразумевается «X килобайт на каждое из Y ядер»
*** — у процессоров AMD — частота шины контроллера памяти
**** — у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно

Формально в хорошо оптимизированном приложении три ядра AMD, работающие на такой же частоте, что и два ядра Intel — имеют реальный шанс выиграть, даже если каждое по отдельности с задачей справляется хуже. Основная проблема в том, что таких приложений на данный момент очень мало. Даже доля ПО, оптимизированного под два ядра, в общем количестве и по самым оптимистичным оценкам едва ли превышает четверть. Результаты Adobe Photoshop, а ещё лучше — видеокодека x264 очень показательны — там AMD близка к победе.

Остальные модели выглдят так:

Что касается энергопотребления…

Если верить измерениям, произведенным китайскими коллегами, по показателю потребляемой мощности 45-нм AMD Deneb выигрывает у 65-нм Agena (Phenom 9600) до 12%. Это очень хороший результат, с учетом того, что Deneb имеет утроенный размер кэш-памяти L3, равный 6 МБ.

Для сравнительного тестирования была использована система в следующей конфигурации: системная плата MSI K9A2 Platinum, 3D-карта NVIDIA GeForce GTX 280, 320-ГБ винчестер, два модуля памяти DDR2-1066 МГц объемом по 1 ГБ. Питание тестовой установки обеспечивал БП Thermaltake Toughpower мощностью 1200 Вт. Потребляемая мощность замерялась в режиме простоя и под нагрузкой.

В режиме простоя система с 45-нм CPU потребляла 147 Вт, с 65-нм — 154 Вт. При полной нагрузке значения возрастали до 176 и 200 Вт соответственно.

Планы в серверной области — We will survive…

Обновленный план по выпуску процессоров AMD содержит указание на то, что 45-нм серверные процессоры второго поколения компании (кодовые имена Sao Paolo и Magny Cours) будут выпускаться в исполнении Socket G34. На представленной диаграмме можно насчитать целых 1974 контакта, на 767 больше, чем у нынешних плат для Barcelona.

Напомним, современные Opteron используют Socket F (Socket 1207), на смену которому должен прийти G3, который станет актуален с выпуском 45-нм процессоров Shanghai. Shanghai, следующая версия Opteron, выйдет по графику, во второй половине года. Это будут решения, поддерживающие: работу с шиной НТ3.0, IPC (instruction-per clock enhancement) и имеющие от 2 до 6 МБ кэш-памяти третьего уровня.

G3 станет главным процессорным разъёмом AMD 2009 года, а Socket G34 планируется к внедрению в 2010-м, когда на сцену должны выйти 8-ядерные Sao Paolo (два четырёхъядерных кристалла Shanghai в одной упаковке) и 12-ядерные Magny-Cours. От этих CPU ожидают поддержки четырёхканальной памяти DDR3-1600, шины HyperTransport 3, до 12 МБ кэш-памяти L3 на процессор.

Istanbul, 6-ядерные серверные решения для установки в 2P-платы с типом разъема Socket F1 (1207) должны появиться во второй половине уже следующего, 2009 года. Как ожидается, такие процессоры позволят ОЕМ-производителям сократить расходы на разработку платформ и увеличить производительность системы в расчёте на Вт. Особенностью этих процессоров будет Direct Connect Architecture, которая позволит ускорить взаимодействие между процессорами системы.

Третье поколение AMD Opteron и платформа Socket G34 ожидаются в первой половине 2010 года. Платформа Socket G34 будет оперировать памятью типа DDR3, использовать возможности чипсета AMD RD890 и скорость шины HT3.0. Кроме того, планируется использование «дополнительной линии НТ3.0». Решения для платформы G34 будут как 6-, так и 12-ядерные. Называться они будут соответственно, Sao Paolo и Magny Cours.

Magny Cours будут не нативными «12-ядерниками», а двумя 6-ядерными чипами в мультичиповой упаковке. Ожидается, что такое количество ядер к тому моменту уже будет использоваться «на полную» соответствующим ПО, хорошо поддающимся распараллеливанию, а иначе — «выпуск такого многоядерного решения — по сути станет шагом назад», — отметил Рэнди Аллен из AMD в своем выступлении на брифинге в Сан-Франциско, посвященном роадмапу серверных процессоров AMD.

[Посещений: 14, из них сегодня: 1]
Категории: CPU