В low-end секторе, в отличие от high-end, позиции AMD по-прежнему достаточно сильны. Младшие двухъядерники условно можно считать равными по производительности, да и Sempron, хоть и отстаёт от Celeron, но всё же не настолько фатально, как в случае с Phenom X4 vs. Core 2 Extreme. Правда, небольшая ложка дёгтя всё же присутствует: процессоры AMD не только медленнее, но и существенно горячее. Разумеется, это не знаменитые NetBurst-печки, но всё же уровень энергопотребления у ядра K8 существенно выше, чем у Intel Core. Впрочем, при абсолютных значениях в районе 40 ватт в пике, найдётся масса людей, которые просто не придадут этому большого значения.
В high-end дела у AMD обстоят значительно хуже. AMD почти успешно пытается перейти на 45-нм технормы производства для производства 4 ядер на заводе Fab 36 в Дрездене. Итак, под названием Deneb скрываются четырехъядерные процессоры AMD для настольных систем, выпускаемые по нормам 45 нм. Первые образцы этих изделий были отгружены партнерам компании еще в марте текущего года, а появление на рынке первых моделей Phenom X4, работающих на частотах 2,5-2,8 и 2,4-2,7 ГГц, ожидается в ноябре.
Напомним, что по измерениям коллег с iXBT, топовый процессор от AMD AMD Phenom X4 9850 отстаёт от топового процессора Intel Core 2 Extreme QX9770 на 45%.
И это при том, что AMD Phenom X4 9850 степпинга B3 уже не содержит ошибки, выявленной в ранних версиях Phenom X4. С исправленной ошибкой, частотой 2,5 ГГц, усовершенствованным встроенным северным мостом, работающим на частоте 2 ГГц, и даже поддержкой ещё не совсем официального стандарта памяти DDR2-1066, это действительно самое быстрое решение, которое способна выпустить компания AMD на данный момент времени.
Перечислим вкратце особенности архитектуры ядра Phenom (К10) в сравнении с предыдущей архитектурой AMD (Athlon 64 X2 / K8).
- Реализация 128-битных (против 64-битных у AMD K8) исполнительных устройств с плавающей точкой (FP);
- Расширение шины L1-LSU (Load-Store Unit) до 2×128 бит (чтение) и 2×64 бит (запись);
- Расширение шины L1-L2 кэша ядра процессора до 128 бит;
- Реализация предвыборки данных в L1-кэш процессора;
- Наличие объединенного кэша инструкций/данных третьего уровня (L3) эксклюзивной (неинклюзивной) архитектуры, расположенного в интегрированном контроллере памяти и общего по отношению к ядрам процессора;
- Наличие интегрированного двухканального контроллера памяти (2×64-бит, с возможностью «спаренного» (ganged) либо «распаренного» (unganged) режимов работы), поддерживающего память типа DDR2 и DDR3 (в первых моделях процессоров — только DDR2);
- Усовершенствованный блок предсказания ветвлений, который теперь в состоянии предсказывать косвенные переходы;
- Блок Sideband Stack Optimizer, входящий в состав декодера (аналог блока Stack Pointer Tracker в терминах архитектуры Intel Core);
- Существенно усовершенствованный (ускоренный) механизм исполнения SSE-команд.
Звучит внушительно, но работает не так хорошо, как звучит…
Phenom X3 8750 — это отбраковка Phenom X4, у которых не заработало как нужно одно из ядер. Не скрывает этого даже сама AMD. Напомним, что в отличие от четырёхъядерников Intel, которые представляют собой, фактически, «склейку» из двух двухъядерных процессоров, помещённую в корпус, четырёхъядерники AMD — это действительно единый кристалл. Соответственно — площадь у кристалла получается относительно большая, а где большая площадь — там большой процент брака.
Позиционирование для этого процессора, не обладающего хорошей производительностью, было принято следующее: трехъядерные Phenom X3 будут конкурировать с двухъядерными Core 2 Duo. Что стало очевидным промахом AMD!
Посмотрим на конкурентов:
Процессор | ||||||
Название ядра | Toliman | Agena | Conroe | Wolfdale | Kentsfield | Yorkfield |
Технология пр-ва | 65 нм | 65 нм | 65 нм | 45 нм | 65 нм | 45 нм |
Частота ядра, ГГц | 2,4 | 2,5 | 2,4 | 2,53 | 2,4 | 2,5 |
Кол-во ядер | 3 | 4 | 2 | 2 | 4 | 4 |
Кэш L1, I/D, КБ* | 64/64 | 64/64 | 32/32 | 32/32 | 32/32 | 32/32 |
Кэш L2, КБ** | 3×512 | 4×512 | 4096 | 3072 | 8192 | 6144 |
Кэш L3, КБ | 2048 | 2048 | — | — | — | — |
Частота шины***, МГц | 533 (1066) | 533 (1066) | 266 (1066) | 266 (1066) | 266 (1066) | 333 (1333) |
Коэффициент умножения | 12 | 12,5 | 9 | 9,5 | 9 | 7,5 |
Сокет | AM2+ | AM2+ | LGA775 | LGA775 | LGA775 | LGA775 |
Тепловыделение**** | 95 Вт | 125 Вт | 65 Вт | 65 Вт | 95 Вт | 95 Вт |
* — в многоядерных процессорах — для одного ядра
** — если указано X x Y, подразумевается «X килобайт на каждое из Y ядер»
*** — у процессоров AMD — частота шины контроллера памяти
**** — у процессоров Intel и AMD указывается по-разному, поэтому сравнивать напрямую некорректно
Формально в хорошо оптимизированном приложении три ядра AMD, работающие на такой же частоте, что и два ядра Intel — имеют реальный шанс выиграть, даже если каждое по отдельности с задачей справляется хуже. Основная проблема в том, что таких приложений на данный момент очень мало. Даже доля ПО, оптимизированного под два ядра, в общем количестве и по самым оптимистичным оценкам едва ли превышает четверть. Результаты Adobe Photoshop, а ещё лучше — видеокодека x264 очень показательны — там AMD близка к победе.
Остальные модели выглдят так:
Что касается энергопотребления…
Если верить измерениям, произведенным китайскими коллегами, по показателю потребляемой мощности 45-нм AMD Deneb выигрывает у 65-нм Agena (Phenom 9600) до 12%. Это очень хороший результат, с учетом того, что Deneb имеет утроенный размер кэш-памяти L3, равный 6 МБ.
Для сравнительного тестирования была использована система в следующей конфигурации: системная плата MSI K9A2 Platinum, 3D-карта NVIDIA GeForce GTX 280, 320-ГБ винчестер, два модуля памяти DDR2-1066 МГц объемом по 1 ГБ. Питание тестовой установки обеспечивал БП Thermaltake Toughpower мощностью 1200 Вт. Потребляемая мощность замерялась в режиме простоя и под нагрузкой.
В режиме простоя система с 45-нм CPU потребляла 147 Вт, с 65-нм — 154 Вт. При полной нагрузке значения возрастали до 176 и 200 Вт соответственно.
Планы в серверной области — We will survive…
Обновленный план по выпуску процессоров AMD содержит указание на то, что 45-нм серверные процессоры второго поколения компании (кодовые имена Sao Paolo и Magny Cours) будут выпускаться в исполнении Socket G34. На представленной диаграмме можно насчитать целых 1974 контакта, на 767 больше, чем у нынешних плат для Barcelona.
Напомним, современные Opteron используют Socket F (Socket 1207), на смену которому должен прийти G3, который станет актуален с выпуском 45-нм процессоров Shanghai. Shanghai, следующая версия Opteron, выйдет по графику, во второй половине года. Это будут решения, поддерживающие: работу с шиной НТ3.0, IPC (instruction-per clock enhancement) и имеющие от 2 до 6 МБ кэш-памяти третьего уровня.
G3 станет главным процессорным разъёмом AMD 2009 года, а Socket G34 планируется к внедрению в 2010-м, когда на сцену должны выйти 8-ядерные Sao Paolo (два четырёхъядерных кристалла Shanghai в одной упаковке) и 12-ядерные Magny-Cours. От этих CPU ожидают поддержки четырёхканальной памяти DDR3-1600, шины HyperTransport 3, до 12 МБ кэш-памяти L3 на процессор.
Istanbul, 6-ядерные серверные решения для установки в 2P-платы с типом разъема Socket F1 (1207) должны появиться во второй половине уже следующего, 2009 года. Как ожидается, такие процессоры позволят ОЕМ-производителям сократить расходы на разработку платформ и увеличить производительность системы в расчёте на Вт. Особенностью этих процессоров будет Direct Connect Architecture, которая позволит ускорить взаимодействие между процессорами системы.
Третье поколение AMD Opteron и платформа Socket G34 ожидаются в первой половине 2010 года. Платформа Socket G34 будет оперировать памятью типа DDR3, использовать возможности чипсета AMD RD890 и скорость шины HT3.0. Кроме того, планируется использование «дополнительной линии НТ3.0». Решения для платформы G34 будут как 6-, так и 12-ядерные. Называться они будут соответственно, Sao Paolo и Magny Cours.
Magny Cours будут не нативными «12-ядерниками», а двумя 6-ядерными чипами в мультичиповой упаковке. Ожидается, что такое количество ядер к тому моменту уже будет использоваться «на полную» соответствующим ПО, хорошо поддающимся распараллеливанию, а иначе — «выпуск такого многоядерного решения — по сути станет шагом назад», — отметил Рэнди Аллен из AMD в своем выступлении на брифинге в Сан-Франциско, посвященном роадмапу серверных процессоров AMD.