И вновь продолжается бой…

Большинство из нас уже привыкло к внезапным маркетинговым акциям, появлению новых продуктов, изменению роадмапов (roadmaps) с целью опережения соперников хотя бы с «бумажным» выпуском их новинок. Не для кого не секрет и извечное противостояние двух заклятых противников в процессорной сфере – AMD и Intel. Но у технологических гигантов видимо всегда найдется что-нибудь чем нас удивить. Вот и сейчас, к концу года, когда все о ближайшем будущем микросхем и процессоров казалось известным и очевидным, буквально за несколько недель сентября этого года стало с ног на голову. Ну а начнем мы с предисловия, чтобы стало наконец ясно, что же такого произошло за несколько сентябрьских дней этого года.

В конце апреля 2003 года, после многочисленных долгосрочных переносов компания AMD официально представила свой первый 64-разряний процессор. Это был серверный Opteron, ранее известный под кодовым названием Sledgehammer. Выпущен он был в 3 моделях: 240 (1,4 ГГц), 242 (1,6 ГГц) и 244 (1,8 ГГц), выполненные по х86-64 архитектуре. Этот процессор, открывший семейство К8, ознаменовал начало новой эры «чистых» 64-разряных вычислений. Он имеет встроенный 2-каналльный контроллер памяти DDR и способен адресовать до 256 Тбайт памяти. Серия 2хх предназначена для 2-процессорных серверов, позднее появились серии 4хх и 8хх, соответственно, для 4- и 8-процессорных конфигураций. Эта событие стало поистине революцией в технологиях вычислений. Хотя, в последнее время достаточно сложно определить, что же является революцией, а что наследственными эволюционными технологиями. Платформу AMD64 поддерживают все основные производители операционных систем, в том числе Microsoft, RedHat, SuSE, United Linux (компания, включающая SuSE, Conectiva, Caldera и TurboLinux), MandrakeSoft и Wasabi.

Несмотря на то, что ядро Hammer имеет сходство с ядром K7: там имеется много нововведений. Регистры расширены до 64 разрядов, что позволяет адресовать и работать одинаково эффективно как с 16-32-разрядными, так и с 64-раздынми командами. Конвейер удлинен, а вместе с ним улучшился и блок предсказания ветвлений, и увеличено окно планировщика. Появилась поддержка набора команд SSE2. Встроенный 144-разряный контроллер памяти DDR333 поддерживает ECC (контроль ошибок). Кэш второго уровня увеличен до 1 Мбайта. Вот так получился первый 64-битный процессор от AMD. Он вполне мог рассчитывать на удачу, если бы не его более чем скромные поставки и не некоторые ошибки, которые были найдены вскоре после его запуска. Впрочем, это не помешало новинке вскоре приобрести заслуженную популярность. По словам инженеров AMD, выпуск K8 был гораздо более успешным, чем выпуск K6, но не таким успешным, как K7. К этому времени у Intel уже имелся Itanium 2 – серверный процессор, выполненный по архитектуре IA-64. С ними тоже не все шло гладко: стоили они очень дорого, и в них также нашлись серьезные ошибки.

В такой ситуации Intel могла рассчитывать только на опережение конкурента с выпуском своих новинок. В серверной сфере готовились новый Itanium 2 на ядре Madison, а затем и на Deerfield и Xeon MP на ядре Gallatin. На рынке ПК начального уровня, безусловно, почти всегда, и сейчас в том числе позиции сильнее были у компании AMD. Она стало плавно свертывать производство линейки процессоров Duron, притом, что неожиданно недавно были выпущены последние модели этого семейства с частотами 1.4, 1.6 и 1.8 ГГц. В этом году конвейер по выпуску Duron все же остановится. Им на смену AMD выпустила процессор Athlon XP Thorton, основанный на ядре Barton, и по сути дела, являющийся его урезанным вариантом. Единственным отличием его от «отца» стал его урезанный до 256 Кбайт кэш второго уровня. Все остальные спецификации те же: частота системной шины 333-400 МГц, кэш L1 – 128 Кбайт, техпроцесс – 130 нм. Мы увидим эти процессоры с рейтингами 2000+, 2200+ и 2400+. Это решение представляется наиболее грамотным и рациональным на рынке дешевых CPU.

На рынке настольных процессоров Intel не особенно суетилась, понимая, что мы входим в новый век 64-разрядных вычислений. На этом рынке позиции её Pentium 4 Northwood были достаточно сильны, а конкурирующий Athlon XP уже достиг своего технологического предела, в то время как такой запас был у ядра Northwood. Уже все ожидали, что Pentium 4 на ядре Prescott и Athlon XP на ядре Barton закроют эру 32-разрядных процессоров достаточно быстро. В связи с быстро нарастающей мощью Athlon 64, будущего 64-битного CPU для настольных компьютеров, компания Intel в очередной раз решила форсировать события, опередив AMD с выпуском новых настольных процессоров хотя бы на несколько дней. В связи с такими событиями было принято нестандартное решение в духе современной конвергенции, которая сближает не только мобильные и настольные технологии, но и серверную сферу с настольными технологиями. Несмотря на то, что ядро Northwood еще до конца не исчерпало всех своих ресурсов, оно уже не может соперничать с 64-разрядной новинкой от AMD. Итак, в сентябре на IDF Fall 2003 в Сан-Хосе Intel объявила новый процессор для настольных ПК под названием Pentium 4 Extreme Edition. Следом за этим, 23 сентября AMD представила свои настольные 64-разрядные процессоры. Вот о том, что нас ждет на рынке настольных процессор мы и поговорим в этой статье.

Athlon 64 и Athlon 64 FX

Как мы уже говорили, новые процессоры имеют очень много общего с архитектурой K7, но включают новые особенности поколения K8. Архитектура поколения К8 была названа AMD64 или х86-64, которая представляет собой переработку 32-разрядного ядра K7.

Прежде всего, переработка заключается в расширении архитектуры до 64 разрядов. Все регистры общего назначения (GPR) были увеличены до 64 бит, добавились еще 8 новых 64-разрядных GPR. Таким образом, сохранилась обратная совместимость с х86-кодом. Это позволило выполнять как 16/32-битные, так 64-битные приложения. Чтобы реализовать совместимость, CPU наделили возможностью работать в 2 режимах: наследственном (legacy) и длинном (long). В наследственном режиме К8 работает с 16- и 32-разрядными приложениями точно так же, как и Athlon XP, даже быстрее. Длинный режим требует наличия 64-разрядной операционной системы, совместимой с архитектурой AMD64 (x86-64). Этот режим позволяет задействовать все дополнительные 64-разряные регистры и адресовать 264 = 16 Тбайт оперативной памяти при использовании 40-разрядных физических адресов и 48-разрядных виртуальных адресов. Следовательно, снимаются все ограничения, налагаемые 32-битной ОС (максимально адресуется 4 Гбайта оперативной памяти). Зачем это нужно? Прежде всего, для серверов, базы данных и СУБД которых уже требуют больший объем оперативной памяти. Не за горами то время, когда и простые пользователи будут иметь более 4 Гбайт оперативной памяти, ведь большинство уже обзавелось 512 Мбайт DDR, а 64-битная ОС будет требовать гораздо больше.

Еще одно нововведение коснулось увеличения окна целочисленного планировщика команд – оно было увеличено с 18 до 24 входов. Это стало возможным благодаря улучшению блока предсказания ветвлений (его глобальный счетчик команд был увеличен в 4 раза) и позволило в конечном итоге удлинить конвейер, а значит, и повысить тактовую частоту. Целочисленный конвейер K8 стал 12-ступенчатым против 10-ступенчатого у К7.

Кэши К8 идентичны кэшам К7, но имеют значительно меньшие задержки и большую пропускную способность. И последнее: в К8 было увеличено число записей в буферах быстрого преобразования адресов (TLB). На уровне микрокода появилась поддержка набора команд SSE2.

В кристалл процессора интегрирован контроллер памяти DDR шириной 144 бита с поддержкой ECC (контроля ошибок), что значительно снижает задержки при  передаче данных между памятью и процессором. Это значение снижено со 170 до 35-40 нс. Контроллер памяти может иметь делитель частоты и работать на частотах 333 или 400 МГц. CPU соединяется с южным мостом, контроллером AGP и PCI-X через шину типа «точка-точка» HyperTransport с частотой 1600 МГц – старую и проверенную годами разработку AMD. Пропускная способность шины «процессор-память» составляет 6,4 Гб/с, а с южным мостом – 3,2 Гб/с. К сожалению, единственным минусом данной системы является разделяемая FSB, позволяющая подключаться к памяти любому процессору. Системная шина представляет собой 3 шины HyperTransport по 16 бит (в сумме 64 бита) для связи с соседними процессорами и памятью. Но ведь настольному Athlon 64 это не грозит – он используется в однопроцессорных системах. Кстати говоря, встроенный контроллер памяти упрощает разводку системных плат, и поэтому их стоимость не должна превышать $100. Грубо говоря, CPU Athlon 64/FX включил  в себя северный мост.

Кэш-память второго уровня увеличили в два раза, и теперь она составляет 1 Мбайт, что сумме с кэшем первого уровня исключающей (exclusive) архитектуры дает 1152 килобайта.

Если говорить о физическом исполнении самого процессора, то он выполняется по 0,13 мкм техпроцессу с использованием технологии SOI (Silicon on Insulator, «кремний на диэлектрике»). Благодаря этой технологии можно достичь больших тактовых частот и меньшего тепловыделения. Для упаковки используется старая керамическая упаковка – почему не органическая, как в Athlon XP – непонятно. Процессор имеет 940 выводов и устанавливается, соответственно, в Socket 940. Для усовершенствования тепловых и механических характеристик процессора теперь используется аналогичный интеловскому интегрированный распределитель тепла (heatspreader), который защищает кристалл процессора от сколов при установке кулера и более равномерно распределяет выделенный тепловой поток. Естественным образом снижается тепловая плотность и исключаются локальные очаги перегрева кристалла при неправильном нанесении термопасты. Добавлена возможность многоступенчатого выключения системы при перегреве. Существенно изменен подход к системе охлаждения. Так как теперь процессор внешне похож на Pentium 4, будут похожими и кулеры для него. Отличие заключается в обязательной удерживающей рамке на материнской плате вокруг сокета. Таким образом, повышается механическая надежность систем, нет давления на сокет и плата не подвергается избыточному упругому напряжению.

Представление

Итак, 23 сентября на выставке Computex’2003 компания AMD представила свои новые настольные и мобильные 64-разрядные процессоры Athlon 64, основанные на ядре ClawHammer. Они выпускаются в 3 модификациях: Athlon 64 FX, Athlon 64 и Mobile Athlon 64. Первенцами каждого семейства стали модели Athlon 64 FX-51, Athlon 64 3200+ и Mobile Athlon 3000+. Для high-end модели (FX) применяется новая двухзначная маркировка, похожая на трехзначную для Opteron. Видимо, компания решила уйти от привязки процессора к частоте, и решила больше не отображать рейтинг в высокопроизводительных моделях. Маркировка FX выбрана не случайно: это обозначает наличие неких спецэффектов. Неслучайно и число 51 – оно нечетное, для того чтобы отличит процессор от других серий. В последствии Athlon 64 FX будет маркироваться, начиная с 51 с шагом 2 для каждой последующей модели. Эти цифры каким-то образом отражают относительную производительность. Для Athlon 64 сохранен P-рейтинг, так как по производительности новый процессор сравним с Athlon XP. Вообще, рост производительности должен быть виден только в мультимедийных приложениях, требующих интенсивного обмена с памятью. Первые представленные CPU имели следующую частоту: Athlon 64 FX-51 — 2,2 ГГц, Athlon 64 3200+ —  2 ГГц, Mobile Athlon 3000+ — 1,8 ГГц. Частота работы системной шины (если ее теперь можно таковой считать) – 1600 МГц.

 

 

 Процессор

Athlon 64

Athlon 64 FX

Opteron 100 series

Opteron 200 series

Pentium 4

Pentium 4 EE

Xeon DP

Xeon MP

Разъем

Socket 754

Socket 940

Socket 940

Socket 940

Socket 478

Socket 478

Socket 604

Socket 603

частота ядра, ГГц

2,0

2,2

2,0

2,0

3,2

3,2

3,2

2,8

пропускная способность шины, ГБ/с

6,4

6,4

6,4

6,4

6,4

6,4

4,2

3,2

объем кэша L1

128 КБ

128 КБ

128 КБ

128 КБ

8 КБ + 12K

8 КБ + 12K

8 КБ + 12K

8 КБ + 12K

объем кэша L2

1 МБ

1 МБ

1 МБ

1 МБ

512 КБ

512 КБ

512 КБ

512 КБ

объем кэша L3

-

-

-

-

-

2 МБ

0-1 МБ

1-2 МБ

поддержка SMP

-

-

-

+ (2 CPU)

-

-

+ (2 CPU)

+ (4 CPU)

каналов контроллера DDR

1

(integrated)

2 (integrated)

2 (integrated)

2

(integrated)

2

2

2

4

память

DDR400

DDR400 (registered)

DDR333 (registered)

DDR333 (registered)

DDR400

DDR400

DDR266 (registered, ECC)

DDR200 (registered, ECC)

Как видно из таблицы, процессор Athlon 64 имеет разъем Socket 754, так как поддерживает только одноканальную (64 бита) небуферизованную память DDR400, что требует меньшего количества контактов, но и другой разводки материнской платы, чем у Athlon 64 FX. Athlon 64 FX использует более дорогую, но и более надежную регистровую память DDR400, он имеет двухканальный 128-битный встроенный контроллер памяти.

Площадь кристалла обоих CPU одинаковая – 193 мм2, ядро содержит одинаковое число транзисторов – 105,9 миллионов, а значит и тепловыделение одинаково – 89 Ватт, что не так уж и много для такой вычислительной махины. Напомним, что у Athlon XP рассеиваемая мощность была на уровне 76 Вт. Напряжение питания понижено с 1,65 до 1,5 В, что дополнительно указывает на меньшие пиковые токи и меньшее энергопотребление. Athlon 64, в отличие от своих старших собратьев, упакован в органический корпус, а не в керамический.

64-разрядный процессоров для ноутбуков класса DTR - Desktop Replacement - класса замены настольному ПК с рейтингами 3000+ и 3200+ отличается от Athlon 64 только отсутствием закрывающей кристалл крышки. Процессоры Mobile Athlon 64 могут использоваться только в DTR-системах: они потребляют до 89 Ватт — например, версия 3000+ потребляет 81 Вт. Кстати этот показатель у Opteron составляет 85 Вт для младших моделей и 89 Вт для 2,0 ГГц и выше (это же касается и Athlon 64/Athlon 64 FX) — для процессоров архитектуры AMD64 всех линеек потребляемая мощность определяется исключительно частотой.

В Athlon 64/FX наконец реализованы функции понижения энергопотребления: технология PowerNow!, отлично зарекомендовавшей себя ранее в мобильных процессорах. Здесь она будет называться Cool&Quiet, и заключаться в том же — адаптивное динамическое изменение тактовой частоты и напряжения питания процессора в зависимости от нагрузки. Отметим только, что мобильная технология динамического изменения частоты и напряжения Cool&Quiet, применяемая в Mobile Athlon 64, может быть задействована у всех процессоров архитектуры AMD64, дело только в поддержке такой функциональности материнской платой.

Впрочем, сами цены на новые процессоры будут не очень низкими. AMD вообще изменяет ценовую политику, теперь топовые модели процессоров не будут стоить менее 600 долларов (впрочем,  как и у Intel). Athlon 64 FX-51 оценивается в 733 доллара в партиях от 1000 штук, Athlon 64 3200+ — по 413 у.е., так же, как и Mobile Athlon 64 3000+. В таком случае не совсем понятным становится позиционирование Athlon 64 FX. Чем же он отличается от Opteron серии 1xx? Оба этих процессора имеют 128-разрядный интегрированный контроллер памяти, поддерживающий регистровую память. Как оказалось, контроллер памяти Opteron тоже прекрасно держит память DDR400 (естественно регистровую). Opteron и Athlon FX-51 имеют даже одинаковый CPUID. Единственное что удалось найти: они различаются тем, что процессор AMD Opteron имеет три канала HyperTransport, а процессор AMD Athlon FX – только один (они ему попросту не нужны). Они также имеют различную электрическую спецификацию. Все незначительные архитектурные изменения выполнены на уровне отключения некоторых блоков. Короче говоря, такое позиционирование весьма шатко, и поэтому некоторые сообразительные покупатели выберут Athlon 64 FX для своих рабочих станций – уж больно привлекательной получилась новинка. Правда, мы наблюдаем обычный для AMD дефицит новинок на рынке: в Санкт-Петербурге их можно приобрести только в магазинах «Кей» и то в боксовом комплекте с материнской платой за 18300 рублей.

Новинка поддерживается чипсетами ALI, nVidia, VIA, SIS – ну впрочем все как всегда.

Pentium 4 Extreme Edition

В пику AMD на IDF Fall 2003 компания Intel неожиданно объявила новый процессор в линейке Pentium 4, который позиционируется точно также как и Athlon 64 – процессор для крутых игр и мультимедийных приложений. Athlon XP остается конкурировать с Pentium 4 Northwood и Celeron P4 (притом явно выигрывая). Похоже такой выпад со стороны Intel готовился давно, но в строжайшей тайне, чтобы раньше времени об этом никто не узнал. Надо сказать маскировка была хорошей – никакой информации «из неофициальных источников» не проскочило. Такое объявление стало неожиданностью и для многих сотрудников Intel.

Сам процессор похоже основан на ядре Gallatin, используемом в процессоре Xeon MP. Официально, конечно, это интеловцы не подтверждают, но поскольку Gallatin имеет сходство с настольным Northwood, то из первого не так уж и сложно получить модифицированную версию desktop-процессора. По крайней мере, топологический кристалл кремния используется тот же. Его немного изменили с целью поддержки системной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартный корпус от текущих Pentium 4. В результате, процессор Pentium 4 Extreme Edition не может работать в многопроцессорных конфигурациях, зато выделяет почти столько же тепла, сколько нынешний Pentium 4 3,2 ГГц. Вместе с новым ядром сюда переехал и кэш третьего уровня L3.

Intel Pentium 4 Extreme Edition работает на системной шине 800 МГц, имеет тактовую частоту ядра до 3,2 ГГц, но главным его отличием от предшествующих Pentium 4 стало наличие интегрированной в кристалл кэш-памяти третьего уровня объемом 2 Мбайт! Эта кэш-память дополняет стандартный «нортвудовский» кэш L2 512 кбайт и работает также на частоте ядра процессора (правда, с гораздо большей латентностью, поскольку она асинхронная и призвана ускорять работу с данными из наиболее часто используемых областей системной памяти). Таким образом, всего новый Pentium 4 Extreme Edition  имеет кэш-память объемом 2,5 Мбайт! Кеш этот расположен на одном кристалле вместе с ядром и имеет точно такое же строение, как и L3 кеш старших Xeon MP. То есть, этот кеш инклюзивный, ассоциативный с 8 областями (8-way) и использующий 64-битную шину.

Утверждается, что процессор Pentium 4 Extreme Edition будет совместим со всеми существующими системными платами на чипсетах Intel 875/865, то есть не потребует редизайна сокета, изменения стабилизаторов питания VRM (на более мощные), более внушительных кулеров и пр., несмотря на увеличившееся до 169 миллионов транзисторов ядро и возросшее до 94 Ватт типичное тепловыделение.

Начало продаж новых процессоров (по всей видимости, они будут выпускаться с несколькими тактовыми частотами вплоть до 3,2 ГГц) намечено в октябре-ноябре. Тогда же станут доступны спецификации и известны цены на них. Единственное, что может остановить – эта цена $740.

Надо сказать, что этот процессор, похоже, не станет временной подменой до выхода Pentium 4 Prescott, который намечен на 3 декабря, а самостоятельной линейкой продуктов.

Тестирование и выводы

Ну что ж, мы стали очевидцами еще одного витка борьбы двух гигантов. Чувствуя, что их потенциал на существующих технормах еще не исчерпан, они стараются его использовать до конца.В то же время, видя нецелесообразность рост частот AMD делает ставку на преемственность поколений и совместимость 32 и 64-разрядных систем, в то время как Intel четко разграничивает серверную 64-битовую платформу Itanium 2 и настольные процессоры с рабочими станциями. Чем это нам грозит, мы увидим позже – возможно мы бужем иметь 2 совершенно не совместимые платформы, предлагаемые извечными конкурентами, которые будут преспокойно уживаться вместе.

Что касается процессора Athlon 64 FX-51, то это первый CPU с архитектурой AMD64 для рынка настольных систем. Фактически, представляя собой аналог Opteron с частотой 2.2 ГГц, Athlon 64 FX-51 действительно показывает высокую производительность и в большинстве тестов превосходит Intel Pentium 4 3.2 ГГц, являвшийся самым быстрым CPU для настольных систем до сегодняшнего дня. Имея двухканальный контроллер памяти, кеш-память общим объемом 1152 Кбайта и поддерживая набор инструкций SSE2, Athlon 64 FX-51 стал гораздо быстрее своего предшественника, Athlon XP 3200+.

Intel ответил на выпуск Athlon 64 FX-51 анонсом процессора Pentium 4 Extreme Edition 3.2 ГГц, имеющего кеш третьего уровня объемом 2 Мбайта. Этот достаточно простой шаг позволил добиться улучшения уровня производительности в реальных приложениях до 15%, однако средняя величина этого прироста составляет всего лишь 3.5%. Наибольшую эффективность кеш третьего уровня имеет в играх, что еще раз подтверждает направленность этого CPU на рынок игровых платформ. Появление Pentium 4 Extreme Edition 3.2 ГГц, реальные продажи которого начнутся через месяц, может слегка поколебать позиции Athlon 64 FX-51. Тем более что технология Hyper-Threading, таящая в себе значительный потенциал для увеличения производительности и реализованная в Pentium 4 Extreme Edition в самое ближайшее время начнет применяться в играх.

Пока же расклад сил выглядит следующим образом. За новым процессором от Intel остается превосходство в скорости обработки потоковых данных и приложениях для кодирования мультимедиа файлов, а также большее быстродействие в приложениях, способных эффективно использовать многопоточность, например в 3DMax или в Photoshop. Новичок от AMD при этом уверенно побеждает в научных расчетах, при использовании офисных приложений и, при некоторых оговорках, в современных 3D играх.

Пару слов хочется сказать о дальнейших перспективах процессоров семейств Athlon 64 FX и Pentium 4 Extreme Edition. Обе линейки этих процессоров в настоящий момент производятся при использовании 0.13-микронного технологического процесса (плюс технология SOI у AMD). Предел по частотам кристаллов эти технологические процессы уже исчерпали, это подтверждают и опыты по разгону протестированных CPU. Максимальная частота, которой удалось достичь при разгоне Pentium 4 Extreme Edition в лаборатории F-Centera составила 3.6 ГГц (напряжение питания обоих CPU мы увеличили при разгоне на 0.1В), а предельная частота для Athlon 64 FX-51 немного не дотянула до 2.4 ГГц. Это значит, что последующие модели в обеих линейках будут, скорее всего, выпускаться уже по новому, 90-нанометровому техпроцессу. Поэтому, во многом будущий успех Athlon 64 FX и Pentium 4 Extreme Edition будет связан с расторопностью компаний при переводе оборудования на новую технологию. Только вот встает вопрос: как там SOI с 90 нм уживаются у AMD, вот конвейеры Intel уже производят Prescott, чтобы новых CPU было достаточно к моменту запуска в декабре этого года.

Автор: Александр Дудкин
alexishw@xaker.ru

15.10.2003


© Авторские права и копия защищены законом: © Дудкин Александр Константинович, 2002 г.
Копирование любых материалов только с письменного разрешения автора сайта
URL сайта: www.alexishw.mailru.com
Ваши замечания и предложения присылайте по e-mail: alexishw@mailru.com