Intel Pentium 4 «Northwood»: сравнение с предшественником и оценка перспектив


Задача оптимального выбора компьютерных комплектующих не имеет, к сожалению, четкого математического решения: слишком много факторов. Обычно используют такой метод: берется прайс-лист, из него выбрасываются крайние позиции (полный отстой и слишком крутые), а из оставшихся выбирается товар с наибольшим приростом узвончения торговых марок и количественного распухания псевдотехнических характеристик на прирост цены. Решение не самое плохое, не будем даже обращать внимание на то, что 256 МБ памяти на борту у GeForce2 MX — это чуть многовато. Подумаем лучше вот о чем: а зачем вообще нужен новый процессор?

Действительно, а зачем? Нет, есть, конечно, задачи, которые и N-гигагерцовый Pentium M загрузят по самые верхние регистры, вот только страшно далеки они от народа, и не на их решателей рассчитаны пляски сине-оранжевых человечков в ваших устройствах отображения информации. Нет, разница все еще есть даже при работе в Word, вот только замерять ее все трудней и трудней — не зря же каждое новое поколение бенчмарков выдает итоговый результат в баллах на порядок ниже, чтобы, значит, было куда расти, да и пользователя 10,5 балла напрягают куда сильней, чем 1050.

Игры… Да, остаются, как всегда, игры, но тут все слишком запущено. Intel тщетно демонстрирует на презентациях трехмерные демки, рассчитанные и показанные силами одного только центрального процессора. Гораздо вероятнее, что какой-нибудь очередной GeForce, уже практически интегрировавший звук, будет заодно и считать физику в игре, а уж с винчестером они договорятся: организуют новый протокол прямого доступа к графической памяти, и зачем им тогда нужны будут процессор с системной памятью — эти пережитки прошлого, ошибочно считавшиеся двигателем прогресса?

А бедные, никому не нужные процессоры будут все уменьшаться и ускоряться — пока в один (прекрасный?) день не разлетятся горсткой фотонов. Ну, до этого дня, впрочем, еще далеко. Пока посмотрим, чем нас порадует новый Pentium 4 — глядишь, и блеснет просвет…

Новое ядро Pentium 4 «Northwood»

Для начала, сам герой и его предшественник:

    
Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478

    
Intel Pentium 4 «Willamette», 2 ГГц, Socket 478

Обратите внимание на нижнюю строчку маркировки: цифры «512» в конце как раз указывают на единственное архитектурное отличие нового процессора от старого — 512 КБ кэша L2 вместо 256 КБ. Впрочем, реализация этого отличия стала возможной лишь вследствие перехода фабрик Intel на 0,13-микронную технологию производства с использованием медных соединений. В результате, на 200-миллиметровой пластине умещается вдвое больше кристаллов, чем при производстве по 0,18-микронной технологии. (В дальнейшем же, с переходом на 300-миллиметровые пластины, это количество увеличится еще в 2,5 раза.) Ну а следствием нового техпроцесса станут, совершенно очевидно, более высокая допустимая частота процессоров и пониженное тепловыделение (49,8 Вт TDP у 2,2-гигагерцовой версии Northwood против 75 Вт у Willamette 2 ГГц). Любопытно отметить, что процессор на новом ядре содержит 55 миллионов транзисторов (площадь — 146 мм2), из которых около 40% (у Willamette 42 миллиона транзисторов, а изменился только объем L2) приходится на кэш — неплохо?!

Northwood 2,2 ГГц
Northwood 2,2 ГГц, работающий на 2 ГГц

Willamette 2 ГГц
Willamette 2 ГГц

Естественно, новое ядро требует новой нагрузочной прямой питания процессора, но здесь никаких проблем для пользователей возникнуть не должно: все материнские платы под Socket 478 проектировались уже в расчете на новые процессоры, их нынешний VRM такую прямую поддерживает, так что в худшем случае вам придется перепрошить БИОС платы. Остается еще упомянуть о том, что процессор с частотой 2 ГГц будет последним в линейке Willamette, линейка же Northwood начнется с 2-гигагерцового, так что для различения крайних экземпляров Intel вновь вынужден прибегнуть к индексу «A»: младший Northwood будет официально называться Intel Pentium 4 2A ГГц.

Исследование производительности

Тестовый стенд:

  • Процессор Intel Pentium 4 «Willamette», 2 ГГц, Socket 478
  • Процессор Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478
  • Материнская плата ASUS P4T-E (Intel 850)
  • 2x128 МБ PC800 RDRAM RIMM Samsung
  • ASUS 8200 GeForce3
  • IBM IC35L040AVER07-0, 7200 об/мин, 2 МБ cache, 40 ГБ
  • CD-ROM ASUS 50x

Программное обеспечение:

  • Windows 2000 Professional SP2
  • NVIDIA Detonator v22.50 (Vsync=Off)
  • RazorLame 1.1.4 + Lame v3.89 codec
  • VirtualDub 1.4.7 + DivX v4.02 & v4.11 codec
  • WinZip 8.0
  • WinAce 2.11
  • eTestingLabs Content Creation Winstone 2001
  • eTestingLabs Business Winstone 2001
  • BAPCo & MadOnion SYSmark 2001 Internet Content Creation
  • BAPCo & MadOnion SYSmark 2001 Office Productivity
  • 3DStudio MAX 4.2
  • SPECviewperf 6.1.2
  • Expendable Demo version
  • MadOnion 3DMark 2001
  • idSoftware Quake III Arena v1.30, demo four
  • DroneZmarK

Отметим, что в тестировании были использованы показания еще двух «участников».

Во-первых, Northwood был протестирован на частоте 2 ГГц, для чего мы понизили коэффициент умножения имевшегося у нас разлоченного сэмпла. Таким образом мы получили возможность выяснить чистый эффект от увеличения кэша L2 у процессора на новом ядре.

Во-вторых, имевшийся Willamette 2 ГГц был разогнан до 2,2 ГГц шиной (110 МГц x 20). Это позволяет прояснить «академический» вопрос, что лучше: больше кэша или более быстрая шина, а также сделать некоторые прикидки на будущее, ведь не секрет, что вскоре частота шины Pentium 4 (правда, уже Northwood) вырастет до 133 МГц (533 МГц Quad-Pumped).

Также отметим, что желающие сравнить производительность нового флагмана процессорного рынка от Intel с самой быстрой на текущий момент моделью от AMD могут сопоставить результаты сегодняшнего тестирования с результатами сравнения Willamette 2 ГГц и Athlon XP 1900+. Как только AMD анонсирует свою модель 2000+, мы обязательно сведем ее с Northwood в честном поединке.

Результаты тестирования:

кодирование MP3

Кодирование в MP3 с помощью Lame, как мы уже не раз видели, не слишком чувствительно к пропускной способности памяти. В этом тесте мы можем наблюдать некоторый (3-4%) прирост от увеличившегося у Northwood объема кэша и хорошую (~10%) масштабируемость теста по частоте процессора. Эффект от ускорения шины вроде бы есть, но абсолютная разница в показаниях слишком мала, подождем делать выводы.

кодирование MPEG4

Здесь еще до собственно результатов тестирования процессора обращает на себя внимание выигрыш от использования новой версии кодека DivX, оптимизированной под SSE2. 30-40%! Тут даже комментарии излишни!

Что же до сравнения процессоров на старом и новом ядре, то можно отметить несколько интересных моментов. 7-9% преимущества получает Northwood за счет «чистого» увеличения частоты на 10%, а вот преимущество ускоряемого шиной Willamette более существенное: 10-15%. Некоторый, не слишком значительный эффект имеется от увеличенного кэша у Northwood, причем эффект этот перекрывается повышением частоты шины (разгоняющей, в том числе, и кэш L2). Кстати, обратите внимание на то, что при включении SSE2 разница проявляется более ярко во всех случаях: и при увеличении частоты процессора, и при ускорении шины, и при удвоении объема кэша.

архивирование WinZip

Результаты WinZip напоминают результаты кодирования MP3 и по абсолютным цифрам, и по характеру зависимости. Опять же отметим, что разница в пару секунд не дает возможности делать далеко идущие выводы.

архивирование WinAce

А результаты WinAce, как и следовало ожидать, напоминают результаты кодирования MPEG4 — оба теста агрессивно работают с памятью, но при архивировании WinAce происходит частое обращение к словарю, что и обеспечивает больший (до 8%) выигрыш при прочих равных процессору на ядре Northwood. Очевидно, что если бы в кэш удалось запихнуть весь 4-мегабайтный словарь, ускорение было бы весьма значительным. По частоте же процессора тест масштабируется не очень хорошо, здесь большее влияние оказывает скорость работы с памятью.

Winstones 2001 SYSmark 2001

Картина в обоих «полусинтетических» тестах в общем похожа, из странностей можно отметить только то, что на частоте 2,2 ГГц «честный» Northwood выигрывает у ускоренного шиной Willamette больше, чем на частоте 2 ГГц в равных условиях.

3DStudio MAX 3DStudio MAX

Описание использованных сцен для 3DStudio MAX можно найти в нашем введении к тестированию профессиональных видеокарт, а интересующий нас сейчас результат сравнения процессоров таков: вне зависимости от сложности расчета сцены процессором и сложности прорисовки сцены графическим ускорителем, характер вычислений один и тот же, и ускоряется расчет всех сцен одинаково. В цифрах это выглядит так: на ~9% при увеличении частоты процессора, на ~3% за счет большего кэша, ускорение шины почти никак не сказывается на результате. Как видите, тест этот, что неоднократно нами подчеркивалось, чисто вычислительный, и масштабируется он именно по частоте процессора, слабо завися от скорости памяти и прочих факторов.

SPECviewperf

Со SPECviewperf дело обстоит более интересно, в первую очередь, за счет разнообразия проявленных зависимостей подтестов. AWadvs-04 никаких неожиданностей не приносит, стабильно упирая скорость отрисовки сцены в скорость работы видеоакселератора. Зато DX-06… Казалось бы, ничего странного: производительность системы слегка растет при переходе от 2 к 2,2 ГГц; если при этом ускоряется шина — она растет сильнее. Только вот незадача: имеется очень заметный отрицательный эффект от «лишнего» кэша. Удивительно, но факт: увеличение размера кэша в этом тесте значительно снижает скорость обмена с памятью. Внятных объяснений у нас на данный момент нет, остается лишь констатировать: если вы посвятили свою жизнь работе с IBM Data Explorer — Northwood не для вас.

SPECviewperf

Нынешнее тестирование позволяет нам выявить и разницу между этими двумя тестами, которые обычно демонстрируют сходные зависимости результатов. В DRV-07, как хорошо видно, система почти не получает прироста производительности от простого увеличения частоты процессора, частота же шины (скорее всего, связка память-AGP) на результат влияет весьма прилично. Но этот выигрыш в 8% — ничто, в сравнении с 30-процентным выигрышем 512К L2 Northwood у 256К L2 Willamette. Отложим ненадолго рассмотрение этого артефакта, и обратим свой взор на Light-04. Картина действительно похожа на предыдущую, только без загадочного взлета у Northwood, а в его отсутствие разогнанная шина AGP у Willamette 2,2 ГГц выводит того в лидеры в полном соответствии с данными наших прошлых тестирований: производительность видеоускорителя — прежде всего.

Expendable

Ага, и снова этот взлет! Ну, теперь, опираясь на все тот же опыт, мы с достаточной уверенностью можем сказать: причина — RDRAM. Нами уже неоднократно было отмечено, что Expendable — игра с довольно «хаотичным» алгоритмом, который «сводит с ума» длинный конвейер Pentium 4 и, как видите, сильно напрягает своими «прыжками по памяти» обладающий большой латентностью RDRAM. Увеличенный кэш у Northwood значительно сглаживает этот эффект, и результат налицо. Впрочем, нельзя не учитывать, что в случае использования, например, DDR SDRAM этот артефакт проявился бы менее заметно, так что волшебное ускорение смогут испытать на себе лишь фанаты Expendable (если таковые еще остались — тест-то уже давно просится на свалку) и Rambus одновременно. Еще стоит отметить, что разгон шины в этом тесте, в отличие от SPECviewperf, ускоряет не работу видеоакселератора (нельзя ускорить то, чего нет), а связку процессор-память.

3DMark 2001 Total 3DMark 2001 Games Quake III DroneZ

Все более или менее современные игрушки демонстрируют одну и ту же картину: Northwood за счет большего кэша имеет преимущество в 5%, которое сглаживается до 1-2% при разгоне шины у Willamette. Все это, конечно, справедливо только для тех тестов и разрешений, где от процессора зависит суммарная производительность системы.

Выводы

Подводя итоги, первым делом надо определиться с позицией, с которой будет оцениваться Northwood. К счастью, сегодня мы не стоим на пороге какого-нибудь революционного поворота, неминуемо влекущего за собой смену чипсета и типа системной памяти. Налицо плавный эволюционный процесс, в котором нам отведена лишь роль наблюдателя, а все остальное сделает Intel. Так что расслабимся, и будем получать удовольствие.

Благо, причины быть довольными есть. У нового процессора всего одно преимущество перед старым, но оно реально работает и приносит очень неплохие дивиденды. На одной чаше весов, правда, у нас копеечное превосходство в кодировании с помощью DivX v4.02 и отрицательный прирост в DX-06, но на другой, зато, доходящее до 30% улучшение работы с RDRAM. В среднем же весы показывают +5-8%. И это учитывая, что в чисто процессорных задачах может быть и больше (а для чего еще вы берете топ-модель?).

Впрочем, еще раз напомню, что сравнивать напрямую новое и старое ядро не очень интересно и умно: они все равно не пересекутся в линейке Pentium 4 (точнее, пересекутся лишь один раз, и сравнительные показатели у вас перед глазами), так что выбора не будет. Можно лишь поставить зарубку себе в памяти: Intel не подвел, новый процессор не хуже старого.

Ну а что же с перспективами? Они тоже представляются в радужном свете: в тестах на взаимодействие процессора и памяти получается 10-15% выигрыша на 10-процентное ускорение шины. Преимущество в приложениях, ориентированных на графику, мы принимать во внимание не будем, так как частота AGP и PCI у плат с будущим 133-мегагерцовым процессором очевидно будет «в норме», а вот синхронно работающие на 133 МГц Pentium 4 и DDR266 — это очень заманчиво и очень «результативно», как можно предположить, исходя из показателей Willamette 2,2 ГГц.

Осталось только понять: зачем вам новый процессор?

Дмитрий Майоров (destrax@ixbt.com)
Сергей Пикалов (peek@ixbt.com)
Опубликовано -- 7 января 2002 г.

Hint Site Aport
© Авторские права и копия защищены законом: © Дудкин Александр Константинович, 2002 г.
Копирование любых материалов только с письменного разрешения автора сайта
URL сайта: www.alexishw.mailru.com
Ваши замечания и предложения присылайте по e-mail: alexishw@mailru.com