Intel Pentium 4 «Northwood»: сравнение с предшественником и оценка
перспектив
Задача оптимального выбора компьютерных комплектующих не имеет, к
сожалению, четкого математического решения: слишком много факторов. Обычно
используют такой метод: берется прайс-лист, из него
выбрасываются крайние позиции (полный отстой и слишком крутые), а из
оставшихся выбирается товар с наибольшим приростом узвончения торговых
марок и количественного распухания псевдотехнических характеристик на
прирост цены. Решение не самое плохое, не будем даже обращать внимание на
то, что 256 МБ памяти на борту у GeForce2 MX — это чуть
многовато. Подумаем лучше вот о чем: а зачем вообще нужен новый процессор?
Действительно, а зачем? Нет, есть, конечно, задачи, которые и
N-гигагерцовый Pentium M загрузят по самые
верхние регистры, вот только страшно далеки они от народа, и не на их
решателей рассчитаны пляски сине-оранжевых человечков в ваших
устройствах отображения информации. Нет, разница все еще есть даже при
работе в Word, вот только замерять ее все трудней и трудней —
не зря же каждое новое поколение бенчмарков выдает итоговый результат в
баллах на порядок ниже, чтобы, значит, было куда расти, да и пользователя
10,5 балла напрягают куда сильней, чем 1050.
Игры… Да, остаются, как всегда, игры, но тут все слишком запущено.
Intel тщетно демонстрирует на презентациях трехмерные демки, рассчитанные
и показанные силами одного только центрального процессора. Гораздо
вероятнее, что какой-нибудь очередной GeForce, уже
практически интегрировавший звук, будет заодно и считать физику в игре, а
уж с винчестером они договорятся: организуют новый протокол прямого
доступа к графической памяти, и зачем им тогда нужны будут процессор с
системной памятью — эти пережитки прошлого, ошибочно
считавшиеся двигателем прогресса?
А бедные, никому не нужные процессоры будут все уменьшаться и
ускоряться — пока в один (прекрасный?) день не разлетятся
горсткой фотонов. Ну, до этого дня, впрочем, еще далеко. Пока посмотрим,
чем нас порадует новый Pentium 4 — глядишь, и блеснет
просвет…
Новое ядро Pentium 4 «Northwood»
Для начала, сам герой и его предшественник:
Intel
Pentium 4 «Northwood», 2,2 ГГц, Socket 478
Intel
Pentium 4 «Willamette», 2 ГГц, Socket 478
Обратите внимание на нижнюю строчку маркировки: цифры «512» в конце как
раз указывают на единственное архитектурное отличие нового процессора от
старого — 512 КБ кэша L2 вместо 256 КБ. Впрочем,
реализация этого отличия стала возможной лишь вследствие перехода фабрик
Intel на 0,13-микронную технологию производства с
использованием медных соединений. В результате, на
200-миллиметровой пластине умещается вдвое больше кристаллов,
чем при производстве по 0,18-микронной технологии. (В
дальнейшем же, с переходом на 300-миллиметровые пластины, это
количество увеличится еще в 2,5 раза.) Ну а следствием нового техпроцесса
станут, совершенно очевидно, более высокая допустимая частота процессоров
и пониженное тепловыделение (49,8 Вт TDP у
2,2-гигагерцовой версии Northwood против 75 Вт у
Willamette 2 ГГц). Любопытно отметить, что процессор на
новом ядре содержит 55 миллионов транзисторов (площадь —
146 мм2), из которых около 40% (у
Willamette 42 миллиона транзисторов, а изменился только объем L2)
приходится на кэш — неплохо?!
Northwood 2,2 ГГц, работающий на 2 ГГц
Willamette 2 ГГц
Естественно, новое ядро требует новой нагрузочной прямой питания
процессора, но здесь никаких проблем для пользователей возникнуть не
должно: все материнские платы под Socket 478 проектировались
уже в расчете на новые процессоры, их нынешний VRM такую прямую
поддерживает, так что в худшем случае вам придется перепрошить БИОС платы.
Остается еще упомянуть о том, что процессор с частотой 2 ГГц будет
последним в линейке Willamette, линейка же Northwood начнется с
2-гигагерцового, так что для различения крайних экземпляров
Intel вновь вынужден прибегнуть к индексу «A»: младший Northwood будет
официально называться Intel Pentium 4
2A ГГц.
Исследование производительности
Тестовый стенд:
- Процессор Intel Pentium 4 «Willamette», 2 ГГц, Socket 478
- Процессор Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478
- Материнская плата ASUS
P4T-E (Intel 850)
- 2x128 МБ PC800 RDRAM RIMM Samsung
- ASUS 8200 GeForce3
- IBM IC35L040AVER07-0, 7200 об/мин, 2 МБ cache, 40 ГБ
- CD-ROM ASUS 50x
Программное обеспечение:
- Windows 2000 Professional SP2
- NVIDIA Detonator v22.50 (Vsync=Off)
- RazorLame 1.1.4 + Lame v3.89 codec
- VirtualDub 1.4.7 + DivX v4.02 & v4.11 codec
- WinZip 8.0
- WinAce 2.11
- eTestingLabs Content Creation Winstone 2001
- eTestingLabs Business Winstone 2001
- BAPCo & MadOnion SYSmark 2001 Internet Content Creation
- BAPCo & MadOnion SYSmark 2001 Office Productivity
- 3DStudio MAX 4.2
- SPECviewperf 6.1.2
- Expendable Demo version
- MadOnion 3DMark 2001
- idSoftware Quake III Arena v1.30, demo four
- DroneZmarK
Отметим, что в тестировании были использованы показания еще двух
«участников».
Во-первых, Northwood был протестирован на частоте 2 ГГц, для чего
мы понизили коэффициент умножения имевшегося у нас разлоченного сэмпла.
Таким образом мы получили возможность выяснить чистый эффект от увеличения
кэша L2 у процессора на новом ядре.
Во-вторых, имевшийся Willamette 2 ГГц был разогнан до
2,2 ГГц шиной (110 МГц x 20). Это позволяет
прояснить «академический» вопрос, что лучше: больше кэша или более быстрая
шина, а также сделать некоторые прикидки на будущее, ведь не секрет, что
вскоре частота шины Pentium 4 (правда, уже Northwood)
вырастет до 133 МГц (533 МГц Quad-Pumped).
Также отметим, что желающие сравнить производительность нового флагмана
процессорного рынка от Intel с самой быстрой на текущий момент моделью от
AMD могут сопоставить результаты сегодняшнего тестирования с результатами
сравнения
Willamette 2 ГГц и Athlon XP 1900+. Как
только AMD анонсирует свою модель 2000+, мы обязательно сведем ее с
Northwood в честном поединке.
Результаты тестирования:
Кодирование в MP3 с помощью Lame, как мы уже не раз видели, не слишком
чувствительно к пропускной способности памяти. В этом тесте мы можем
наблюдать некоторый (3-4%) прирост от увеличившегося у
Northwood объема кэша и хорошую (~10%) масштабируемость теста по частоте
процессора. Эффект от ускорения шины вроде бы есть, но абсолютная разница
в показаниях слишком мала, подождем делать выводы.
Здесь еще до собственно результатов тестирования процессора обращает на
себя внимание выигрыш от использования новой версии кодека DivX,
оптимизированной под SSE2. 30-40%! Тут даже комментарии
излишни!
Что же до сравнения процессоров на старом и новом ядре, то можно
отметить несколько интересных моментов. 7-9% преимущества
получает Northwood за счет «чистого» увеличения частоты на 10%, а вот
преимущество ускоряемого шиной Willamette более существенное:
10-15%. Некоторый, не слишком значительный эффект имеется от
увеличенного кэша у Northwood, причем эффект этот перекрывается повышением
частоты шины (разгоняющей, в том числе, и кэш L2). Кстати, обратите
внимание на то, что при включении SSE2 разница проявляется более ярко во
всех случаях: и при увеличении частоты процессора, и при ускорении шины, и
при удвоении объема кэша.
Результаты WinZip напоминают результаты кодирования MP3 и по абсолютным
цифрам, и по характеру зависимости. Опять же отметим, что разница в пару
секунд не дает возможности делать далеко идущие выводы.
А результаты WinAce, как и следовало ожидать, напоминают результаты
кодирования MPEG4 — оба теста агрессивно работают с памятью,
но при архивировании WinAce происходит частое обращение к словарю, что и
обеспечивает больший (до 8%) выигрыш при прочих равных процессору на ядре
Northwood. Очевидно, что если бы в кэш удалось запихнуть весь
4-мегабайтный словарь, ускорение было бы весьма значительным.
По частоте же процессора тест масштабируется не очень хорошо, здесь
большее влияние оказывает скорость работы с памятью.
Картина в обоих «полусинтетических» тестах в общем похожа, из
странностей можно отметить только то, что на частоте 2,2 ГГц
«честный» Northwood выигрывает у ускоренного шиной Willamette больше, чем
на частоте 2 ГГц в равных условиях.
Описание использованных сцен для 3DStudio MAX можно найти
в нашем введении
к тестированию профессиональных видеокарт, а интересующий нас сейчас
результат сравнения процессоров таков: вне зависимости от сложности
расчета сцены процессором и сложности прорисовки сцены графическим
ускорителем, характер вычислений один и тот же, и ускоряется расчет всех
сцен одинаково. В цифрах это выглядит так: на ~9% при увеличении частоты
процессора, на ~3% за счет большего кэша, ускорение шины почти никак не
сказывается на результате. Как видите, тест этот, что неоднократно нами
подчеркивалось, чисто вычислительный, и масштабируется он именно по
частоте процессора, слабо завися от скорости памяти и прочих факторов.
Со SPECviewperf дело обстоит более интересно, в первую очередь, за счет
разнообразия проявленных зависимостей подтестов. AWadvs-04
никаких неожиданностей не приносит, стабильно упирая скорость отрисовки
сцены в скорость работы видеоакселератора. Зато DX-06…
Казалось бы, ничего странного: производительность системы слегка растет
при переходе от 2 к 2,2 ГГц; если при этом ускоряется шина
— она растет сильнее. Только вот незадача: имеется очень заметный
отрицательный эффект от «лишнего» кэша. Удивительно, но
факт: увеличение размера кэша в этом тесте значительно снижает
скорость обмена с памятью. Внятных объяснений у нас на данный момент нет,
остается лишь констатировать: если вы посвятили свою жизнь работе с
IBM Data Explorer — Northwood не для вас.
Нынешнее тестирование позволяет нам выявить и разницу между этими двумя
тестами, которые обычно демонстрируют сходные зависимости результатов. В
DRV-07, как хорошо видно, система почти не получает прироста
производительности от простого увеличения частоты процессора, частота же
шины (скорее всего, связка память-AGP) на результат влияет
весьма прилично. Но этот выигрыш в 8% — ничто, в сравнении с
30-процентным выигрышем 512К L2 Northwood у 256К L2
Willamette. Отложим ненадолго рассмотрение этого артефакта, и обратим свой
взор на Light-04. Картина действительно похожа на предыдущую,
только без загадочного взлета у Northwood, а в его отсутствие разогнанная
шина AGP у Willamette 2,2 ГГц выводит того в лидеры в
полном соответствии с данными наших прошлых тестирований:
производительность видеоускорителя — прежде всего.
Ага, и снова этот взлет! Ну, теперь, опираясь на все тот же опыт, мы с
достаточной уверенностью можем сказать: причина — RDRAM. Нами
уже неоднократно было отмечено, что Expendable — игра с
довольно «хаотичным» алгоритмом, который «сводит с ума» длинный конвейер
Pentium 4 и, как видите, сильно напрягает своими «прыжками по
памяти» обладающий большой латентностью RDRAM. Увеличенный кэш у Northwood
значительно сглаживает этот эффект, и результат налицо. Впрочем, нельзя не
учитывать, что в случае использования, например, DDR SDRAM этот артефакт
проявился бы менее заметно, так что волшебное ускорение смогут испытать на
себе лишь фанаты Expendable (если таковые еще остались —
тест-то уже давно просится на свалку) и Rambus одновременно.
Еще стоит отметить, что разгон шины в этом тесте, в отличие от
SPECviewperf, ускоряет не работу видеоакселератора (нельзя ускорить то,
чего нет), а связку процессор-память.
Все более или менее современные игрушки демонстрируют одну и ту же
картину: Northwood за счет большего кэша имеет преимущество в 5%, которое
сглаживается до 1-2% при разгоне шины у Willamette. Все это,
конечно, справедливо только для тех тестов и разрешений, где от процессора
зависит суммарная производительность системы.
Выводы
Подводя итоги, первым делом надо определиться с позицией, с которой
будет оцениваться Northwood. К счастью, сегодня мы не стоим на пороге
какого-нибудь революционного поворота, неминуемо влекущего за
собой смену чипсета и типа системной памяти. Налицо плавный эволюционный
процесс, в котором нам отведена лишь роль наблюдателя, а все остальное
сделает Intel. Так что расслабимся, и будем получать удовольствие.
Благо, причины быть довольными есть. У нового процессора всего одно
преимущество перед старым, но оно реально работает и приносит очень
неплохие дивиденды. На одной чаше весов, правда, у нас копеечное
превосходство в кодировании с помощью DivX v4.02 и
отрицательный прирост в DX-06, но на другой, зато, доходящее
до 30% улучшение работы с RDRAM. В среднем же весы показывают
+5-8%. И это учитывая, что в чисто процессорных задачах может
быть и больше (а для чего еще вы берете топ-модель?).
Впрочем, еще раз напомню, что сравнивать напрямую новое и старое ядро
не очень интересно и умно: они все равно не пересекутся в линейке
Pentium 4 (точнее, пересекутся лишь один раз, и сравнительные
показатели у вас перед глазами), так что выбора не будет. Можно лишь
поставить зарубку себе в памяти: Intel не подвел, новый процессор не хуже
старого.
Ну а что же с перспективами? Они тоже представляются в радужном свете:
в тестах на взаимодействие процессора и памяти получается
10-15% выигрыша на 10-процентное ускорение шины.
Преимущество в приложениях, ориентированных на графику, мы принимать во
внимание не будем, так как частота AGP и PCI у плат с будущим
133-мегагерцовым процессором очевидно будет «в норме», а вот
синхронно работающие на 133 МГц Pentium 4 и DDR266
— это очень заманчиво и очень «результативно», как можно
предположить, исходя из показателей Willamette 2,2 ГГц.
Осталось только понять: зачем вам новый процессор?
|