Intel Pentium 4 «Northwood»: сравнение с предшественником и оценка 
      перспектив
      
   
      Задача оптимального выбора компьютерных комплектующих не имеет, к 
      сожалению, четкого математического решения: слишком много факторов. Обычно 
      используют такой метод: берется прайс-лист, из него 
      выбрасываются крайние позиции (полный отстой и слишком крутые), а из 
      оставшихся выбирается товар с наибольшим приростом узвончения торговых 
      марок и количественного распухания псевдотехнических характеристик на 
      прирост цены. Решение не самое плохое, не будем даже обращать внимание на 
      то, что 256 МБ памяти на борту у GeForce2 MX — это чуть 
      многовато. Подумаем лучше вот о чем: а зачем вообще нужен новый процессор? 
       Действительно, а зачем? Нет, есть, конечно, задачи, которые и 
      N-гигагерцовый Pentium M загрузят по самые 
      верхние регистры, вот только страшно далеки они от народа, и не на их 
      решателей рассчитаны пляски сине-оранжевых человечков в ваших 
      устройствах отображения информации. Нет, разница все еще есть даже при 
      работе в Word, вот только замерять ее все трудней и трудней — 
      не зря же каждое новое поколение бенчмарков выдает итоговый результат в 
      баллах на порядок ниже, чтобы, значит, было куда расти, да и пользователя 
      10,5 балла напрягают куда сильней, чем 1050. 
       Игры… Да, остаются, как всегда, игры, но тут все слишком запущено. 
      Intel тщетно демонстрирует на презентациях трехмерные демки, рассчитанные 
      и показанные силами одного только центрального процессора. Гораздо 
      вероятнее, что какой-нибудь очередной GeForce, уже 
      практически интегрировавший звук, будет заодно и считать физику в игре, а 
      уж с винчестером они договорятся: организуют новый протокол прямого 
      доступа к графической памяти, и зачем им тогда нужны будут процессор с 
      системной памятью — эти пережитки прошлого, ошибочно 
      считавшиеся двигателем прогресса? 
       А бедные, никому не нужные процессоры будут все уменьшаться и 
      ускоряться — пока в один (прекрасный?) день не разлетятся 
      горсткой фотонов. Ну, до этого дня, впрочем, еще далеко. Пока посмотрим, 
      чем нас порадует новый Pentium 4 — глядишь, и блеснет 
      просвет… 
       Новое ядро Pentium 4 «Northwood»
      Для начала, сам герой и его предшественник: 
  
               Intel 
      Pentium 4 «Northwood», 2,2 ГГц, Socket 478 
 
         Intel 
      Pentium 4 «Willamette», 2 ГГц, Socket 478 
      Обратите внимание на нижнюю строчку маркировки: цифры «512» в конце как 
      раз указывают на единственное архитектурное отличие нового процессора от 
      старого — 512 КБ кэша L2 вместо 256 КБ. Впрочем, 
      реализация этого отличия стала возможной лишь вследствие перехода фабрик 
      Intel на 0,13-микронную технологию производства с 
      использованием медных соединений. В результате, на 
      200-миллиметровой пластине умещается вдвое больше кристаллов, 
      чем при производстве по 0,18-микронной технологии. (В 
      дальнейшем же, с переходом на 300-миллиметровые пластины, это 
      количество увеличится еще в 2,5 раза.) Ну а следствием нового техпроцесса 
      станут, совершенно очевидно, более высокая допустимая частота процессоров 
      и пониженное тепловыделение (49,8 Вт TDP у 
      2,2-гигагерцовой версии Northwood против 75 Вт у 
      Willamette 2 ГГц). Любопытно отметить, что процессор на 
      новом ядре содержит 55 миллионов транзисторов (площадь — 
      146 мм2), из которых около 40% (у 
      Willamette 42 миллиона транзисторов, а изменился только объем L2) 
      приходится на кэш — неплохо?! 
        Northwood 2,2 ГГц, работающий на 2 ГГц 
 
   Willamette 2 ГГц 
      Естественно, новое ядро требует новой нагрузочной прямой питания 
      процессора, но здесь никаких проблем для пользователей возникнуть не 
      должно: все материнские платы под Socket 478 проектировались 
      уже в расчете на новые процессоры, их нынешний VRM такую прямую 
      поддерживает, так что в худшем случае вам придется перепрошить БИОС платы. 
      Остается еще упомянуть о том, что процессор с частотой 2 ГГц будет 
      последним в линейке Willamette, линейка же Northwood начнется с 
      2-гигагерцового, так что для различения крайних экземпляров 
      Intel вновь вынужден прибегнуть к индексу «A»: младший Northwood будет 
      официально называться Intel Pentium 4 
      2A ГГц. 
       Исследование производительности
      Тестовый стенд: 
       
        - Процессор Intel Pentium 4 «Willamette», 2 ГГц, Socket 478 
        
 - Процессор Intel Pentium 4 «Northwood», 2,2 ГГц, Socket 478 
        
 - Материнская плата ASUS 
        P4T-E (Intel 850) 
        
 - 2x128 МБ PC800 RDRAM RIMM Samsung 
        
 - ASUS 8200 GeForce3 
        
 - IBM IC35L040AVER07-0, 7200 об/мин, 2 МБ cache, 40 ГБ 
        
 - CD-ROM ASUS 50x 
  
      Программное обеспечение: 
       
        - Windows 2000 Professional SP2 
        
 - NVIDIA Detonator v22.50 (Vsync=Off) 
        
 - RazorLame 1.1.4 + Lame v3.89 codec 
        
 - VirtualDub 1.4.7 + DivX v4.02 & v4.11 codec 
        
 - WinZip 8.0 
        
 - WinAce 2.11 
        
 - eTestingLabs Content Creation Winstone 2001 
        
 - eTestingLabs Business Winstone 2001 
        
 - BAPCo & MadOnion SYSmark 2001 Internet Content Creation 
        
 - BAPCo & MadOnion SYSmark 2001 Office Productivity 
        
 - 3DStudio MAX 4.2 
        
 - SPECviewperf 6.1.2 
        
 - Expendable Demo version 
        
 - MadOnion 3DMark 2001 
        
 - idSoftware Quake III Arena v1.30, demo four 
        
 - DroneZmarK 
  
      Отметим, что в тестировании были использованы показания еще двух 
      «участников». 
       Во-первых, Northwood был протестирован на частоте 2 ГГц, для чего 
      мы понизили коэффициент умножения имевшегося у нас разлоченного сэмпла. 
      Таким образом мы получили возможность выяснить чистый эффект от увеличения 
      кэша L2 у процессора на новом ядре. 
       Во-вторых, имевшийся Willamette 2 ГГц был разогнан до 
      2,2 ГГц шиной (110 МГц x 20). Это позволяет 
      прояснить «академический» вопрос, что лучше: больше кэша или более быстрая 
      шина, а также сделать некоторые прикидки на будущее, ведь не секрет, что 
      вскоре частота шины Pentium 4 (правда, уже Northwood) 
      вырастет до 133 МГц (533 МГц Quad-Pumped). 
       Также отметим, что желающие сравнить производительность нового флагмана 
      процессорного рынка от Intel с самой быстрой на текущий момент моделью от 
      AMD могут сопоставить результаты сегодняшнего тестирования с результатами 
      сравнения 
      Willamette 2 ГГц и Athlon XP 1900+. Как 
      только AMD анонсирует свою модель 2000+, мы обязательно сведем ее с 
      Northwood в честном поединке. 
       Результаты тестирования:
       
      Кодирование в MP3 с помощью Lame, как мы уже не раз видели, не слишком 
      чувствительно к пропускной способности памяти. В этом тесте мы можем 
      наблюдать некоторый (3-4%) прирост от увеличившегося у 
      Northwood объема кэша и хорошую (~10%) масштабируемость теста по частоте 
      процессора. Эффект от ускорения шины вроде бы есть, но абсолютная разница 
      в показаниях слишком мала, подождем делать выводы. 
  
         
      Здесь еще до собственно результатов тестирования процессора обращает на 
      себя внимание выигрыш от использования новой версии кодека DivX, 
      оптимизированной под SSE2. 30-40%! Тут даже комментарии 
      излишни! 
       Что же до сравнения процессоров на старом и новом ядре, то можно 
      отметить несколько интересных моментов. 7-9% преимущества 
      получает Northwood за счет «чистого» увеличения частоты на 10%, а вот 
      преимущество ускоряемого шиной Willamette более существенное: 
      10-15%. Некоторый, не слишком значительный эффект имеется от 
      увеличенного кэша у Northwood, причем эффект этот перекрывается повышением 
      частоты шины (разгоняющей, в том числе, и кэш L2). Кстати, обратите 
      внимание на то, что при включении SSE2 разница проявляется более ярко во 
      всех случаях: и при увеличении частоты процессора, и при ускорении шины, и 
      при удвоении объема кэша. 
  
         
      Результаты WinZip напоминают результаты кодирования MP3 и по абсолютным 
      цифрам, и по характеру зависимости. Опять же отметим, что разница в пару 
      секунд не дает возможности делать далеко идущие выводы. 
  
         
      А результаты WinAce, как и следовало ожидать, напоминают результаты 
      кодирования MPEG4 — оба теста агрессивно работают с памятью, 
      но при архивировании WinAce происходит частое обращение к словарю, что и 
      обеспечивает больший (до 8%) выигрыш при прочих равных процессору на ядре 
      Northwood. Очевидно, что если бы в кэш удалось запихнуть весь 
      4-мегабайтный словарь, ускорение было бы весьма значительным. 
      По частоте же процессора тест масштабируется не очень хорошо, здесь 
      большее влияние оказывает скорость работы с памятью. 
  
           
      
      Картина в обоих «полусинтетических» тестах в общем похожа, из 
      странностей можно отметить только то, что на частоте 2,2 ГГц 
      «честный» Northwood выигрывает у ускоренного шиной Willamette больше, чем 
      на частоте 2 ГГц в равных условиях. 
  
           
      
      Описание использованных сцен для 3DStudio MAX можно найти 
      в нашем введении 
      к тестированию профессиональных видеокарт, а интересующий нас сейчас 
      результат сравнения процессоров таков: вне зависимости от сложности 
      расчета сцены процессором и сложности прорисовки сцены графическим 
      ускорителем, характер вычислений один и тот же, и ускоряется расчет всех 
      сцен одинаково. В цифрах это выглядит так: на ~9% при увеличении частоты 
      процессора, на ~3% за счет большего кэша, ускорение шины почти никак не 
      сказывается на результате. Как видите, тест этот, что неоднократно нами 
      подчеркивалось, чисто вычислительный, и масштабируется он именно по 
      частоте процессора, слабо завися от скорости памяти и прочих факторов. 
      
  
         
      Со SPECviewperf дело обстоит более интересно, в первую очередь, за счет 
      разнообразия проявленных зависимостей подтестов. AWadvs-04 
      никаких неожиданностей не приносит, стабильно упирая скорость отрисовки 
      сцены в скорость работы видеоакселератора. Зато DX-06… 
      Казалось бы, ничего странного: производительность системы слегка растет 
      при переходе от 2 к 2,2 ГГц; если при этом ускоряется шина 
      — она растет сильнее. Только вот незадача: имеется очень заметный 
      отрицательный эффект от «лишнего» кэша. Удивительно, но 
      факт: увеличение размера кэша в этом тесте значительно снижает 
      скорость обмена с памятью. Внятных объяснений у нас на данный момент нет, 
      остается лишь констатировать: если вы посвятили свою жизнь работе с 
      IBM Data Explorer — Northwood не для вас. 
  
         
      Нынешнее тестирование позволяет нам выявить и разницу между этими двумя 
      тестами, которые обычно демонстрируют сходные зависимости результатов. В 
      DRV-07, как хорошо видно, система почти не получает прироста 
      производительности от простого увеличения частоты процессора, частота же 
      шины (скорее всего, связка память-AGP) на результат влияет 
      весьма прилично. Но этот выигрыш в 8% — ничто, в сравнении с 
      30-процентным выигрышем 512К L2 Northwood у 256К L2 
      Willamette. Отложим ненадолго рассмотрение этого артефакта, и обратим свой 
      взор на Light-04. Картина действительно похожа на предыдущую, 
      только без загадочного взлета у Northwood, а в его отсутствие разогнанная 
      шина AGP у Willamette 2,2 ГГц выводит того в лидеры в 
      полном соответствии с данными наших прошлых тестирований: 
      производительность видеоускорителя — прежде всего. 
  
         
      Ага, и снова этот взлет! Ну, теперь, опираясь на все тот же опыт, мы с 
      достаточной уверенностью можем сказать: причина — RDRAM. Нами 
      уже неоднократно было отмечено, что Expendable — игра с 
      довольно «хаотичным» алгоритмом, который «сводит с ума» длинный конвейер 
      Pentium 4 и, как видите, сильно напрягает своими «прыжками по 
      памяти» обладающий большой латентностью RDRAM. Увеличенный кэш у Northwood 
      значительно сглаживает этот эффект, и результат налицо. Впрочем, нельзя не 
      учитывать, что в случае использования, например, DDR SDRAM этот артефакт 
      проявился бы менее заметно, так что волшебное ускорение смогут испытать на 
      себе лишь фанаты Expendable (если таковые еще остались — 
      тест-то уже давно просится на свалку) и Rambus одновременно. 
      Еще стоит отметить, что разгон шины в этом тесте, в отличие от 
      SPECviewperf, ускоряет не работу видеоакселератора (нельзя ускорить то, 
      чего нет), а связку процессор-память. 
  
               
      Все более или менее современные игрушки демонстрируют одну и ту же 
      картину: Northwood за счет большего кэша имеет преимущество в 5%, которое 
      сглаживается до 1-2% при разгоне шины у Willamette. Все это, 
      конечно, справедливо только для тех тестов и разрешений, где от процессора 
      зависит суммарная производительность системы. 
       Выводы
      Подводя итоги, первым делом надо определиться с позицией, с которой 
      будет оцениваться Northwood. К счастью, сегодня мы не стоим на пороге 
      какого-нибудь революционного поворота, неминуемо влекущего за 
      собой смену чипсета и типа системной памяти. Налицо плавный эволюционный 
      процесс, в котором нам отведена лишь роль наблюдателя, а все остальное 
      сделает Intel. Так что расслабимся, и будем получать удовольствие. 
       Благо, причины быть довольными есть. У нового процессора всего одно 
      преимущество перед старым, но оно реально работает и приносит очень 
      неплохие дивиденды. На одной чаше весов, правда, у нас копеечное 
      превосходство в кодировании с помощью DivX v4.02 и 
      отрицательный прирост в DX-06, но на другой, зато, доходящее 
      до 30% улучшение работы с RDRAM. В среднем же весы показывают 
      +5-8%. И это учитывая, что в чисто процессорных задачах может 
      быть и больше (а для чего еще вы берете топ-модель?). 
       Впрочем, еще раз напомню, что сравнивать напрямую новое и старое ядро 
      не очень интересно и умно: они все равно не пересекутся в линейке 
      Pentium 4 (точнее, пересекутся лишь один раз, и сравнительные 
      показатели у вас перед глазами), так что выбора не будет. Можно лишь 
      поставить зарубку себе в памяти: Intel не подвел, новый процессор не хуже 
      старого. 
       Ну а что же с перспективами? Они тоже представляются в радужном свете: 
      в тестах на взаимодействие процессора и памяти получается 
      10-15% выигрыша на 10-процентное ускорение шины. 
      Преимущество в приложениях, ориентированных на графику, мы принимать во 
      внимание не будем, так как частота AGP и PCI у плат с будущим 
      133-мегагерцовым процессором очевидно будет «в норме», а вот 
      синхронно работающие на 133 МГц Pentium 4 и DDR266 
      — это очень заманчиво и очень «результативно», как можно 
      предположить, исходя из показателей Willamette 2,2 ГГц. 
       Осталось только понять: зачем вам новый процессор?
        |