Тестирование компьютерных комплектующих происходит по уже установившемуся ритуалу. После изучения документации и сборки новой системы производится первое включение. Сразу входим в BIOS Setup — надо проверить, все ли устройства работают в штатном режиме, на нужных частотах и питаются предусмотренными напряжениями. Затем в течение 10 мин на экране остается PC Health Status или нечто аналогичное — следует убедиться, что система нормально «держит» температурный режим, ведь современная микропроцессорная техника выделяет очень много тепла, поэтому выход ее из строя из-за перегрева вполне вероятен.
На этом этапе тестирования нового 3-ГГц процессора Intel с ядром Prescott нас подстерегала первая неприятная неожиданность — температура процессора плавно повышалась, пока не достигла значения 80 ?С. Пришлось выключать компьютер, снимать радиатор с процессора и менять термопасту. Результат не изменился. Но ведь протестированный ранее процессор Pentium 4 с ядром Northwood работал нормально — его температура на той же тактовой частоте не превышала 46 ?С. Значит, проблема не в теплоотводе.
Ну что ж, попробуем продолжить испытания. На этот раз оставляем компьютер на полтора часа в BIOS Setup — ничего страшного не происходит. Загружаем ОС Windows XP и запускаем первый комплексный тест. Создается впечатление, что при нагрузке процессор сбрасывает тактовую частоту, что, в принципе, правильно — если температура переходит за определенную границу, то для предотвращения выхода процессора из строя тактовая частота принудительно понижается. Конечно, доверять результатам тестов, проведенных в этом режиме, нельзя, ведь неизвестно, на какой частоте работал процессор на самом деле. Принимаем решение убавить напряжение питания ядра на 5% ниже номинала — наш процессор рассчитан на частоту 3,2 ГГц, а для корректного сравнения с Northwood нужны 3 ГГц, поэтому снижение напряжения при одновременном уменьшении тактовой частоты не отразится на работоспособности процессора.
Итак, напряжение питания ядра снижено с 1,3875 до 1,3250 В, при этом температура кристалла опустилась до приемлемых 67 ?С. Кстати, несмотря на то, что при увеличении тактовой частоты до 3,2 ГГц температура поднялась до 72 ?С, процессор сохранил работоспособность.
Теперь несколько слов о конфигурации тестовой платформы. В качестве центрального процессора был использован 3,2-ГГц Intel Pentium 4 (Prescott), допускающий работу на частотах 2,8 и 3,0 ГГц, 512-Мбайт ОЗУ DDR SDRAM PC-3200 (два модуля по 256 Мбайт), системная плата Gigabyte GA-8KNXP Ultra, видеоплата ATI Radeon 9800 XT и ОС Windows XP Professional SP1. Для сравнения были взяты результаты испытаний, выполненных на основе той же системы с 3-ГГц процессором Pentium 4 на ядре Northwood и двух компьютеров на базе процессоров AMD: Athlon 64 3200+ с видеоплатой nVidia GeForce FX 5900 Ultra и Athlon XP 2700+ с видеоплатой GeForce4 Ti 4200.
Все тесты можно подразделить на синтетические и реальные — измерение времени работы конкретных приложений. Первые призваны оценить производительность целочисленного ядра и вычислений с плавающей точкой, скорость обмена с памятью (причем по нескольким показателям), работу блока управления и предсказания переходов, т.е. «разложить все по полочкам». Испытания в реальных приложениях, напротив, позволяют «собрать все вместе», оценив производительность системы применительно к конкретному классу задач, хотя эта оценка порой бывает весьма субъективна.
Скорость обработки больших объемов данных слабо зависит от тех или иных качеств процессора, гораздо существеннее сказываются на ней свойства самой памяти.
На графике скорости последовательного доступа можно заметить одну интересную особенность для «перегревающегося» процессора. Данные снимались сериями по восемь точек (длительность серии 10 с), между которыми были паузы продолжительностью 1,25 с для отображения фрагмента графика на экране. Можно заметить, что по мере продвижения к концу серии процессор «сбрасывал обороты», затем, во время паузы, полностью восстанавливал свой потенциал. А вот при выполнении коротких циклов, используемых для вычисления последовательности псевдослучайных чисел, новое ядро стало работать заметно быстрее, хотя при увеличении длины конвейера результат должен быть противоположным. Отсюда можно сделать вывод, что высказанное ранее в нашем журнале («Мир ПК», № 11/02, c. 20—34) предположение об ошибке в блоке предсказания ветвлений скорее всего оказалось верным, а теперь, в новом ядре, эта ошибка исправлена, хотя до производительности процессоров AMD пока еще довольно далеко. Это же качество проявляется и при построении фрактала Мандельбротта, где используются итерационные вычисления, хотя для фрактала Жюлиа этого не наблюдается — пример того, что сходные тесты могут давать совершенно разные результаты. В данном случае различие обусловлено тем, что фрактал Мандельбротта вычисляется сильно оптимизированной ассемблерной программой, а Жюлиа — программой, написанной на Паскале без оптимизации (кстати, различие во времени построения примерно на порядок говорит само за себя).
Быстродействующий датчик псевдослучайных чисел использовался для определения скорости произвольного доступа к памяти, при этом вычислялся адрес следующего читаемого или записываемого байта.
Здесь можно отметить, что с точки зрения последовательного доступа быстрее работает Intel, а произвольного — AMD. Что же касается стандартных тестов производительности (как целочисленных, так и с плавающей точкой), то новое ядро Pentium 4 слегка отстает от старого — все в соответствии с теорией. Отставание же от процессоров AMD еще более значительно.
Измерение скорости компрессии и декомпрессии было проведено на примере «псевдотекста», сгенерированного на основе статистики частоты встречаемости последовательностей длиной в три символа в текстах на русском языке суммарным объемом около 100 Мбайт. Наиболее ресурсоемкая часть алгоритма — поиск подстроки в строке — была написана на ассемблере. В этом тесте новое ядро также несколько проигрывает старому и почти вдвое — различным вариантам Athlon. А вот при компрессии и декомпрессии процессоры Intel практически догнали конкурентов.
Интересны результаты теста PassMark: по общей производительности ядра Pentium оказались полностью идентичны, но в то же время вычисления с плавающей точкой на Northwood выполняются втрое медленнее, причем последнее обстоятельство другими тестами не подтверждается. Здесь опять-таки проявляется специфика конкретной программы.
К сожалению, это встречается не только в прикладных программах, но и в тестах, определяющих общую производительность компьютера. Конечно, разработчикам хочется получить в своей программе максимальные цифры, но как можно говорить об объективности результатов, если, скажем, в них фигурируют показатели, полученные с использованием SSE2, но нет никакого упоминания о 3DNow!
Понятно, что такие тесты пригодны только для сравнения процессоров на базе одной платформы, но и они неумолимо показывают, что 3,2-ГГц Prescott явно уступает Northwood с частотой 3,0 ГГц.
Впрочем, даже в результатах, получаемых тестовыми программами одного производителя, встречаются разночтения. Например, 3Dmark 2003 компании FutureMark показывает незначительное превосходство Prescott над Northwood, а PCMark 2002 — наоборот. Впрочем, пожалуй, здесь дело в различии используемых приложений.
Большинство игровых тестов не отдает предпочтения тому или иному ядру процессоров Intel. По-видимому, недостатки ядра и увеличение объема кэш-памяти в данном случае как раз компенсируют друг друга. Примечательно, что по результатам тестов, использующих DirectX, процессоры Intel попали как раз между Athlon FX и Athlon XP, а с использованием OpenGL — уступили им обоим (за исключением разрешения 1600x1200 точек, где видеоплата nVidia GeForce4 Ti 4200 уже явно не справляется с возросшей нагрузкой). Тот факт, что для большинства тестов частота кадров не зависит от разрешения, говорит о том, что производительность видеоплат избыточна, а соревноваться между собой приходится именно процессорам.
При сжатии мультимедийных данных новый процессор имеет некоторое преимущество над старым за счет большего объема кэш-памяти, интенсивно используемой при работе с потоковыми данными. Исключение составляет только «пережатие» аудиопотока в наиболее ресурсоемком варианте — в этом случае влияние производительности ядра начинает преобладать. Кстати, двукратное отставание Athlon XP от процессоров верхнего уровня (к которому относятся Athlon-64 и Prescott) при сжатии видео связано именно с вчетверо меньшим объемом кэш-памяти.
К сожалению, далеко не все задачи могут быть решены даже самыми мощными вычислительными системами в реальном времени. Для их выполнения обычно используется фоновый режим, а время исчисляется часами, сутками или даже месяцами. К наиболее распространенным из них относятся научные вычисления, обрабатывающие большие массивы данных. Очевидно, что для каждой такой задачи существует оптимальное соотношение между производительностью ядра, объемом и скоростью кэш-памяти.
В заключение проиллюстрируем производительность различных систем на примере теста, подготовленного редакцией журнала PC World — PC WorldBench 4. Для подавляющего числа приложений процессор на новом ядре показал либо немного большую, либо почти такую же производительность, как и Northwood.
* * *
Итак, сделан еще один шаг на пути, указанном Гордоном Муром, — выпущен первый процессор по проектным нормам 0,09 мкм. Результаты отчасти разочаровывают: резко увеличилось тепловыделение, тесты не показывают заметного роста производительности, причем значительная доля из них вообще говорит о снижении вычислительной мощи. Но не все так плохо — реальные приложения, в отличие от тестов, оказываются более чувствительными к увеличению объема кэш-памяти, чем к снижению мощности ядра. Вместе с тем простому пользователю ПК не стоит спешить с переходом на новую технологию. Во-первых, эффект от увеличения объема кэш-памяти в значительной степени нивелируется снизившейся производительностью ядра. Во-вторых, вместо традиционного для перехода на более «тонкую» технологию уменьшения тепловыделения, последнее, наоборот, возросло. В-третьих, потребляемая Prescott мощность оказалась больше, чем было предусмотрено, поэтому многие системные платы, для которых заявлена поддержка этого процессора, могут просто не запуститься. Так что целесообразнее подождать, когда будет отработана технология, увеличатся тактовые частоты, снизятся потребляемые токи и появятся новые системные платы. Тем более что самым производительным процессором компании Intel по-прежнему остается Pentium 4 XE (Northwood).
Редакция выражает благодарность российскому представительству компаний Intel (www.intel.ru) и Gigabyte (www.gigabyte.ru) за предоставленное для проведения тестирования оборудование.