Если не считать небольших отклонений от генеральной линии, выпуск каждого нового процессора всегда сопровождался введением очередного стандарта на процессорный разъем. Pentium ассоциируется в первую очередь с Socket 7, Pentium II — со Slot-1, Pentium III — с FCPGA 370. Нет, были, конечно, и исключения, но, как правило, для одного процессора использовалось не более двух различных конструктивов.
Pentium 4 начал свою историю в корпусе, имеющем 423 ножки, затем их количество увеличилось до 478. А недавно Intel вообще решила отказаться от ножек на процессоре. Точнее, заменить их контактными площадками, а подпружиненные контакты, напоминающие крючки, разместить в процессорном разъеме. Такое гнездо получило название Socket T, а количество контактов увеличилось до 775. Таким образом, по количеству контактов 32-разрядные процессоры Intel обошли Athlon 64 компании AMD (754). Кстати, не исключено, что некоторый «запас» контактов предусмотрен Intel именно для плавного перехода на 64-разрядную архитектуру, уже запланированную в серверных моделях x86.
Впрочем, список новинок, приготовленных Intel этим летом, далеко не исчерпан. Сразу после процессоров следует упомянуть и о новых наборах микросхем (НМС) Intel 82925 и Intel 82915. Эти микросхемы системной логики поддерживают два типа памяти — DDR и DDR2, а также шину PCI Express. Последнюю, правда, называть шиной не совсем корректно, так как к каждому каналу может быть подключено единственное устройство. Зато она допускает масштабирование, т.е. обмен с единственным устройством по нескольким каналам одновременно. В настоящее время предполагается, что для подключения графической системы вместо AGP будет использоваться 16-канальная, а для остальных устройств (вместо PCI) — одноканальная PCI Express.
Правда, с гнездами для новых стандартов дела обстоят не слишком благополучно. Если PCXx1 трудно с чем-нибудь перепутать, они ниже, тоньше и короче гнезд PCI, то PCXx16 по длине практически в точности совпадает с AGP, что не очень хорошо. Было бы это гнездо на 2 мм короче — плату AGP в него нельзя было бы вставить, а на 2 мм длиннее — была бы заметна на глаз разница в длине. Разъемы для модулей памяти DDR2 также в точности повторяют своих собратьев для DDR, за исключением смещенной на 2 мм прорези-ключа. Не слишком хорошее решение для любителей применять силу при сборке компьютеров. А учитывая, что немалую часть компьютерных корпусов, поставляемых к нам из большой дружественной страны, иначе не соберешь, все это чревато массой досадных недоразумений. Или так разработчики стандартов решили бороться с кустарной сборкой?
Объявлено и еще об одном новшестве от Intel — эта фирма планирует отказаться от маркировки процессоров по тактовой частоте и перейти к трехзначным числовым идентификаторам. Предположительно рассматриваемые в этой статье процессоры по новой системе должны будут называться 760 и 560 соответственно. Пока, правда, ни на корпусе, ни в информации, возвращаемой процессором на программный запрос, этих индексов не содержится.
При проведении тестовых испытаний использовался компьютер в следующей конфигурации: центральный процессор — 3,4-ГГц Intel Pentium 4 XE (Northwood) или 3,6-ГГц Intel Pentium 4 (Prescott), 1024-Мбайт ОЗУ типа DDR2 SDRAM 533 МГц CL4 (два модуля по 512 Мбайт), системная плата — Intel Desktop Board D925XCV, видеосистема — Albatron GeForce PCX PC5750, 250-Гбайт жесткий диск Maxtor SATA-150 7200 об/мин, дисковод CD-ROM — Lite On LTN483L 48x, БП VT-420LD (400 Вт), ОС Windows XP SP1.
Для удобства сравнения результатов в большей части таблиц приведены данные по 3,2-ГГц процессору Intel Pentium 4 Prescott на системной плате Asus, базирующейся на НМС 82875 с памятью типа DDR400, а также по процессору Athlon 64 FX-51 на системной плате Asus с НМС nForce-3 с тем же типом памяти либо Athlon 64 3200+ на системной плате Gigabyte.
Скорость последовательного доступа |
Первое, что бросается в глаза, — существенно различающаяся температура процессоров в состоянии покоя: 49 оС у Northwood и 63 оС у Prescott. Измерения проводились при работе BIOS Setup, т.е. когда логический блок был занят опросом клавиатуры и температурных датчиков, а блоки целочисленной арифметики, арифметики с плавающей точкой, MMX, SSE/SSE2/SSE3, а также кэш-память второго уровня простаивали. На процессоре был установлен фирменный теплоотвод Intel, подключаемый к плате четырьмя проводами, частота вращения вентилятора которого в процессе измерений не доходила даже до 2000 об/мин. Так что перегрев из-за маломощности теплооотвода можно сразу исключить. Просто процессоры Prescott изначально предназначены для работы с более высокими температурами, что, кстати, уменьшает нежелательные эффекты от постоянных тепловых деформаций процессора при изменении нагрузки.
По скорости обмена при последовательном доступе к оперативной памяти практически безраздельно господствует наиболее высокочастотный процессор. В таблице приведены данные для массивов объемом 16 Мбайт и различных способов обмена. А на графике отражена зависимость скорости пересылки от объема массивов. Этот график очень хорошо иллюстрирует расстановку сил. С увеличением объема кэш-памяти увеличивается ее латентность (время доступа), поэтому как в пределах L1, так и в пределах L2 Northwood незначительно опережает Prescott. Зато при объемах массивов, помещающихся в кэш одного процессора и не помещающихся в кэш другого, скорость обмена различается в несколько раз. И чаще всего на итоговую производительность в реальных приложениях влияет именно последняя разница. Отчетливо видно наличие двухмегабайтовой кэш-памяти процессора XE. Но самое любопытное заключается в том, как процессоры обмениваются данными с основным объемом оперативной памяти. Мы видим, что здесь лидирует Prescott 3600, в то время как Northwood 3400 и Prescott 3200 отстают от него, показывая примерно равную производительность. И это заслуживает внимания, так как первый и второй процессоры работают с DDR2-533, а третий — только с DDR-400. Отсюда можно сделать вывод, что Prescott при последовательном доступе к памяти взаимодействует с последней заметно эффективнее, чем его предшественник. Что касается процессора AMD, то его кэш-память работает на частоте, в полтора раза уступающей частоте процессора Intel, поэтому отставание закономерно. Для кэш-памяти L2 ситуация усугубляется тем, что если у Intel объем L1 поглощается L2 — а это позволяет вчетверо увеличить ширину межкэшевой шины, — то у AMD L2 непосредственно передает данные ядру, минуя L1, из-за чего ширина шины данных оказывается лимитированной. Что же касается обмена с основным объемом памяти, то здесь процессор AMD отстает от своего собрата производства Intel. Но это неспроста.
Рассмотрим противоположность последовательному доступу — доступ произвольный. Сразу можно сказать, что здесь Athlon 64 является бесспорным лидером, обгоняя Pentium даже при работе с существенно более быстрым типом памяти. Ничего удивительного в этом нет. Специфика работы динамической памяти такова, что высокая скорость обмена достигается только при пересылке длинных пакетов данных. При увеличении длины пакета возрастает скорость последовательного доступа и снижается — произвольного, а при уменьшении — наоборот. Очевидно, пакеты данных, пересылаемые процессором AMD, короче, чем у Intel. Из сравнения процессоров Intel между собой можно заключить, что в пределах кэш-памяти Prescott работает быстрее Northwood, а за ее пределами скорость в основном определяется свойствами самой памяти.
Скорость произвольного доступа по чтению |
В синтетических тестах с переменным успехом соревнуются Northwood XE 3400 и Prescott 3600, показывая в среднем примерно одинаковую производительность. Целочисленные вычисления и сортировку, правда, быстрее выполняет Northwood за счет более короткого конвейера. Зато у Prescott лучше работает блок предсказания ветвлений, благодаря чему получается выигрыш при генерации псевдослучайных чисел и вычислении фрактала Мандельброта. Аналогичные результаты показывает и SiSoft Sandra. В индекс PassMark входит также производительность видеосистемы, поэтому не следует удивляться не слишком высоким результатам новых процессоров.
Конечно, в приложениях, интенсивно использующих 3D-графику, сравнение систем с различными видеоадаптерами некорректно, но две системы вполне можно сравнить между собой, а также кое-как соотнести их результаты с другими при низком экранном разрешении, когда видеоплата работает в режиме недогрузки. С точки зрения как программы 3DMark03, так и игровых приложений небольшое преимущество (до 3%) имеет процессор eXtreme Edition. Собственно, для этих приложений он и оптимизирован. Здесь огромную роль играет наличие кэш-памяти третьего уровня объемом 2 Мбайт. Впрочем, есть и еще одно соображение. Приложения 3D-графики, как правило, подвергаются очень серьезной оптимизации, при этом зачастую оптимизации под конкретное «железо». Если в качестве образца для оптимизации выступал процессор Northwood (как самый массовый процессор во время написания этих программ), то на других процессорах, будь то Pentium Prescott или Athlon, приложения будут работать в режиме, далеком от оптимального. Впрочем, проверить это никак нельзя.
При сжатии видео с небольшим отрывом лидировал более высокочастотный Prescott, а вот работа с аудио лидера так и не выявила.
Для оценки производительности в современных профессиональных приложениях был использован тест SysMark 2004. Он использует для своей работы следующий набор приложений: Adobe Acrobat 5.0.5, Adobe After Effects 5.5, Abode Photoshop 7.01, Adobe Premiere 6.5, Discreet 3DStudioMax 5.1, Macromedia Dreamweaver MX, Macromedia Flash MX, Microsoft Access 2002, Microsoft Excel 2002, Microsoft Internet Explorer 6, Microsoft Outlook 2002, Microsoft PowerPoint 2002, Microsoft Word 2002, Microsoft Windows Media Encoder 9 series, Network Associates McAfee VirusScan 7.0, ScanSoft Dragon NaturallySpeaking 6 Preferred, WinZip Computing WinZip 8.1.
При этом приложения запускаются по определенному сценарию, предусматривающему, в частности, многозадачный режим работы. Оценка выполняется по двум характерным наборам задач — для работы в офисе и для создания веб-контента. В первом случае небольшое преимущество продемонстрировал eXtreme Edition, во втором со значительным отрывом победил более высокочастотный процессор.
С момента своего возникновения около 50 лет назад самые мощные компьютеры использовались для решения научных задач. А примерно 20 лет назад такие задачи стали по зубам и персональным компьютерам. И первые тесты производительности также были написаны с точки зрения научных вычислений.
Сегодня же мы рассматриваем процессоры, работающие на наивысших частотах, а также претендующие на звание самых производительных процессоров для персональных компьютеров и рабочих станций. Поэтому будет вполне логично, если особое внимание мы уделим научным задачам. Тем более что в нашей стране подавляющее большинство научных расчетов выполняется именно на персоналках. Еще одной особенностью многих научных задач является их масштабируемость, которая в свою очередь позволяет исследовать зависимость производительности вычислительной системы от объема обрабатываемых данных.
Наиболее известным является классический тест Донгарра — решение системы линейных уравнений. Сегодня, правда, в связи с феноменальным прогрессом вычислительной техники за последние десятилетия он измеряет уже не столько производительность вычислений, сколько скорость обмена с памятью. Для массивов, не превосходящих по объему 4 Мбайт, безраздельно и убедительно господствует eXtreme Edition. При б?ольших объемах данных, однако, вперед вырывается новый процессор Intel — Prescott. Все-таки сочетание нового процессора с новым разъемом, новым НМС и новым типом памяти дает о себе знать — в связке этот набор работает эффективнее.
Производительность при решении системы линейных уравнений |
При решении системы дифференциальных уравнений eXtreme Edition лидирует среди своих собратьев с солидным отрывом, но заметно уступает процессору AMD. При объеме массивов более 5 Мбайт, правда, лидерство Athlon сходит на нет, но нельзя забывать, что последний работает с памятью DDR400, тогда как основные его конкуренты — с DDR2-533.
Производительность при решении системы дифферренциальных уравнений |
При интенсивных вычислениях с плавающей точкой наилучшим образом показал себя самый высокочастотный процессор Intel. Однако различие в результатах, демонстрируемых рассмотренными процессорами, невелико.
Производительность при научных вычислениях с плавающей точкой |
При целочисленных же вычислениях с массивами до 20 Мбайт лучше справляется eXtreme Edition, тогда как с б?ольшими объемами памяти лучше работает Prescott. Правда, их заметно опережает Athlon 64 FX, который, кстати, работает с более медленной памятью.
Производительность в научных вычислениях в целых числах |
Итак, в целом можно сказать, что соревнование не выявило явного лидера. Новый высокочастотный процессор эффективнее работает с новым НМС и новым типом памяти, чем прежний. В то же время, если из всего потока данных удается вычленить некоторое подмножество наиболее часто используемых (например, при обработке 3D-графики), то преимущество оказывается на стороне процессора, оснащенного кэш-памятью третьего уровня.
Что же касается наиболее мощных процессоров AMD, редакция обещает познакомить читателей с результатами их тестирования в одном из ближайших номеров.
Редакция благодарит российские представительства компаний Intel и AMD за предоставленное для проведения тестирования оборудование.
Процессоры Intel Pentium 4
Первый процессор Intel Pentium 4 был представлен в январе 2000 г., но реальные поставки начались только к концу последнего года ушедшего тысячелетия. Тактовая частота процессора (1400 МГц) более чем в полтора раза превосходила тактовую частоту Pentium III (850 МГц), но по уровню производительности на существующих приложениях эти процессоры различались незначительно. Впервые в истории вычислительной техники при смене поколений процессоров произошло не увеличение, а уменьшение количества инструкций, выполняемых за один такт. В маркетинговом плане этот шаг полностью себя оправдал, так как позволил достичь примерно в полтора раза более высоких тактовых частот при тех же технологических нормах и практически при той же производительности процессора. Однако вскоре процессоры Pentium 4 заняли свыше трех четвертей рынка и под них стали оптимизировать программы, в результате чего пострадали Pentium III и Athlon. Одновременно программная индустрия откликнулась на расширение набора инструкций, примененное в Pentium 4, — SSE2.
Темпы повышения производительности процессоров оказались явно выше темпов увеличения частоты оперативной памяти, в связи с чем все большее значение стала приобретать кэш-память. Да и объем последней с каждым переходом на новую технологию удваивался. Но кэш-память работает на полной частоте процессора, поэтому чем выше частота, тем быстрее кэш-память, а чем быстрее кэш-память, тем выше производительность.
Сегодня различие в скоростях работы процессора и памяти таково, что на результирующую скорость системы большее влияние оказывает именно скорость обмена с различными уровнями памяти, включая кэш, а не мощность самого процессорного ядра. Так что в плане общей производительности компьютера решение Intel вряд ли можно считать ошибочным или продиктованным исключительно маркетинговыми соображениями. Впрочем, этот подход остается спорным. Основной конкурент Intel — компания AMD придерживается на этот счет противоположного мнения. И с ней солидарны практически все производители серверных процессоров, включая... саму Intel, наиболее мощный процессор которой, Itanium 2, работает на частоте всего 1,5 ГГц.