Core 2 Extreme работает на тактовой частоте 2930 МГц и, следовательно, является самым высокочастотным из процессоров с «вменяемой» длиной конвейера¹. Остальные его характеристики такие же, как у рассмотренной нами модели 6700 (см. «Мир ПК», №10/06). Частота внешней шины (FSB), как и у всех процессоров серии Core 2, составляет 1066 МГц.

Процессор содержит по 32 Кбайт кэш-памяти первого уровня для команд и данных на каждое ядро, а также огромный 4-Мбайт кэш второго уровня — общий для обоих ядер. Такое решение позволяет, с одной стороны, избавиться от проблем, связанных с поддержанием когерентности кэш-памяти второго уровня, с другой — в случае несимметричной нагрузки на ядра (кстати, наиболее распространенный режим в ПК) — выделять одному из них б?ольшую долю, вплоть до всего объема кэш-памяти.

Во всех современных процессорах для ПК кэш-память обоих уровней (а в первом Pentium 4 Extreme Edition — еще и третьего уровня) работает на частоте ядра. Кроме того, существует вероятность, что кэш-память третьего уровня мы еще увидим в «персоналках» и что она также будет работать на частоте ядра. Исключение составляли лишь процессоры Intel Pentium II и первые модели AMD Athlon в конструктивах Slot 1 и Slot A соответственно, где кэш-память второго уровня располагалась не на кристалле, а на специальной процессорной плате и работала на частоте в 2—2,5 раза более низкой, чем частота ядра. Последняя же на порядок выше частоты, с которой процессор обменивается данными с основным объемом оперативной памяти. Потому-то и скорость обмена с кэш-памятью существенно выше.

Процессоры Intel поколения Pentium 4 опережали своих конкурентов по скорости обмена с кэш-памятью, что можно было объяснить более высокой тактовой частотой, однако при смене поколений с Pentium 4 на Core 2 тактовая частота ядра заметно снизилась. Тем не менее скорость обмена с кэш-памятью первого уровня существенно возросла, а второго — осталась практически неизменной. Но в обоих случаях она намного выше скорости обмена с кэш-памятью в процессоре конкурента, работающем на почти такой же тактовой частоте.

Был усовершенствован и алгоритм работы кэш-памяти, что, в частности, сказалось на скорости записи данных, находящихся по различным адресам в оперативной памяти. Для процессоров Pentium 4 и Athlon 64 FX скорость записи резко снижается за пределами объема кэш-памяти, а у Core 2 спад имеет очень плавный характер. Здесь, впрочем, мы видим, что скорость произвольного доступа у процессора Athlon 64 FX в области кэш-памяти первого уровня гораздо выше, чем у флагмана Intel. В то же время при последовательном доступе картина получилась обратной, а латентность кэш-памяти первого уровня в последних процессорах и Intel, и AMD одинакова и составляет три такта.

Здесь мы столкнулись с тем случаем, когда одних лишь измеренных значений недостаточно для правильного вывода. Наряду с цифрами необходимо иметь представление и о методике измерения. Чтобы записывать данные в ячейки памяти, находящиеся по случайным адресам, требуется последовательность этих самых адресов. Другими словами, нужна последовательность случайных (или псевдослучайных) чисел, которую можно либо рассчитать заранее до начала измерения, либо вычислять на лету. Очевидно, что если требуется измерять скорость памяти, то хранение таблицы в этой же самой памяти приведет к большим и неконтролируемым погрешностям. Следовательно, остается единственный вариант — вычислять. Однако на это в случае псевдослучайного числа процессору нужно определенное время. По сравнению со временем доступа к основному объему памяти оно невелико, но вполне сравнимо с временем доступа к кэш-памяти. Скорость генерации псевдослучайных чисел у Core 2 ниже, чем у Athlon 64 FX, и потому взаимное положение кривых в области, соответствующей кэш-памяти первого уровня, отражает не скорость работы кэш-памяти, а скорость работы целочисленного арифметико-логического устройства. И здесь мы подходим к следующей особенности нового процессора Intel.

В плане целочисленных вычислений Core 2 значительно опережает Pentium 4, однако во многих случаях не дотягивает до показателей Athlon 64 FX. В то же время нельзя не отметить огромный прогресс в обработке чисел с плавающей запятой. Впрочем, Intel существенно улучшила блок SSE2, способный обрабатывать как дробные, так и целые числа. Поэтому Core 2 обладает некоторым преимуществом над конкурентом в области обработки чисел с плавающей запятой (как FPU, так и SSE). А вот при операциях над целыми числами картина неоднозначная: сами вычисления могут проводиться довольно быстро, особенно с использованием современных векторных инструкций, в то время как логика управления, обеспечивающая работу устройства в алгоритмах с большим количеством условных переходов, лучше реализована в процессоре AMD.

Производительность процессоров — приложения

И все-таки в сфере приложений для ПК, когда значительная часть или весь объем часто применяемых данных помещается в кэш-память, именно скорость ее работы определяет производительность системы.

Самые ресурсоемкие из распространенных современных продуктов — трехмерные игры. И все тесты, так или иначе использующие 3D-графику, демонстрируют схожие результаты: Core 2 существенно превосходит Pentium 4 и обладает небольшим, но заметным преимуществом перед Athlon 64. Это легко объяснимо: наряду с текстурами, обычно хранящимися в видеопамяти и не используемыми центральным процессором, для построения трехмерной сцены необходима масса координат, т.е. векторов чисел с плавающей запятой. Существенные объемы данных подразумевают интенсивную работу с кэш-памятью, а обработка дробных чисел у нового процессора Intel, как мы видели, также на высоте.

Производительность процессоров — наборы инструкций

Самое интересное, что выводы, сделанные применительно к компьютерным играм, можно распространить и на продукты других классов: обработка аудио и видео, офисные приложения, профессиональные программы 3D-графики и т.п. Хотя используемые в различных программах алгоритмы весьма разнообразны, можно констатировать, что в Core 2 достигнут существенный прогресс по сравнению с Pentium 4. Также наиболее производительный процессор Intel опережает флагмана компании AMD. Причем если количественные соотношения могут слегка варьировать, то качественно все группы приложений ведут себя одинаково.

Итак, сделан еще один шаг в развитии архитектуры вычислительных систем, хотя он и может показаться шагом назад по сравнению с Pentium 4, достигшим тактовой частоты 3,8 ГГц. Тем не менее результаты измерений показывают, что в случае с Core 2 наблюдается несомненный прогресс, а Pentium 4 — всего лишь боковая тупиковая ветвь, впрочем также сыгравшая важную роль в развитии процессорной архитектуры, поскольку еще до появления двухъядерных процессоров она заставила программистов задуматься о необходимости распараллеливания вычислений (технология HyperThreading).

Мы видим, что архитектуры процессоров Intel и AMD опять сблизились, однако остается немало возможностей для прогресса: было бы неплохо, если бы Intel научилась эффективно работать в алгоритмах, содержащих большое количество условных переходов, а AMD смогла кардинально улучшить характеристики блока кэширования.


¹Считается, что для универсального процессора оптимальная длина конвейера должна составлять 6—14 стадий. Pentium 4 имел от 20 до 31 стадий, в результате чего удавалось добиться «заоблачных» тактовых частот, но лишь ценой снижения производительности.


Характеристики процессоров
ПроцессорIntel Core 2 Extreme X680Intel Core 2 Duo 6700Intel Pentium 4AMD Athlon 64 FX-62
Номинальная частота, МГц2930266036002800
Технологические нормы, мкм0,0650,0650,090,09
Число ядер2212
Число логических устройств2222
MMX
CMOV
3DNow°°°
3DNow Ext°°°
SSE
SSE2
SSE3
HyperThreading
X86 64-bit Ext°
Extended NameIntel® Core™2 CPU X6800 @ 2,93GHzIntel® Core™2 CPU 6700 @ 2,66GHzGenuine Intel® CPU 3,60GHzAMD Athlon™ 64 FX-62 Dual Core Processor
Кэш-память L1 code (на каждое ядро), Кбайт32321264
Кэш-память L1 data (на каждое ядро), Кбайт32321664
Кэш-память L2 (всего), Кбайт4096409610242Ё1024
Процессорный разъемLGA-775LGA-775LGA-775Socket AM2

• — есть, ° — нет.


Результаты тестов SPECViewperf
Проце-ссорSPECViewperf (OpenGL), кадр/с
3ds-max-03catia-01en-sight-01light-07maya-01proe-03sw-01ugs-04
Intel Core 2 Extreme X680024,7620,7516,8521,3644,3925,3418,087,29
Intel Core 2 Duo 670024,1619,7416,4619,4841,0124,4817,827,26
Intel Pentium 4 (3,6 ГГц)20,4813,4813,9210,0123,5119,8116,416,98
AMD Athlon 64 FX-6222,3517,4714,8315,1331,6524,0017,267,08

Результаты теста SYSmark 2004, баллы
Про-цессорInternet Content CreationOffice ProductivityRa-ting
Ove-rall3D Crea-tion2D Crea-tionWeb Publi-cationOve-rallCom-muni-cationDocu-ment Crea-tionData Ana-lysis
Intel Core 2 Extreme X6800489429586465319288380296395
Intel Core 2 Duo 6700444389536421305291353276368
Intel Pentium 4 (3,6 ГГц)246230303213210217210203227
AMD Athlon 64 FX-62382338445370251275281204310

Результаты игровых тестов MDK2 (OpenGL) и Unreal Tournament 2003 (DirectX), кадр/с, при разрешении, точки
Проце-ссорMDK2 Unreal Tournament 2003 (Flyby)Unreal Tournament 2003 (Botmatch)
640х 4801024х 7681600х 1200640х 4801024х 7681600х 1200640х 4801024х 7681600х 1200
Intel Core 2 Extreme X6800556,7553,7366,3537,7375,3189,8164,9163,6129,9
Intel Core 2 Duo 6700496,6490,8365,6491,0373,5189,8150,5150,1127,0
Intel Pentium 4 (3,6 ГГц)194,4182,1176,0257,6256,9187,781,887,864,7
AMD Athlon 64 FX-62393,7393,6349,3361,3330,3191,6121,0120,8109,3

Результаты тестов SeriousSam (для четырех сценариев), кадр/с, при разрешении, точки
Процессор640х4801024х7681600х1200
DirectXOpenGLDirectXOpenGLDirectXOpenGL
Intel Core 2 Extreme X6800195,0/ 91,2/ 118,1/ 213,8402,0/ 246,8/ 259,7/ 435,5186,0/ 82,4/ 108,2/ 193,8278,4/ 185,4/ 198,3/ 305,2145,9/ 67,8/ 84,8/ 132,1160,0/ 112,7/ 123,5/ 174,6
Intel Core 2 Duo 6700172,6/ 80,8/ 104,8/ 190,1368,8/ 225,8/ 237,5/ 404,7164,4/ 73,9/ 97,6/ 175,1 264,8/ 171,5/ 184,6/ 290,5137,1/ 62,2/ 79,0/ 124,7155,9/ 110,2/ 120,1/ 169,7
Intel Pentium 4 (3,6 ГГц)82,2/ 41,2/ 51,3/ 90,7206,3/ 127,7/ 128,9/ 218,876,6/ 38,6/ 49,4/ 85,8168,8/ 110,4/ 117,4/ 184,672,7/ 34,5/ 43,8/ 75,6127,3/ 88,4/ 92,4/ 135,4
AMD Athlon 64 FX-62145,5/ 76,1/ 96,7/ 170,6 276,8/ 180,6/ 196,7/ 348,3140,4/ 69,9/ 90,4/ 159,3 234,3/ 155,9/ 168,0/ 270,0122,4/ 60,9/ 75,2/ 118,7147,6/ 103,4/ 113,6/ 164,5

Результаты тестов FutureMark, баллы, при разрешении, точки
Проце-ссор3DMark033DMark053DMark06PCMark
CPU640х 4801024х 7681600х 1200CPU640х 4801024х 7681600х 1200CPU640х 4801024х 7681600х 1200CPURAMHDD
Intel Core 2 Extreme X6800181615 0139794548010 900517140822660255632092352153011 50636 8391515
Intel Core 2 Duo 6700166114 6629673546710 341515340412627230531762341152210 41832 9271522
Intel Pentium 4 (3,6 ГГц)86412 4458844527643924880389626081075287621811452750311 2471506
AMD Athlon 64 FX-62143312 9468960529981374997393626062158314423301517923811 9771542

Результаты тестов SiSoft Sandra 2005.SP3 и Performance Test
Проце-ссорSiSoft Sandra 2005Performance Test, произво-дительность
CPU ArithmeticCPU Multi-MediaMemory Bandwidth
Drys-tone ALU, MIPSWhet-stone SSE2/3, MFLOPSInte-ger SSE2, it/sFloat SSE2, it/sInteger SSE2, Мбайт/сFloat SSE2, Мбайт/соб-щая, Pass-Markс пла-вающей запятой, MFLOPS
Intel Core 2 Extreme X680034 95413 572158 18686 32752435258571,81767,9
Intel Core 2 Duo 670031 81312 401144 52478 89650585056522,21567,1
Intel Pentium 4 (3,6 ГГц)10 357763925 26732 81146664665472,0771,9
AMD Athlon 64 FX-6225 27011 51753 65857 88069726902523,01689,1