Core 2 Extreme работает на тактовой частоте 2930 МГц и, следовательно, является самым высокочастотным из процессоров с «вменяемой» длиной конвейера¹. Остальные его характеристики такие же, как у рассмотренной нами модели 6700 (см. «Мир ПК», №10/06). Частота внешней шины (FSB), как и у всех процессоров серии Core 2, составляет 1066 МГц.
Процессор содержит по 32 Кбайт кэш-памяти первого уровня для команд и данных на каждое ядро, а также огромный 4-Мбайт кэш второго уровня — общий для обоих ядер. Такое решение позволяет, с одной стороны, избавиться от проблем, связанных с поддержанием когерентности кэш-памяти второго уровня, с другой — в случае несимметричной нагрузки на ядра (кстати, наиболее распространенный режим в ПК) — выделять одному из них б?ольшую долю, вплоть до всего объема кэш-памяти.
Во всех современных процессорах для ПК кэш-память обоих уровней (а в первом Pentium 4 Extreme Edition — еще и третьего уровня) работает на частоте ядра. Кроме того, существует вероятность, что кэш-память третьего уровня мы еще увидим в «персоналках» и что она также будет работать на частоте ядра. Исключение составляли лишь процессоры Intel Pentium II и первые модели AMD Athlon в конструктивах Slot 1 и Slot A соответственно, где кэш-память второго уровня располагалась не на кристалле, а на специальной процессорной плате и работала на частоте в 2—2,5 раза более низкой, чем частота ядра. Последняя же на порядок выше частоты, с которой процессор обменивается данными с основным объемом оперативной памяти. Потому-то и скорость обмена с кэш-памятью существенно выше.
Процессоры Intel поколения Pentium 4 опережали своих конкурентов по скорости обмена с кэш-памятью, что можно было объяснить более высокой тактовой частотой, однако при смене поколений с Pentium 4 на Core 2 тактовая частота ядра заметно снизилась. Тем не менее скорость обмена с кэш-памятью первого уровня существенно возросла, а второго — осталась практически неизменной. Но в обоих случаях она намного выше скорости обмена с кэш-памятью в процессоре конкурента, работающем на почти такой же тактовой частоте.
Был усовершенствован и алгоритм работы кэш-памяти, что, в частности, сказалось на скорости записи данных, находящихся по различным адресам в оперативной памяти. Для процессоров Pentium 4 и Athlon 64 FX скорость записи резко снижается за пределами объема кэш-памяти, а у Core 2 спад имеет очень плавный характер. Здесь, впрочем, мы видим, что скорость произвольного доступа у процессора Athlon 64 FX в области кэш-памяти первого уровня гораздо выше, чем у флагмана Intel. В то же время при последовательном доступе картина получилась обратной, а латентность кэш-памяти первого уровня в последних процессорах и Intel, и AMD одинакова и составляет три такта.
Здесь мы столкнулись с тем случаем, когда одних лишь измеренных значений недостаточно для правильного вывода. Наряду с цифрами необходимо иметь представление и о методике измерения. Чтобы записывать данные в ячейки памяти, находящиеся по случайным адресам, требуется последовательность этих самых адресов. Другими словами, нужна последовательность случайных (или псевдослучайных) чисел, которую можно либо рассчитать заранее до начала измерения, либо вычислять на лету. Очевидно, что если требуется измерять скорость памяти, то хранение таблицы в этой же самой памяти приведет к большим и неконтролируемым погрешностям. Следовательно, остается единственный вариант — вычислять. Однако на это в случае псевдослучайного числа процессору нужно определенное время. По сравнению со временем доступа к основному объему памяти оно невелико, но вполне сравнимо с временем доступа к кэш-памяти. Скорость генерации псевдослучайных чисел у Core 2 ниже, чем у Athlon 64 FX, и потому взаимное положение кривых в области, соответствующей кэш-памяти первого уровня, отражает не скорость работы кэш-памяти, а скорость работы целочисленного арифметико-логического устройства. И здесь мы подходим к следующей особенности нового процессора Intel.
В плане целочисленных вычислений Core 2 значительно опережает Pentium 4, однако во многих случаях не дотягивает до показателей Athlon 64 FX. В то же время нельзя не отметить огромный прогресс в обработке чисел с плавающей запятой. Впрочем, Intel существенно улучшила блок SSE2, способный обрабатывать как дробные, так и целые числа. Поэтому Core 2 обладает некоторым преимуществом над конкурентом в области обработки чисел с плавающей запятой (как FPU, так и SSE). А вот при операциях над целыми числами картина неоднозначная: сами вычисления могут проводиться довольно быстро, особенно с использованием современных векторных инструкций, в то время как логика управления, обеспечивающая работу устройства в алгоритмах с большим количеством условных переходов, лучше реализована в процессоре AMD.
Производительность процессоров — приложения |
И все-таки в сфере приложений для ПК, когда значительная часть или весь объем часто применяемых данных помещается в кэш-память, именно скорость ее работы определяет производительность системы.
Самые ресурсоемкие из распространенных современных продуктов — трехмерные игры. И все тесты, так или иначе использующие 3D-графику, демонстрируют схожие результаты: Core 2 существенно превосходит Pentium 4 и обладает небольшим, но заметным преимуществом перед Athlon 64. Это легко объяснимо: наряду с текстурами, обычно хранящимися в видеопамяти и не используемыми центральным процессором, для построения трехмерной сцены необходима масса координат, т.е. векторов чисел с плавающей запятой. Существенные объемы данных подразумевают интенсивную работу с кэш-памятью, а обработка дробных чисел у нового процессора Intel, как мы видели, также на высоте.
Производительность процессоров — наборы инструкций |
Самое интересное, что выводы, сделанные применительно к компьютерным играм, можно распространить и на продукты других классов: обработка аудио и видео, офисные приложения, профессиональные программы 3D-графики и т.п. Хотя используемые в различных программах алгоритмы весьма разнообразны, можно констатировать, что в Core 2 достигнут существенный прогресс по сравнению с Pentium 4. Также наиболее производительный процессор Intel опережает флагмана компании AMD. Причем если количественные соотношения могут слегка варьировать, то качественно все группы приложений ведут себя одинаково.
Итак, сделан еще один шаг в развитии архитектуры вычислительных систем, хотя он и может показаться шагом назад по сравнению с Pentium 4, достигшим тактовой частоты 3,8 ГГц. Тем не менее результаты измерений показывают, что в случае с Core 2 наблюдается несомненный прогресс, а Pentium 4 — всего лишь боковая тупиковая ветвь, впрочем также сыгравшая важную роль в развитии процессорной архитектуры, поскольку еще до появления двухъядерных процессоров она заставила программистов задуматься о необходимости распараллеливания вычислений (технология HyperThreading).
Мы видим, что архитектуры процессоров Intel и AMD опять сблизились, однако остается немало возможностей для прогресса: было бы неплохо, если бы Intel научилась эффективно работать в алгоритмах, содержащих большое количество условных переходов, а AMD смогла кардинально улучшить характеристики блока кэширования.
¹Считается, что для универсального процессора оптимальная длина конвейера должна составлять 6—14 стадий. Pentium 4 имел от 20 до 31 стадий, в результате чего удавалось добиться «заоблачных» тактовых частот, но лишь ценой снижения производительности.
Характеристики процессоров
Процессор | Intel Core 2 Extreme X680 | Intel Core 2 Duo 6700 | Intel Pentium 4 | AMD Athlon 64 FX-62 |
Номинальная частота, МГц | 2930 | 2660 | 3600 | 2800 |
Технологические нормы, мкм | 0,065 | 0,065 | 0,09 | 0,09 |
Число ядер | 2 | 2 | 1 | 2 |
Число логических устройств | 2 | 2 | 2 | 2 |
MMX | • | • | • | • |
CMOV | • | • | • | • |
3DNow | ° | ° | ° | • |
3DNow Ext | ° | ° | ° | • |
SSE | • | • | • | • |
SSE2 | • | • | • | • |
SSE3 | • | • | • | • |
HyperThreading | • | • | • | • |
X86 64-bit Ext | • | • | ° | • |
Extended Name | Intel® Core™2 CPU X6800 @ 2,93GHz | Intel® Core™2 CPU 6700 @ 2,66GHz | Genuine Intel® CPU 3,60GHz | AMD Athlon™ 64 FX-62 Dual Core Processor |
Кэш-память L1 code (на каждое ядро), Кбайт | 32 | 32 | 12 | 64 |
Кэш-память L1 data (на каждое ядро), Кбайт | 32 | 32 | 16 | 64 |
Кэш-память L2 (всего), Кбайт | 4096 | 4096 | 1024 | 2Ё1024 |
Процессорный разъем | LGA-775 | LGA-775 | LGA-775 | Socket AM2 |
• — есть, ° — нет.
Результаты тестов SPECViewperf
Проце-ссор | SPECViewperf (OpenGL), кадр/с | |||||||
3ds-max-03 | catia-01 | en-sight-01 | light-07 | maya-01 | proe-03 | sw-01 | ugs-04 | |
Intel Core 2 Extreme X6800 | 24,76 | 20,75 | 16,85 | 21,36 | 44,39 | 25,34 | 18,08 | 7,29 |
Intel Core 2 Duo 6700 | 24,16 | 19,74 | 16,46 | 19,48 | 41,01 | 24,48 | 17,82 | 7,26 |
Intel Pentium 4 (3,6 ГГц) | 20,48 | 13,48 | 13,92 | 10,01 | 23,51 | 19,81 | 16,41 | 6,98 |
AMD Athlon 64 FX-62 | 22,35 | 17,47 | 14,83 | 15,13 | 31,65 | 24,00 | 17,26 | 7,08 |
Результаты теста SYSmark 2004, баллы
Про-цессор | Internet Content Creation | Office Productivity | Ra-ting | ||||||
Ove-rall | 3D Crea-tion | 2D Crea-tion | Web Publi-cation | Ove-rall | Com-muni-cation | Docu-ment Crea-tion | Data Ana-lysis | ||
Intel Core 2 Extreme X6800 | 489 | 429 | 586 | 465 | 319 | 288 | 380 | 296 | 395 |
Intel Core 2 Duo 6700 | 444 | 389 | 536 | 421 | 305 | 291 | 353 | 276 | 368 |
Intel Pentium 4 (3,6 ГГц) | 246 | 230 | 303 | 213 | 210 | 217 | 210 | 203 | 227 |
AMD Athlon 64 FX-62 | 382 | 338 | 445 | 370 | 251 | 275 | 281 | 204 | 310 |
Результаты игровых тестов MDK2 (OpenGL) и Unreal Tournament 2003 (DirectX), кадр/с, при разрешении, точки
Проце-ссор | MDK2 | Unreal Tournament 2003 (Flyby) | Unreal Tournament 2003 (Botmatch) | ||||||
640х 480 | 1024х 768 | 1600х 1200 | 640х 480 | 1024х 768 | 1600х 1200 | 640х 480 | 1024х 768 | 1600х 1200 | |
Intel Core 2 Extreme X6800 | 556,7 | 553,7 | 366,3 | 537,7 | 375,3 | 189,8 | 164,9 | 163,6 | 129,9 |
Intel Core 2 Duo 6700 | 496,6 | 490,8 | 365,6 | 491,0 | 373,5 | 189,8 | 150,5 | 150,1 | 127,0 |
Intel Pentium 4 (3,6 ГГц) | 194,4 | 182,1 | 176,0 | 257,6 | 256,9 | 187,7 | 81,8 | 87,8 | 64,7 |
AMD Athlon 64 FX-62 | 393,7 | 393,6 | 349,3 | 361,3 | 330,3 | 191,6 | 121,0 | 120,8 | 109,3 |
Результаты тестов SeriousSam (для четырех сценариев), кадр/с, при разрешении, точки
Процессор | 640х480 | 1024х768 | 1600х1200 | |||
DirectX | OpenGL | DirectX | OpenGL | DirectX | OpenGL | |
Intel Core 2 Extreme X6800 | 195,0/ 91,2/ 118,1/ 213,8 | 402,0/ 246,8/ 259,7/ 435,5 | 186,0/ 82,4/ 108,2/ 193,8 | 278,4/ 185,4/ 198,3/ 305,2 | 145,9/ 67,8/ 84,8/ 132,1 | 160,0/ 112,7/ 123,5/ 174,6 |
Intel Core 2 Duo 6700 | 172,6/ 80,8/ 104,8/ 190,1 | 368,8/ 225,8/ 237,5/ 404,7 | 164,4/ 73,9/ 97,6/ 175,1 | 264,8/ 171,5/ 184,6/ 290,5 | 137,1/ 62,2/ 79,0/ 124,7 | 155,9/ 110,2/ 120,1/ 169,7 |
Intel Pentium 4 (3,6 ГГц) | 82,2/ 41,2/ 51,3/ 90,7 | 206,3/ 127,7/ 128,9/ 218,8 | 76,6/ 38,6/ 49,4/ 85,8 | 168,8/ 110,4/ 117,4/ 184,6 | 72,7/ 34,5/ 43,8/ 75,6 | 127,3/ 88,4/ 92,4/ 135,4 |
AMD Athlon 64 FX-62 | 145,5/ 76,1/ 96,7/ 170,6 | 276,8/ 180,6/ 196,7/ 348,3 | 140,4/ 69,9/ 90,4/ 159,3 | 234,3/ 155,9/ 168,0/ 270,0 | 122,4/ 60,9/ 75,2/ 118,7 | 147,6/ 103,4/ 113,6/ 164,5 |
Результаты тестов FutureMark, баллы, при разрешении, точки
Проце-ссор | 3DMark03 | 3DMark05 | 3DMark06 | PCMark | |||||||||||
CPU | 640х 480 | 1024х 768 | 1600х 1200 | CPU | 640х 480 | 1024х 768 | 1600х 1200 | CPU | 640х 480 | 1024х 768 | 1600х 1200 | CPU | RAM | HDD | |
Intel Core 2 Extreme X6800 | 1816 | 15 013 | 9794 | 5480 | 10 900 | 5171 | 4082 | 2660 | 2556 | 3209 | 2352 | 1530 | 11 506 | 36 839 | 1515 |
Intel Core 2 Duo 6700 | 1661 | 14 662 | 9673 | 5467 | 10 341 | 5153 | 4041 | 2627 | 2305 | 3176 | 2341 | 1522 | 10 418 | 32 927 | 1522 |
Intel Pentium 4 (3,6 ГГц) | 864 | 12 445 | 8844 | 5276 | 4392 | 4880 | 3896 | 2608 | 1075 | 2876 | 2181 | 1452 | 7503 | 11 247 | 1506 |
AMD Athlon 64 FX-62 | 1433 | 12 946 | 8960 | 5299 | 8137 | 4997 | 3936 | 2606 | 2158 | 3144 | 2330 | 1517 | 9238 | 11 977 | 1542 |
Результаты тестов SiSoft Sandra 2005.SP3 и Performance Test
Проце-ссор | SiSoft Sandra 2005 | Performance Test, произво-дительность | ||||||
CPU Arithmetic | CPU Multi-Media | Memory Bandwidth | ||||||
Drys-tone ALU, MIPS | Whet-stone SSE2/3, MFLOPS | Inte-ger SSE2, it/s | Float SSE2, it/s | Integer SSE2, Мбайт/с | Float SSE2, Мбайт/с | об-щая, Pass-Mark | с пла-вающей запятой, MFLOPS | |
Intel Core 2 Extreme X6800 | 34 954 | 13 572 | 158 186 | 86 327 | 5243 | 5258 | 571,8 | 1767,9 |
Intel Core 2 Duo 6700 | 31 813 | 12 401 | 144 524 | 78 896 | 5058 | 5056 | 522,2 | 1567,1 |
Intel Pentium 4 (3,6 ГГц) | 10 357 | 7639 | 25 267 | 32 811 | 4666 | 4665 | 472,0 | 771,9 |
AMD Athlon 64 FX-62 | 25 270 | 11 517 | 53 658 | 57 880 | 6972 | 6902 | 523,0 | 1689,1 |