Для начала небольшой исторический экскурс. Первые 8-разрядные микропроцессоры работали с оперативной памятью (ОП) синхронно — цикл обработки информации в арифметико-логическом устройстве (АЛУ) был привязан к циклу обмена с оперативной памятью. Для выполнения самой быстрой команды требовалось четыре такта, а трех тактов было вполне достаточно для считывания или записи ячейки памяти.
Чуть позже в процессоре Intel 8086/8088 с целью увеличения производительности операционный блок процессора и блок интерфейса с внешней шиной уже могли работать независимо (т.е. параллельно). Но при этом их частота оставалась одинаковой. Обмен между ними осуществлялся посредством 6-байт буфера (прообраза кэш-памяти команд), который заполнялся по мере возможности интерфейсным блоком, чтобы к моменту, когда процессору понадобится код следующей команды, он уже был загружен в буфер. Именно с этого процессора, как мы помним, началось триумфальное шествие IBM PC и совместимых с ним компьютеров. Первоначально его тактовая частота составляла 4,77 МГц, а впоследствии была увеличена до 8 — 12 МГц. Самая быстрая команда выполнялась за два такта, что было бы невозможно в синхронном режиме, а наиболее длительная занимала более 80 тактов. За время выполнения длинных команд блок интерфейса успевал как заполнять буфер предвыборки команд, так и записывать в память результаты вычислений.
При переходе от 8086/88 к 80286, а затем и к 80386 тактовые частоты процессоров заметно выросли, а совершенствование архитектуры привело к уменьшению среднего количества тактов, необходимых для выполнения одной инструкции. Память перестала успевать за АЛУ. Для увеличения производительности компьютеров на системной плате стали устанавливать кэш-память, превосходящую ОП по скорости работы. В процессорах семейства 80486 минимальная длительность команды была доведена до одного такта, а также было применено два сущест-венных усовершенствования: на кристалле появилась кэш-память, работающая на частоте ядра, а частоту последнего стало возможным сделать в 2 или 3 раза выше частоты внешней шины. Ширина внешней шины при этом в большинстве случаев совпадала с разрядностью процессора (в «бюджетных» моделях была вдвое меньше).
Следующее радикальное изменение принес с собой процессор Pentium. Его суперскалярная архитектура позволяла одновременно выполнять более одной команды, а ширина внешней шины была увеличена до 64 разрядов, что автоматически удваивало ее пропускную способность. Кроме того, существенно расширился список допустимых коэффициентов умножения внешней частоты, в который наряду с целыми (2, 3) стали входить и половинные (1,5; 2,5; 3,5) коэффициенты.
Процессоры Pentium Pro, Pentium II и Pentium III мало что изменили в области усовершенствования внешней шины. Практически единственным нововведением было расширение списка коэффициентов в сторону больших значений (они перевалили за 10). Правда, появились наборы системной логики (НМС — набор микросхем), допускающие работу процессорной шины и шины памяти на разных частотах.
Одновременно с разработкой Pentium 4 корпорация Intel строила планы по вытеснению существующих типов памяти новой — Rambus DRAM, работающей на высоких тактовых частотах. Для согласования с ней была создана и новая процессорная шина, которая могла передавать данные не по одной, как все предыдущие модели процессоров, а по четыре порции данных за такт. В то время внешняя частота практически безальтернативно составляла 100 МГц, а частота передачи данных соответственно 400 МГц, что и указывалось в спецификации процессоров.
Однако себестоимость производства Rambus DRAM так и не удалось снизить до приемлемых величин, поэтому на рынке прочно обосновалась DDR DRAM, способная передавать данные лишь дважды за такт. Частоты ее работы лежали в пределах от 100 до 200 МГц, а частота передачи данных — от 200 до 400 МГц соответственно. Но к моменту достижения максимальных значений из этого диапазона интерфейс процессора поддерживал уже передачу данных со скоростью 533 — 800 МГц.
Очередной новинкой стал двухканальный режим памяти, фактически увеличивающий ширину шины памяти с 64 до 128 разрядов. В результате пропускная способность памяти с частотой передачи данных 400 МГц оказалась равной пропускной способности процессорной шины с частотой 800 МГц.
Казалось бы, баланс достигнут. Следующее поколение памяти с частотой 533 МГц будет прекрасно работать в двухканальном режиме с процессорной шиной 1066 МГц и так далее… Но прежде чем модуль памяти сможет выдавать по две порции данных за такт, нужно затратить несколько тактов (порядка десяти) на то, чтобы сообщить ему нужный адрес ячейки и подождать, пока он считает в свои буфера необходимые данные (так называемая латентность памяти). Другими словами, средняя скорость передачи данных памяти оказывается существенно ниже ее максимальной скорости. Поэтому есть определенный резон в том, чтобы скорость шины памяти превышала скорость процессорной шины. Судя по величине таймингов (характерных отрезков времени, необходимых для выполнения операций с памятью. — Прим. ред.) — желательно вдвое. Но частотный резерв памяти DDR уже был исчерпан. Поэтому вполне естественно, что после появления процессоров семейства Core 2 Duo/Quad с внешней частотой 1066 МГц возник вопрос о комплектации системы памятью, имеющей такую же скорость работы. Тем более что, как показывают результаты измерений, наивысшая производительность достигается в синхронном режиме, т.е. в режиме, когда частоты шин процессора и памяти совпадают.
Внутренняя частота всех типов памяти семейства DDR лежит в пределах 100 — 200 МГц, внешняя совпадает с внутренней у DDR и вдвое или вчетверо выше у DDR2 и DDR3 соответственно. Частота передачи данных у всех разновидностей вдвое выше частоты шины, т.е. 200 — 400 МГц для DDR, 400 — 800 МГц для DDR2 и 800 — 1600 МГц для DDR3. Последняя, правда, только начинает свое восхождение и потолка не достигла.
Величина 800 МГц для DDR3, естественно, никому не интересна, поскольку при переходе к следующему поколению семейства DDR возрастают тайминги и соответственно снижается скорость работы, а вот 1066 МГц уже заслуживает внимания, так как, во-первых, может несколько превосходить предшественницу по производительности, а во-вторых, совпадает по частоте с внешней шиной большинства современных процессоров.
Одновременно с поддержкой нового типа памяти корпорация Intel решила сменить маркировку своих НМС. Собственно, без этого было и не обойтись, так как предыдущий набор индексов уже «уперся» в девятку. Не совсем понятно, правда, почему отсчет начат с тройки, а не с единицы. Может, это как раз ссылка на DDR3?!
Мы протестировали два НМС нового семейства: P35 и X38. Оба поддерживают как DDR2, так и DDR3, но частотный диапазон первого ограничен 1066 МГц, а второго простирается до 1333 МГц. Кроме того, X38, в отличие от P35, поддерживает сразу два интерфейса PCI Express x16, что позволяет подключить к нему две видеоплаты в режиме CrossFire. Да и сама шина имеет версию 2.0, что, впрочем, может быть использовано лишь в будущем, когда аналогичная поддержка появится в продукции производителей видеоплат.
Для сравнения в обзоре мы привели данные по плате производства Foxconn, поддерживающей лишь DDR2. Если бы эти данные успели в предыдущий обзор, эта плата заняла бы там лидирующую позицию. Поэтому можно сказать, что сравниваются три платы, предназначенные для установки DDR3, с наиболее быстрой платой из поддерживающих DDR2. Плата Foxconn проходила испытания с DDR2-800 (5.5.5.18). К сожалению, лишь с одним гигабайтом (два модуля по 512 Мбайт), поэтому в некоторых тестах возможно и влияние различия в объеме установленной оперативной памяти.
Расстановка мест по результатам тестирования оказалась вполне прогнозируемой: первое место, естественно, у платы на наиболее дорогом НМС Intel X38, последнее — у системы с памятью DDR2, а серединка — у плат на Intel P35, которые, кстати, показали практически одинаковые результаты.
Наименее чувствительными как к типу используемой памяти, так и к примененному НМС оказались, как и следовало ожидать, программы, интенсивно использующие центральный и графический процессоры, — мультимедийные и игровые приложения. Здесь разброс результатов составил доли процента. Наибольшее различие закономерно проявилось в синтетических тестах памяти, причем величина его достигла значения 10%, 7—8% из которых приходятся на долю собственно самой памяти, а 2—3% — преимущество Intel X38 перед P35.
Наиболее интересен результат, полученный в «обычных» приложениях, не требующих высокой производительности от какого-либо из процессоров, — при работе в Интернете и офисных программах. Здесь выигрыш от использования более совершенного НМС практически совпал с выигрышем от перехода к новому типу памяти — примерно по 1,5% на каждый.
Для того чтобы разница в скорости выполнения программы стала заметной на глаз, она должна составлять не менее 15—20%, поэтому ощутимого прироста производительности от использования нового типа памяти ожидать пока не приходится. Даже в синтетических тестах. В то же время частотный потенциал DDR2 уже практически исчерпан, а DDR3 находится пока в самом начале пути. Так что с ростом тактовых частот применение нового типа памяти будет более целесообразным.
Таблица. Основные характеристики системных плат
Как мы тестировали
Тестирование проводилось на стенде в следующей конфигурации: центральный процессор — Intel Core 2 Duo E6700 (2Ч2,66 ГГц); оперативная память — 2048-Мбайт ОЗУ типа DDR3 SDRAM 1066 МГц (два модуля Kingston KHX11000D3LLK2 по 1024 Мбайт — 7.7.7.20); системные платы — все принимавшие участие в тестировании; видеосистема Palit GeForce 6600GT 256 Мбайт; жесткий диск Western Digital WD2000JD-00HBB0, 200 Гбайт, SATA 150, 7200 об/мин, 8 Мбайт; привод DVD-ROM — Teac DV-516GA; блок питания NPU-3S525 (575 Вт).
Была использована операционная система Windows XP SP1 и традиционный для нашего журнала набор тестовых программ. Тестирование проводилось в видеорежиме 1024Ч768 точек, с глубиной цвета 32 бит и частотой вертикальной развертки 75 Гц. Кроме того, игровые тесты и 3DMark запускались в разрешениях 640×480 и 1600×1200.