После появления микропроцессоров Intel Pentium Pro некоторые специалисты были почти уверены, что суперсерверы, ими оснащенные (или, по крайней мере, их последователями), вытеснят многопроцессорные RISC-серверы. C выходом в свет Pentium II встал вопрос о модернизации суперсерверов, использующих Pentium Pro. Однако сотрудник одной известной фирмы - производителя таких компьютеров в частной беседе заявил мне, что они собираются «пропустить» этот этап и ориентируются на выпуск систем на базе будущего Merced.
Рождение же последнего, как было недавно объявлено, задерживается. За прошедшее время Intel выпустила массу новых процессоров (Klamath, Deshutes, Celeron и, наконец, Xeon), однако их «внутренняя сущность» (ядро микропроцессоров) остается все той же - Pentium II (грубо говоря, ядро Pentium Pro, расширенное командами ММХ). Между тем сложилось впечатление, что производители суперсерверов не торопились включать в свои системы все новые варианты Pentium II и разрабатывать новые версии серверов, хотя на тестах SPEC95 Pentium II опередили Pentium Pro. Теперь же, с точки зрения автора, ситуация может резко измениться. Одной из первых (если не самой первой) ласточек среди новых серверов на основе Xeon оказались системы компании Data General, которые и будут рассмотрены в этой статье.
Новое поколение выбирает Xeon
Вообще говоря, предыдущие поколения Pentium II сама Intel ориентировала в первую очередь на рынок ПК. Дело в том, что по сравнению с Pentium Pro в этих моделях внешний кэш второго уровня работает не на частоте процессоров, а на половинной тактовой частоте. Учитывая характерную для коммерческих приложений, обычно исполняемых на суперсерверах, низкую локализацию данных в оперативной памяти из-за случайного к ней обращения, пропускная способность не только памяти, но и кэша второго уровня становится критически важной. Если добавить к этому ограничения на максимальную емкость памяти, поддерживаемой Pentium II, то неторопливость производителей серверов становится понятной.
Однако появление Xeon сулит ряд достаточно серьезных усовершенствований, позволяющих предположить, что производители суперсерверов не останутся безучастны к этому событию. Прежде всего, это расширение адресного пространства: из 32-разрядного оно становится 36-разрядным.
Еще одним важным плюсом Xeon по сравнению с предыдущими вариантами Pentium II является работа внешнего кэша на повышенной тактовой частоте. Если учесть, что это 400 МГц (ожидается и 450-мегагерцевая версия), то, насколько мне известно, на сегодня это самая «высокочастотная» в микропроцессорной индустрии кэш-память. Для частоты 450 МГц пропускная способность 64-разрядной шины, связывающей процессор с кэшем второго уровня, составит 3,6 Гбайт/с. Это примерно соответствует уровню пропускной способности кэша второго уровня в Alpha 21264. Насколько мне известно, из планируемых к выпуску в ближайшее время процессоров лишь UltraSPARC III будет иметь существенно более высокую пропускную способность внешнего кэша. Что касается емкости кэша второго уровня, то она также возросла по сравнению с Pentium Pro максимум до 2 Мбайт.
К этому следует добавить появившуюся чуть раньше в серии Pentium II 100-мегагерцевую системную шину, которая резко увеличивает столь важную для суперсерверов пропускную способность памяти.
Если задуматься о ближайшем будущем суперсерверов на платформе Intel, то появится новая загадка. Пока Intel выпекает очередные версии процессоров, как блины, а Merced лишь маячит где-то на горизонте, встает вопрос, перейдут ли производители суперсерверов от Xeon на ожидаемые еще до появления Merced процессоры Katmai, Tanner и Willamette.
В отдаленном будущем очевидно применение в суперсерверах процессоров c архитектурой IA-64 (и, по заявлению Data General, IA-32), но для оценки перспектив Katmai и Willamette данных явно недостаточно.
А вот что касается Xeon, то тут, по моему мнению, мы скоро станем свидетелями парада новых суперсерверов. Этот серверный сезон уже открылся: 29 июня объявлено о новом поколении суперсерверов Data General AV25000; об использовании Xeon сообщила также Unisys.
Два кита AV25000
Если первым «китом», на котором базируется сервер AV25000, является процессор Xeon, то вторым можно считать aрхитектуру ccNUMA, нашедшую свое отражение в технологии NUMALiiNE фирмы Data General. Cобственно, речь идет уже о третьем поколении NUMALiiNE. Первое поколение этой технологии применялось в ccNUMA-серверах AV10000 на базе процессоров Motorola 88010. Эти системы появились в конце 1995 г. и стали пионерами архитектуры ccNUMA, наряду с SPP1000 компании Convex. Год назад, в июне 1997-го, Data General предложила пользователям ccNUMA-системы второго поколения AV20000 (см. Сomputerworld Россия, 1997, № 28). Как известно, Data General оказалась не единственной, кто поставляет суперсерверы на базе Pentium Pro с архитектурой ccNUMA; подобные компьютеры предлагает также Sequent.
Cейчас Data General сделала следующий шаг, объявив о ccNUMA-серверах AV25000.
Хотя архитектурные изменения в «версии» NUMALiiNE для AV25000 по сравнению с AV20000 незначительны, все же полезно сказать несколько слов о ccNUMA, позиции которой за год, прошедший с момента нашей предыдущей публикации о серверах AViiON (AV есть просто сокращение от этого слова), еще более укрепились.
Традиционная архитектура многопроцессорных серверов с общим полем оперативной памяти - SMP - имеет ограничения масштабируемости, связанные с ограниченной пропускной способности системной шины и ограничениями по числу ее слотов. Однако это архитектурное направление вовсе не сдало свои позиции, даже в «старшем» классе серверов. Здесь лидерами являются Sun Ultra Enterprise 10000 (до 64 процессоров!) и HP V2200.
Вместе с тем переход в старших моделях систем с общим полем памяти к архитектуре ccNUMA очевиден. Кроме Data General и Sequent, эту стратегию поддерживают HP/Convex и SGI (Origin 2000 и Onyx2). ccNUMA стоит также в планах DEC/Compaq (Wildfire) и, вероятно, Sun (серверы на базе будущих процессоров UltraSPARC III).
Посмотрим, что такое ссNUMA, на примере NUMALiiNE в версии для AV25000 (см. рис.). Системная шина SMP-серверов здесь, можно сказать, представлена в двух ипостасях. Во-первых, в «строительных блоках» SBB (Scalable Building Blocks), на материнских платах SHV (Standard High Volume) компании Intel. Во-вторых, в «переродившемся» виде - как межсоединение SCI.
Внутри узлы SBB представляют собой практически готовый SMP-компьютер, содержащий 4 процессора Xeon, кэш второго уровня, оперативная память и 2 PCI-канала ввода/вывода. В первых версиях AV25000 процессоры Xeon будут работать на тактовой частоте 400 МГц и снабжаться встроенным кэшем второго уровня емкостью 2 Мбайт. Очевидно, что масштабирование числа узлов SBB «автоматически» приводит к росту не только числа процессоров, но и емкости памяти, емкости внешних устройств и соответственно росту пропускной способности как оперативной памяти, так и подсистемы ввода/вывода. Очевидно, это масштабирование лучше, чем в SMP.
Однако вместо системной шины теперь лимитирующим фактором становится межсоединение SCI. Оно вступает в работу, только когда обращение идет в удаленную оперативную память, скажем, от процессора одного узла в локальную память другого. Локальные обращения к памяти не затрагивают SCI, существенно понижая нагрузку на нее. Таким образом, если задача распараллелена, скажем, на 4 процессора, и использует только локальную память и локальные внешние устройства, она практически не нагружает SCI.
Межсоединение SCI компании Dolphin Technologies реализовано в виде двух колец с пиковой пропускной способности 500 Мбайт/с у каждого, осуществляющих соединение точка-точка. Это гораздо ниже, чем пропускная способность системных шин (или соответствующих коммутаторов) самых мощных SMP-серверов, которая превзошла 10 Гбайт/с. Очевидно, возможности использования более низкого уровня пропускной способности связаны с описанной выше разгрузкой SCI от части передач данных.
С целью дальнейшего уменьшения нагрузки на SCI каждый SBB имеет мост с SCI (SCI Interconnect Bridge), в состав которого входит так называемый кэш удаленной памяти емкостью до 128 Мбайт. В нем кэшируются данные, приходящие в SBB при запросах к удаленной оперативной памяти, что позволяет дополнительно снизить нагрузку на SCI.
Результаты
Посмотрим, какого уровня масштабирования удалось достичь Data General в системах AV25000. В AV25000 может быть до 64 процессоров (против 32 в AV20000), максимальная емкость оперативной памяти равна 64 Гбайт (против 16 Гбайт в AV20000). Системы AV25000 могут иметь до 144 слотов шин PCI (то есть на уровне известного SMP-сервера AlphaServer 8400) и поддерживать свыше 100 Тбайт дискового пространства при использовании известных дисковых массивов CLARiiON, работающих по протоколу Fibre Channel. Здесь необходимо отметить возможности иметь смешанные конфигурации с SHV как на базе Xeon, так и на базе Pentium Pro, что обеспечивает сохранение инвестиций пользователей, уже приобретших AV20000. Не менее, если не более полезной оценкой степени масштабирования являются тесты на соответствующих приложениях. Целесообразно привести данные о результатах тестов TPC-D (то есть для систем поддержки принятия решений) при емкости базы данных 300 Гбайт (см. таблицу). Высокие результаты, показанные компьютером AV20000, несомненно, подтверждают хорошие качества масштабируемости аппаратуры и ПО Data General.
Процессоры Intel пока еще не обогнали по производительности своих главных RISC-соперников, а суперсерверы на платформе Intel пока не смогли вытеснить многопроцессорные RISC-серверы. Поэтому вопрос стоимости и отношения стоимость/производительность имеет во многом определяющее значение. Применение стандартных плат SHV и доступного на рынке межсоединения SCI снижает стоимость системам по сравнению с теми, которые используют собственные разработки. Однако уже цены на процессоры Xeon весьма велики (в частности, очень дорог кэш второго уровня). Дорого стоит и сервер AV25000: от 100 тыс. долл. за четырехпроцессорную систему с 512 Мбайт памяти до 500 тыс. долл. за 16-процессорную систему с памятью 2 Гбайт. 64-процессорный сервер с 8 Гбайт оперативной памяти обойдется уже в 2,5 млн. долл. (все цены - для CША). Поставки начнутся в конце сентября.
В мире уже установлено около 400 ccNUMA-систем от Data General. Это говорит о том, что пользователи готовы платить за высокое качество. Полагаю, могут такие солидные покупатели появиться и в нашей стране.
Михаил Кузьминский - старший научный сотрудник Центра компьютерного обеспечения Института химических исследований РАН. С ним можно связаться по телефону (095) 135-6388.