SMP-системы на базе Pentium
Системы высокой степени готовности
Архитектура NUMA

Мне кажется, что современная компьютеризованная молодежь полагает, что персональные компьютеры стали моськой, победившей слона (мэйнфреймы). Забудем на минутку, что на самом деле слон, как водится, пошел дальше, не обращая на моську внимания. Следует напомнить о более давней попытке откусить от пирога мэйнфреймов. Не так давно были очень популярны супермини-компьютеры. Самые мощные мини-компьютеры (поэтому их и назвали суперминикомпьютерами) выпускала DEC. Мировым лидером производства "супермини" была также хорошо известная тогда в нашей стране фирма Data General, выпускавшая мини-компьютеры Eclipse MV ("Затмение"). В последнее время компания сконцентрировалась на производстве SMP-серверов AViiON, появившихся в 1989 году, которые сначала базировались на микропроцессорах Motorola, а затем - Intel.

SMP-системы на базе Pentium

Серия AViiON (AV 2000/3000/ 4700/4800/5800) охватывает диапазон от маленьких серверов уровня рабочей группы до больших монтируемых в стойку 8-процессорных серверов (см. Таблицу 1). В моделях AV3000 используется системная шина с пиковой пропускной способностью 267 Мбайт/с. SMP-системы AV4700 и старше используют технологию шины С-bus II фирмы Corollary. Пиковая скорость передачи данных этой системной шины - 400 Мбайт/с. Для сравнения скажем, что такую же пиковую пропускную способность имеет шина Mbus, используемая в рабочих станциях Sun. Однако это выше, чем, например, у известных в нашей стране серверов Tricord, в которых пиковая пропускная способность системной шины PowerBus 267 Мбайт/с. Гарантированная пропускная способность C-bus II составляет 266 Мбайт/с. Важной особенностью С-bus II, обеспечивающей высокую надежность систем на ее собственной базе, является применение кодов ECC для коррекции и обнаружения ошибок.

Модель
Частота, МГц
Число ЦП
ОП Мбайт
Кэш L2, Кбайт
Слотов PCI
AV2000
100-166
1-2
16-256
256
3
AV3000
100-166
2-4
32-768
512-1024
4
AV4700
133/166
1-2
32-1024
512
6
AV4800
133/166
1-4
64-2048
512-2048
6
AV5800
166
2-8
256-2560
2048
6

Таблица 1.
Характеристики серверов AViiOn с микропроцессорами Pentium.

Рассматриваемые SMP-серверы используют микропроцессоры Intel Pentium c тактовыми частотами от 100 до 166 МГц, имеющими стандартный кэш первого уровня (8 Кбайт для данных + 8 Кбайт для команд), прямоадресуемый кэш второго уровня емкостью от 256 Кбайт до 2 Мбайт и уникальный полностью ассоциативный кэш третьего уровня, содержащий 6 строк по 32 байта каждая. В младших моделях серверов кэш третьего уровня отсутствует. Они могут содержать до 4 процессоров и иметь до 768 Мбайт оперативной памяти.

Старшие модели AV 4700/ 4800/5800, о которых мы в дальнейшем и будем говорить, поддерживают до 8 процессоров и имеют оперативную память емкостью до 2 Гбайт. Обращения к памяти обрабатываются контроллерами, которых может быть до двух для AV4700 и до четырех для AV4800/5800. Каждый контроллер обслуживает по 16 разъемов для SIMM. Для организации ввода-вывода применяются шины PCI. В старших моделях имеется по 6 слотов PCI, причем в базовых конфигурациях 3 из них свободны. Эти модели допускают подключение дополнительных шасси, содержащих еще 16 слотов PCI. При вводе-выводе может использоваться двухканальное подключение PCI, что еще более повышает надежность. Стандартные конфигурации включают в себя поддержку каналов SCSI-2 (как в однопроводном, так и в дифференциальном исполнении). Комплектация дисковыми массивами CLARiiON C1000 и C2000, которые поддерживают RAID уровней 0, 0/1, 1, 3 и 5, помогает в создании высоконадежных систем. Массивы С1000 и С2000 содержат до 10 и до 20 устройств соответственно, по 4 Гбайт на устройство. Возможно подключение QIC, 4-мм DAT и 8-мм накопителей на магнитных лентах. Поставляются также и ленточные массивы CLARiiON, также использующие RAID-технологию и, следовательно, обеспечивающие повышенную надежность архивирования.

Системы высокой степени готовности

Фирма Data General называет свои вычислительные комплексы системами высокой степени готовности (high availability) в том смысле, что периоды времени, когда они по каким-либо причинам не могут выполнять приложения и обслуживать пользователя, сведены к минимуму. Для поддержания высокой готовности применяется, в частности, избыточность в подсистемах электропитания и охлаждения (построенных по принципу "N+1"), защита кодами ECC как системной шины, так и ОП, использование дисковых и ленточных массивов CLARiiON, а также наличие более чем одного пути ввода-вывода к дискам. Автоматическое восстановление с участием ОС DG/UX ("фирменная" версия Unix SVR4) при сбоях процессоров, памяти и дисковых каналов происходит, по утверждению DG, за несколько минут. Это восстановление может включать в себя реконфигурацию и перезагрузку ОС.

Такие характеристики приближают их к более надежному классу систем, устойчивых к отказам (fault tolerance). Важным показателем является наличие разработанной DG диагностической системы AV/Alert, работа которой автоматически инициируется компьютером при возникновении ошибок и может включать в себя вызов фирменной службы поддержки через модем.

То, что мы сейчас описали, DG называет высокой готовностью первого уровня если не используются дисковые и ленточные массивы CLARiiON) или второго уровня (при применении CLARiiON и реляционной СУБД, гарантируюшего целостность и согласованность данных на прикладном уровне). Дисковые массивы CLARiiON обеспечивают, в частности, возможность горячей замены всех избыточных компонентов - дисков, процессора памяти, блоков охлаждения и электропитания.

Переход к 3 уровню происходит при образовании кластера из серверов DG, совместно использующих массивы CLARiiON. Реализуется своеобразная "схема N + 1" по отношению к сбоям всей системы. Большую устойчивость к сбоям по сравнению со вторым уровнем обеспечивают дополнительные серверы AViiON, а также дополнительное программное обеспечение - DG/UX Cluster Software и DG/UX CLuster Manager. В случае сбоя узла кластера ОС автоматически рестартует обработку приложения по правилам, определенным системным администратором посредством DG/UX Cluster Manager. Сетевые запросы также будут направлены на другие узлы. Продолжение сервисного обслуживания можно сделать прозрачным для клиентов путем добавления монитора обработки транзакций типа Tuxedo.

На 4-м уровне высокой готовности обеспечивается разделение файлов, печати, пакетной нагрузки и сервиса БД между узлами кластера. Здесь используется DG/UX Cluster Software и Oracle Parallel Server. При этом также удается добиться хорошего уровня масштабирования производительности при обработке приложений. Клиенты могут заново подсоединяться к любому узлу для продолжения сервисного обслуживания, что, как и ранее может быть сделано прозрачным при добавлении монитора обработки транзакций. Повышение надежности до уровней 3 и 4, также как и рост производительности, достигается путем урегулирования объема дополнительных финансовых затрат. В конце прошлого года DG сообщила о достижении рекордного показателя 3406.2 tpmc (на тестах ТРС-С) для 7-процессорной системы AV5800 с 30 Гбайт дискового пространства CLARiiON при работе с СУБД Oracle 7. Стоимость tpm в расчете на 5-летний срок эксплуатации составила $240.

Наконец, DG предлагает еще 5-й уровень - "global availability", который обеспечивает оперативный сервис 24 часа в сутки благодаря соединению кластеров DG/UX, географически удаленных друг от друга и разделяющих общие БД благодаря применению технологии Replicated Server (например, Oracle 7.1, CA-Open Ingres Replicator, Informix On-Line, Sybase Replicated Server). Компания сравнивает этот уровень с традиционным "жизненным циклом" мэйнфреймов, где работы по поддержке осуществляются в выходные, а большие изменения планируются на период праздников.

Архитектура NUMA

Данная архитектура используется также в анонсированных DG SMP-серверах, базирующихся на микропроцесорах Pentium Pro от Intel (с тактовой частотой 166 или 200 МГц), поэтому мы будем рассматривать ее на примере этих новых компьютеров. NUMA может считаться расширением обычной архитектуры SMP. В NUMA предлагается объединение SMP-систем с помощью общей шины. Каждая SMP-система (узел NUMA) имеет собственную память, процессоры и каналы ввода-вывода. Анонсированные серверы на базе Pentium Pro снабжены архитектурой ccNUMA (сс означает когерентный кэш), в которой в качестве узлов выступают платы SHV (Standard High Volume) от Intel, содержащие по 4 микропроцессора Pentium Pro. Эти микропроцессоры имеют кэш второго уровня емкостью 512 Кбайт. В каждом узле SHV есть также своя оперативная память емкостью до 3 Гбайт и дублированные каналы PCI. Узлы SHV связываются между собой посредством мостов SCI (Scalable Coherent Interface), которые поддерживают соединение между узлами по типу точка-точка с пропускной способностью 1 Гбайт/с. В состав мостов входит также кэш третьего уровня. Все это оборудование обеспечивает когерентность кэш-памяти различных плат SHV. Таким образом, вся оперативная память компьютера является общей, хотя физически она распределена между узлами. Эта схема позволяет распараллеливать задачи в удобной для пользователя модели общей памяти, и ее следует признать весьма перспективной. Аналогичная иерархия памяти используется, например, в суперкомпьютерах Convex Exemplar SPP.

Data General планирует поставки систем, содержащих до 8 узлов SHV. В системах ccNUMA следующего поколения число узлов может быть увеличено.

Стартовая цена (в США) для серверов AV4700 составляет 20 тыс. долл., для AV4800 - 30 тыс. долл., для систем на базе Pentium Pro - 45 тыс.