, кто из производителей микропроцессоров сегодня оказывает самое существенное влияние на развитие компьютерной индустрии? Если в предыдущей статье в качестве двух основных полюсов фигурировали PA RISC и PowerPC, а уделом микропроцессоров MIPS был "третий полюс", то сегодня, после серии осенних объявлений, ситуация изменилась. Еще больше укрепилось положение PA RISC - все больше оснований зачислить туда продукцию Intel. Что касается второго полюса, то довольно неожиданно для неискушенной публики, часто ориентирующейся лишь на рекламную информацию, он представлен сегодня микропроцессорами MIPS. Попробуем проанализировать текущее положение дел, принимая во внимание не только такие статистические показатели, как общее число процессоров, но и более существенные факторы - наличие компьютерных архитектур, в полной мере использующих потенциал процессоров, а также соответствующего системного и прикладного программного обеспечения.

Осенью этого года компании HP/Convex и SGI/Cray выпустили ряд новых систем, архитектура и позиционирование которых на рынке позволили говорить о начале нового периода в истории развития микропроцессоров RISC и связанных с ними компьютерных архитектур.

Компания HP выпустила на рынок масштабируемые системы на базе PA-8000: HP Exemplar S-Class и X-Class, предназначенные для использования как на традиционном рынке суперкомпьютерных комплексов (научные исследования, гидрометеорология, а также специальное применение), так и в промышленности и коммерции. Четырехпроцессорные системы S-Class стоят около 200 тыс. долл., цены X-Class колеблются в диапазоне 720 тыс. - 3 млн. Дополняют данные компьютеры серверы K-Class и D-Class, стоимостью от 20 до 60 тыс. долл., выполняющие роль пост- и препроцессорных машин для задач визуализации и работы с intranet.

Почти одновременно с HP компания SGI предложила три новых модели: настольные станции O2, графические системы Onyx2 и масштабируемые до 128 процессоров и выше серверы Origin, принадлежащие классу суперкомпьютерных систем. Одновременно компания объявила о переходе на архитектуры S2MP, SN1 и SN2, а также о выходе новой версии ОС IRIX 6.4. Стоимость компьютеров Onyx2 и Origin 200 варьируется в пределах 29-200 тыс., а Origin2000 - от 85 тыс. до 1 млн. долл.

На сегодняшний день в области RISC-систем зафиксирована очередная "подвижка" полюсов, положение которых, по крайней мере в ближайшие полгода-год, будет оказывать сильное влияние на направления развития как компьютерных, так и микропроцессорных архитектур. Чтобы обосновать это утверждение обратимся сначала к данным статистики, а затем посмотрим, что предлагают сегодня компании - производители из этих двух полюсов и их ближайшие оппоненты.

Цифры - как упрямые факты

По данным статистики, на конец прошлого года, среди всех выпускаемых сегодня RISC-процессоров микропроцессоров с маркой MIPS было большинство.

В прессе уже неоднократно упоминалось, что кроме SGI и MIPS потребителями микропроцессоров серии Rxxxxx являются сегодня SNI, Pyramid Technology, NEC, Tandem Computers, Nintendo, Sony и ряд других, а процессоры MIPS поставляют на рынок шесть производителей полупроводников, среди которых NEC, Toshiba, Philips и др.

Модели компьютеров с полюса HP/Convex

Гвоздем осенней программы компании Hewlett-Packard стало объявление о выпуске двух мощных масштабируемых суперкомпьютерных систем на базе мультискалярного (4 инструкции за такт) процессора PA-8000 - Exemplar S-Class и X-Class. Выпуск данных систем стал частью начавшейся еще в апреле реализации программы создания единой линии двоично-совместимых систем, масштабируемых от настольных до суперкомпьютерных конфигураций. Это первое, с момента объединения компаний HP и Convex, объявление о выпуске совместных продуктов - новые серии Exemplar имеют в три раза более высокую производительность и могут нести в два раза больше процессоров, чем SPP1600 - предыдущая модель компании Convex.

Компьютеры Exemplar S-Class имеют архитектуру коммутируемой магистрали, к которой может быть подключено от 4 до 16 процессоров, что даст возможность получить 11,5 GFLOPS пиковой производительности. В масштабируемой системе Exemplar X-Class можно получить конфигурации от 16 до 64 процессоров при пиковой производительности 46 GFLOPS. Пропускная способность системной шины составляет до 15 Гбайт/с для S-Class и до 60 Гбайт/с для X-Class, а объем оперативной памяти может изменяться от 16 Гбайт до 64 Гбайт. Суммарная пропускная способность ввода/вывода для данных моделей составляет 1,9 и 7,6 Гбайт/с, соответственно. В перспективе планируется получить конфигурации семейства Exemplar мощностью до 512 процессоров и 512 Гбайт непосредственно адресуемой физической памяти.

Сферы применения компьютеров серии Exemplar - САПР в таких отраслях промышленности, как электроника и машиностроение, хранилища данных и электронные архивы, системы управления телекоммуникациями, корпоративные сети - в общем, все те приложения, которые в России приобретают сегодня наибольшую популярность. Среди первых зарубежных пользователей новых систем от HP/Convex национальный центр суперкомпьютерных приложений (NCSA), Mitsubishi Motors и Lockheed.

Вычислительные системы с полюса SGI/Cray

Два стратегических направления, на которых сегодня сконцентрировала свои усилия компания SGI, - это масштабируемость и пропускная способность. Для этого была отброшена любимая до сих пор многими производителями парадигма шинной архитектуры симметричной мультипроцессорной обработки (SMP), которой, в частности, до сих пор руководствовалась и компания SGI.

Компьютер Origin200 может иметь до четырех процессоров R10000 с 1 Мбайт кэш-памяти каждый, 12 слотов подключения периферии и 109 Гбайт внутренней памяти. Учитывая, что одно из приложений данных систем - это медиа-серверы, пропускная способность ввода/вывода, равная 2,6 Гбайт/c, пришлась весьма кстати.

Следующая модель - Origin2000 - состоит из отдельных модулей, каждый из которых может нести до 8 процессоров R10000 с 4 Мбайт кэш-памяти каждый. Емкость оперативной памяти составляет до 16 Гбайт, а объем дисковой памяти - 45 Гбайт на одном модуле. Скорость ввода/вывода составляет 5 Гбайт/c, а общий объем подключаемой к модулю внешней памяти - 18,5 Тбайт. Через магистраль CrayLink можно подключить до 8 модулей, то есть 64 процессора R10000, 128 Гбайт оперативной памяти, скорость ввода/вывода 40 Гбайт/c и 74 Тбайт внешней памяти, подключаемой через оптические каналы.

Однако все эти системы были лишь расширением традиционной архитектуры SMP - поистине колоссального роста производительности компания SGI достигла на новой серии компьютеров Origin2000 Supercomputing Servers. Эти системы применяют те же модули, что и семейство Origin2000, но объединяют их совсем по-другому, что позволяет преодолеть присущие архитектуре SMP ограничения. Origin2000 Supercomputing Servers масштабируется от 65 до 128 процессоров, что дает производительность 50 GFLOPS. Такое объединение стало возможным благодаря использованию соединения CrayLink и технологии Cray Meta Router. Емкость памяти для этих систем составляет 256 Гбайт, пропускная способность ввода/вывода 80 Гбайт/c, емкость внешних носителей, подключаемых по SCSI портам - 14 Тбайт, и по оптическому каналу - 74 Тбайт.

Системы Origin2000 Supercomputing Servers предназначены для пользователей, у которых уже сегодня возникают проблемы со скоростью при работе на компьютерах архитектуры SMP (уменьшение скорости предолевается при увеличении мощности конфигурации) и которые вынуждены еще использовать приложения и системы программирования, созданные именно для этой архитектуры.

Система Origin олицетворяет собой удачный сплав аппаратных и программных технологий Cray Research с микропроцессорными решениями от MIPS и опытом работы с архитектурами SMP от SGI. Иначе говоря, как заметил один системный администратор, работающий на старушке Personal IRIS в Тверском университете, "альянс SGI с Cray пошел явно на пользу первой компании, позволив ей больше не беспокоиться о пределах масштабирования своих систем". До начала совместных работ у SGI имелось решение в виде POWER Challenge Array, которое, как следует из данных TOP500, было достаточно популярно среди пользователей, однако принципиальные ограничения, присущие архитектуре SMP, сдерживали "полет фантазии" конструкторов из компании SGI.

Графический сервер Onyx2 - модификация Origin, снабженная графическими системами, в полной мере использующими потенциал системных магистралей и каналов ввода/вывода для решения задач визуализации.

Низкие цены - второй козырь нынешнего быстрого продвижения новых моделей рабочих станций и серверов SGI. Наиболее наглядно это можно проиллюстрировать на примере модели O2, первой в ряду масштабируемых компьютеров компании. Переход на процессор R5000/180 и использование новой интегрированной архитектуры, позволяющей в одном корпусе сочетать сервер и графику вплоть до обработки текстур и видеокомпрессии, дал возможность за счет эффекта системы увеличить показатель производительность/цена на 40%. Чтобы убедиться в этом, достаточно привести результаты, подготовленные независимой компанией Brown Associates (рис. 2).

Если говорить о стоимости по отношению к более старшим современным моделям SGI, то и здесь, по мнению ряда аналитиков, речь идет о прямой экономии средств: для Origin200 - это 30 долл. за MFLOPS; для исходной конфигурации Origin2000 стоимость в расчете на один MFLOPS составляет 70 долл., в то время как для расширенных конфигураций - только 40 долл.

Аналогичной политики придерживается сегодня и HP - выпуск новых высокопроизводительных серверов сопровождался относительным снижением цен.

Основные сферы приложения для серверов Origin - World Wide Web, хранилища данных, системы поддержки решений, интерактивная научная визуализация, а также традиционные применения в научных исследованиях, промышленности и коммерции.

Новые архитектуры и новые концепции ОС

Процессор, каким бы замечательным он ни был, никогда не "играет" в одиночку без наличия соответствующего окружения: материнской платы, общесистемной архитектуры и работающих приложений, бессмысленно говорить об успехах на рынке микропроцессорных технологий. Например, ни Intel, ни HP не торопятся обычно анонсировать свои микропроцессоры, пока не будут всесторонне апробированы реальные компьютерные конфигурации на базе новых микропроцессоров и получена критическая масса прикладного программного обеспечения. Достаточно упомянуть процессор Intel MMX, для которого уже имеются конкретные компьютеры и прикладные программы, однако представлен он будет, вероятно, до начала следующего года. Микропроцессор Merced (PA 9000/P7) уже имеется в наличии и кроме аппаратных тестов используется для обкатки совместного с компанией SCO детища - новой 64-разрядной ОС Unix, однако на любые вопросы о новом процессоре ответом служит - "no comments".

Архитектурой, адекватной возможностям R10000 и полностью реализующей его потенциал, оказалась S2MP - масштабированная обработка с использованием разделяемой памяти (Scalable Sharedmemory MultiProcessor), которая, по мнению представителей SGI, является "первой промышленной реализацией 64-разрядной архитектуры cc-NUMA". S2MP позволяет сочетать простоту программирования, присущую SMP-системам, с практически безграничными возможностями масштабирования - неотъемлемой особенностью архитектур с массовым параллелизмом. Масштабирование для архитектуры S2MP означает, что конфигурация может безболезненно наращиваться без использования кластеризации, минуя барьер в 36 процессоров, неизбежный для идеологии SMP. Данная архитектура позволяет на основе модульной организации (каждый модуль - это двухпроцессорный компьютер) строить конфигурации мощностью до 1024 процессоров, при этом производительность, как явствует хотя бы из рис. 3, растет линейно. Сегодня, особенно в связи с всплеском интереса к Internet и индивидуальной работе с клиентом, уже не редкость базы данных объемом в несколько терабайт. По мнению разработчиков Oracle, архитектура S2MP дает возможность создавать операционную среду, при которой большие куски информационных массивов могут кэшироваться непосредственно в оперативной памяти. Пользователи Informix также в состоянии на базе данной технологии хранить непосредственно в оперативной памяти базы данных объемом до 256 Гбайт. Одним из весьма полезных свойств S2MP - локализация аппаратных, а с помощью ОС Cellular IRIX и программных сбоев в рамках только одной ячейки, что повышает надежность и устойчивость конфигурации.

Другой ключевой технологией, работающей в паре с S2MP, является CrayLink, которая позволяет устранить потенциальные коллизии, неизбежные в архитектуре SMP. CrayLink представляет собой коммутируемую магистраль, укомплектованную новой системой управления памятью. Возможность собирать путем коммутации различные модули, объединяя их в единое целое, позволяет гибко перераспределять имеющиеся ресурсы компьютера для решения конкретной прикладной задачи. Магистраль CrayLink способна прокачивать данные со скоростью 1,6 Гбайт/c при производительности на операциях ввода/вывода 6,4 Гбайт/c.

Для работы с системами, построенными на базе архитектуры S2MP, была выпущена ОС Cellular IRIX, выросшая из 64-разрядной IRIX 6.2 и дополненная предложенной Cray технологией управления крупномасштабными гетерогенными системами. Новая ОС для станций и серверов компании SGI основана на распределении реплицируемых функций ядра по ячейкам, каждая из которых управляет своим подмножеством процессоров (от 8 до 128). Для организации единого, с точки зрения пользователя, интерфейса все ячейки взаимодействуют между собой. Данная архитектура отличается от традиционной микроядерной, используемой, например, в Cray T3E, и предполагает, что ОС не реплицируется в каждом узле.

По мнению Brown Associates, SGI сегодня единственная компания, из числа работающих в сегменте настольных систем, которая прочно удерживает позиции против NT, ведя при этом активную политику на снижение цен. Если сегодня пока только поговаривают о 64-разрядной версии для NT, сетевые возможности этой ОС находятся в стадии отладки, и многопроцессорность и масштабирование данной платформы не сулит особых перспектив, то клон Unix - ОС IRIX/Unicos уже сейчас позволяет настолько расширять конфигурацию, насколько это может себе позволить заказчик. При этом сохраняется полная совместимость приложений, а при использовании Cellular IRIX - преемственность в рамках различных ОС.

Несмотря на наличие принципиально новых решений в архитектуре S2MP и ОС Cellular IRIX, все они позволяют сохранить преемственность между работающими сегодня SMP-системами и новыми компьютерами Origin и Onyx2: существующие сегодня приложения для Power Challenge поддерживаются в модели S2MP и функционируют на масштабируемых системах Origin2000. Таким образом выполняется главное требование, ради которого и была задумана такая модернизация - создание полностью совместимого семейства систем, масштабируемых от настольных компьютеров класса ПК до суперкомпьютеров.

Для серии компьютеров от HP новой ступенью стала архитектура CC-NUMA (cache coherent non-uniform memory access), которая позволила достичь производительности системной шины в 60 Гбайт/с. Магистраль памяти в системах S- и X-Class напоминает традиционный кросс-бар суперкомпьютеров, но имеет существенно более широкие возможности наращивания производительности. Специальное устройство передачи данных DataMover управляет процессами пересылки информации на скорости 450 Мбайт/с.

Модернизированная ОС SPP-UX представляет собой вариант HP-UX, адаптированный для работы с 64-разрядными задачами. Для компьютеров X-Class SPP-UX работает как микроядро в каждом узле или гиперузле. Системное программное обеспечение, или Exemplar Operating Environment (EOE), имеет три различных уровня работы с параллельными приложениями: SMP, Threads и Explicit Message Passing. В состав EOE входит: автоматическая оптимизация, поддержка распараллеливающих компиляторов, средства программирования, библиотеки, 64-разрядные расширения. Однако наиболее интересной возможностью является Sub Complex Manager - инструмент системного администратора, позволяющий динамически изменять конфигурацию и перераспределять ресурсы в соответствии с текущими потребностями рабочих групп.

Для работы в среде SPP-UX компания HP объявила о выпуске новой версии компилятора Fortran 90, позволяющего оптимизировать код, способный функционировать на всем спектре высокопроизводительных компьютерных систем от HP. Компания включила в язык все популярные расширения языка, в том числе и указатели Cray, INTEGER*8, REAL*16 и структуры VAX/VMS. В состав среды разработчика включен HP DDE-отладчик, обеспечивающий работу над созданием оптимизированного параллельного кода. Компания Convex всегда отличалась аккуратностью и щепетильностью по отношению к разработчикам программ, в этом легко убедиться на примере новой среды программирования для SPP-UX, имеющей развитый графический интерфейс, удобству которого даже сегодня может позавидовать Windows. В состав среды разработчика включены средства оценки качества кода, выявления мест потенциальных коллизий и много других полезных в программистском хозяйстве "штучек".

Современная ситуация на рынке высокопроизводительных систем

На рис. 3 приведены сравнительные графики изменения производительности современных суперкомпьютерных систем (тест NPB/A) в зависимости от конфигурации.

Не вдаваясь в подробный анализ данных, которые иллюстрирует рис. 3, легко понять, что раскладка по полюсам микропроцессоров в точности отражается сегодня и на возможностях конкретных вычислительных систем. К сожалению, до мая не будет данных по Exemplar в конфигурации свыше 16 процессоров, однако нынешняя тенденция "схвачена" достаточно точно.

Так же, как и в России, в США весьма заманчивыми для деловых кругов считаются заказы государственных структур, хотя бы из соображений престижа. Сегодня Министерство энергетики и две крупнейшие исследовательские лаборатории предлагают совместный проект в 150 млн. долл., призванный стимулировать развитие суперкомпьютерных технологий. Речь идет о проекте ASCI (Accelerated Strategic Computing Initiative), который позволил выделять реальные возможности компьютерных систем и, в отличие от многообразных тестовых смесей, должен демонстрировать возможности новых архитектур, выступая своеобразным двигателем технологий на рынке высокопроизводительных вычислений. Начало проекту ASCI положила программа ASCI Red (Sandia National Laboratory), или программа создания компьютера производительностью в 1,8 TFLOPS, выявившая ряд проблем с управлением и масштабированием компьютерных систем, построенных на традиционной архитектуре распределенной памяти. Кроме этого, по результатам отчетов программы ASCI RED, в силу ряда причин практика отдельного применения SMP- и MPP-архитектур осложнилась; появились принципиальные проблемы при повышении производительности до терафлопных уровней.

Компьютер Origin2000 был принят к рассмотрению для участия в третьей фазе проекта ASCI (1996 - 1998) - программе ASCI Blue Mountain для Лос-Аламоской национальной лаборатории, а в программе ASCI Blue Pacific для Ливерморской лаборатории планируется активно задействовать систему RS/6000 SP. Ключевыми критериями попадания в список кандидатов для участия в третьей фазе проекта ASCI является стоимость 110,5 млн. долл., пиковая производительность свыше 3 TFLOPS и принципиальная приспособляемость вычислительной системы к работе над задачами моделирования, решаемыми в ядерной промышленности.

Первым шагом в реализации программы ASCI Blue Mountain стала установка 256-процессорной системы Origin2000, масштабируемой при помощи соединений HIPPI. В последующих реализациях планируется в 1997 году полностью перейти на новую технологию CrayLink. В 1998 году программа Blue Mountain будет опираться уже на конфигурацию из 3072 процессоров. В последующих генерациях проекта ASCI предполагается довести требования к производительности до 4 TFLOPS, что, по современным меркам, вполне под силу компьютеру из 4096 процессоров.

Архитектурой, способной выдержать такой наплыв процессоров, станет, по замыслу конструкторов из SGI, следующая после S2MP архитектура с расширенными возможностями масштабирования, или SN (Scalable Node) Zero, которая уже была использована в компьютерах T3E. Архитектура SN позволяет масштабировать конфигурацию компьютерной системы, оперируя тысячами процессоров. После завершения третьей фазы программы ASCI Blue Mountain произойдет переход на интегральную архитектуру SN2, которая позволит перекинуть мост между параллельными векторными машинами и SN1, объединив их в единый конгломерат. Системы на базе архитектуры SN2 станут первыми высокопроизводительными масштабируемыми компьютерами, сочетающими преимущества в соотношении цена/производительность по отношению к RISC-процессорам с возможностями векторных суперкомпьютеров.

В области архитектуры системных магистралей, опять же в рамках проекта ASCI, ожидается внедрение новой технологии MetaRouter, впервые опробованной в суперкомпьютере Origin2000/128.

Компания IBM - также один из основных игроков в проекте ASCI - работает над совершенствованием своих систем в содружестве с Cornell Theory Center (CTC), Ливерморской лабораторией и Pacific Northwest National Laboratory (PNNL). В следующем году на этих трех площадках планируется продемонстрировать работоспособность распределенной терафлопной суперкомпьютерной системы IBM RS/6000 POWERParallel System (SP). Собственно говоря, в CTC уже с 1995 года работает 512-процессорная конфигурация. В PNNL предполагается провести модернизацию системы до 472 новых процессоров Power2 SuperChip.

Микропроцессор Power2 Super Chip, в терминологии компании именуемый P2SC, основан на технологии CMOS и вобрал в себя мощь восьми микропроцессоров Power2, реализуемую на 15 млн. транзисторах. Процессор способен выполнять две операции над вещественными числами и две целочисленные операции за такт. Компания IBM уже объявила о новых wide- и thin-узлах для RS/6000 SP на базе новых микропроцессоров. Ливерморская лаборатория планирует получить из двух уже работающих 256-процессорных компьютеров систему, способную к 1998 году развивать скорость до 3 TFLOPS. Размер памяти в 512-процессорной системе Ливерморской лаборатории будет составлять 200 Гбайт.

Безусловно, через некоторое время мы опять станем свидетелями появления новых, еще более мощных систем. Собственно говоря, как следует из данных последнего TOP500, изменения, особенно на рынке высокопроизводительных систем, сегодня происходят с периодичностью в шесть месяцев, однако пока нет никаких оснований говорить о смене полюсов в ближайшие полгода-год.


С Дмитрием Волковым можно связаться по тел.: (095)529-1551