Разработка суперЭВМ семейства СКИФ основана на единой концепции создания входящих в его состав изделий, предоставляющей возможность формирования различных конфигураций высокопроизводительных вычислительных систем, оптимизированных для конкретных применений. Создаются аппаратные средства, системное программное обеспечение, инструментарий разработки параллельных программных систем, а также приложения, рассчитанные на выполнение на многоузловых вычислительных комплексах с многоядерными процессорами.
«Одной из важнейших задач является достижение чрезвычайно высокой плотности упаковки компонентов, что позволит существенно снизить задержки и повысить надежность за счет сокращения кабельных разъемных соединений», — подчеркнул Абрамов. Так, если во введенной в действие в 2008 году суперЭВМ ряда 3 «СКИФ МГУ» в отсеке стандартной стойки высотой 1U размещается четыре процессора, то в системах ряда 4 этот показатель доведен почти до 12.
К настоящему времени создан и находится в процессе опытной эксплуатации вычислительный узел суперЭВМ ряда 4. В этом модуле-лезвии устанавливаются два процессора Intel Xeon с микроархитектурой Nehalem, модули оперативной памяти DDR3, которые для повышения надежности впаиваются в плату, программируемая логическая матрица (Field-Programmable Gate Array, FPGA), твердотельный накопитель и ряд других компонентов. Его первая демонстрация состоялась в апреле еще до официального объявления процессоров Intel.
Для охлаждения модуля используется водяной радиатор, способный обеспечить нормальный температурный режим при энергопотреблении до 1 кВт. Он выполнен в виде платы, плотно прилегающей к компонентам модуля и совпадающей с ним по размерам. Энергозатраты на водяное охлаждение, как утверждают разработчики, вдвое ниже по сравнению с затратами на воздушное охлаждение, а используемые соединители для притока и отвода воды рассчитаны на длительную безотказную работу.
В «корзине» высотой 6U размещаются 32 лезвийных модуля, обеспечивая получение производительности 3 TFLOPS. Установка таких корзин в стандартной 19-дюймовой стойке позволяет довести суммарную производительность до 24 TFLOPS.
Взаимодействие вычислительных модулей осуществляется посредством системной сети 3D Тор собственной разработки. Топология трехмерного тора, которая, как следует из названия, лежит в ее основе, предусматривает организацию дублированных кольцевых каналов передачи данных внутри шасси, между шасси в шкафу, а также между шкафами системы.
Сеть организована с использованием чипов FPGA, которые осуществляют взаимодействие с системной шиной модуля по каналам PCI Express, а также обмен данными с другими вычислительными узлами. FPGA применяются и для ускорения выполняемых алгоритмов.
Коммутируемая сеть InfiniBand резервирует основную системную сеть и используется для обмена файлами и управления кластером. Еще две независимые сети предназначены для синхронизации вычислительных узлов.
Для достижения высокой надежности в суперЭВМ ряда 4 применяются датчики, расположенные на различных платах, а также три независимые сенсорные сети мониторинга и управления. Одна из них, являющаяся выполненной в ИПС РАН модификацией сети ServNet, снабжена собственной подсистемой электропитания и инфраструктурой передачи данных.
Абрамов особо отметил, что в результате создания новой серии суперЭВМ семейства СКИФ ее российским разработчикам будет принадлежать интеллектуальная собственность на все конструктивные компоненты и печатные платы, включая системные, соединительные и ряд других. В их распоряжение поступит полный комплект конструкторской документации, они получат возможность размещать изготовление всех блоков и узлов на любых, в том числе и отечественных, предприятиях.
В настоящее время ведутся переговоры с потенциальными заказчиками; формируется партнерская сеть для создания программно-аппаратных решений в рамках программы «СКИФ-Грид» и продвижения готовых продуктов на их основе.
В текущем году будут выпущены опытные образцы моделей СКИФ 4/Н, производительность одного шкафа которых составит 24 TFLOPS при энергоэффективности 0,25 TFLOPS/Вт. К 2012 году, как ожидается, удастся достичь восьмикратного роста этих показателей.