Росгидромете создается Центр компетенции по высокопроизводительным вычислениям в приложении к метеорологии. На реализацию программы «Модернизации и технического перевооружения учреждений и организаций Росгидромета» выделено 80 млн долл. из займа МБРР и 53 млн долл. из федерального бюджета, из них непосредственно на компьютеры — 25 млн долл. Победителями открытого тендера стали компании IBS, Silicon Graphics и Kraftway. Существенное участие также приняла корпорация Intel: в течение нескольких лет специалисты Росгидромета и Intel проводили работы по оптимизации программ и вычислительных моделей прогноза погоды. Внедрение новых технологий обеспечит повышение эффективности работы всех компонентов инфраструктуры Росгидромета, включая системы наблюдений, телекоммуникаций, обработки и архивирования данных, средств доведения до потребителей информации о состоянии процессов в окружающей среде.
На данный момент в Москве установлено два компьютера с общей пиковой производительностью 27 TFLOPS. Один из них — это система с единой общей памятью SGI Altix 4700 (1664 процессорных ядра Intel Itanium2 9140М с оперативной памятью 6,6 Tбайт) производительностью 11 TFLOPS, второй — кластерная система SGI из стандартных серверов Altix ICE (1408 процессорных ядер Intel Xeon е5440, оперативная память 2,8 Тбайт) производительностью 16 TFLOPS. Плюс к тому в региональных специализированных метеорологических центрах в Новосибирске, Хабаровске и Санкт-Петербурге устанавливаются аналоги SGI Altix 4700 — комплексы Kraftway G-Scale S-4700 (104 процессорных ядра Intel Itanium2 9140, оперативная память 200 Гбайт) производительностью по 0,6 TFLOPS.
Московская «спарка» интересна тем, что в ней, как в зеркале, отражаются две тенденции построения суперкомпьютеров — одна с общей памятью, а вторая с раздельной памятью в каждом узле. Формально система SGI Altix 4700 медленнее, но обошлась втрое дороже, однако она стоит этих денег, потому что на целом ряде реальных задач имеет в несколько раз большую производительность. Ее принципиальное отличие в том, что собирается она не из «обычных» серверов-лезвий, а из специализированных лезвий нескольких разных типов. Семейство SGI Altix 4700 включает вычислительные лезвия, каждое из которых содержит два процессора Intel Itanium2, лезвия расширения памяти, несущие в себе только слоты памяти DIMM, а также лезвия ввода/вывода и лезвие графических ускорителей. Кроме того, есть еще лезвие SGI Reconfigurable Application Specific Computing, в котором реализованы идеи реконфигурируемых вычислений. В SGI RASC используются программируемые массивы, которые могут быть адаптированы к специфическим задачам пользователя, что позволяет многократно ускорить вычисления. Лезвие RASC RC100 построено на двух матрицах Xilinx Virtex 4 LX200.
Все эти модули работают с памятью с общим доступом SGI NUMAflex объемом до 24 Тбайт, и, что особенно важно, при этом ко всей памяти в системе может обращаться любой процессор. Суперкомпьютеры SGI Altix отличаются исключительной масштабируемостью: сравните 24 Тбайт адресуемой памяти и 32 Гбайт в обычной кластерной архитектуре. В итоге снижаются задержки, отпадает необходимость перемещать копии данных, что упрощает программирование и повышает производительность, базы данных могут находиться непосредственно в памяти.
Архитектура SGI NUMAflex строится не на стандартных технологиях Ethernet или Infiniband, а на базе фирменного межсоединения SGI NUMAlink, именно оно обеспечивает функционирование архитектуры глобальной памяти с общим доступом.
Описанные архитектурные особенности SGI Altix 4700 обусловливают наиболее высокие показатели этой системы на кодах предсказания погоды. Тестирование проводилось на «мезошкальных», то есть усредненных по разным шкалам числовых моделях WRF (Weather Research and Forecasting) и MM5 (Mesoscale and Microscale). Технология SGI NUMAflex обеспечивает экстраординарную масштабируемость — до 512 процессорных сокетов и до 128 Тбайт памяти. И наконец, что немаловажно, работа с общей памятью обеспечивает высокий коэффициент полезного действия процессоров за счет того, что алгоритм не может быть распараллелен и ускорение достигается, если задача имеет доступ к большему объему памяти.