Столь широкое представительство свидетельствует об успехе и самой конференции, и отрасли в целом; но у успеха есть обратная сторона, мероприятие из научного превратилось в немалой степени в коммерческое.
Возможно, уже в скором времени на ICS объявят о преодолении экзафлопного барьера. Источник: www.isc-events.com |
Программа и состав участников нынешней конференции со всей очевидностью свидетельсвуют об окончании периода, когда преобладало упрощенное отношение к идее суперкомпьютера, навеянной кластерами Beawulf. Больше нельзя верить ни хакерским утверждениям о «суперкомпьютере своими руками», ни увещеваниям политиков о возможности вхождения России в тройку лидеров, если поднапрячься. Мир суперкомпьютеров становится весьма профессиональным и технологичным. За минувшие несколько лет оказалась полностью исчерпана возможность установить рекорды путем незамысловатого объединения стандартным межсоединением немыслимого количества процессоров, в том числе графических, с затратой столь же огромного количества энергии. Об этом прежде всего свидетельствуют успехи корпорации IBM, ее компьютеры BlueGene/Q заняли четыре почетных места в первой десятке новой версии суперкомпьютерного рейтинга Top 500, в том числе и первое (а в общей сложности в Top 500 попали 20 систем с этой архитектурой). Тираж — вот в чем качественное отличие Sequoia и его младших братьев от прежнего лидера Fujitsu K Computer. Японский гигант стоимостью в миллиард долларов был и останется уникальной разработкой, а IBM создала серийную технологию.
Обретение профессиональности рынка высокопроизводительных вычислений сопровождается несколькими тенденциями. Во-первых, наблюдается явный спад интереса к графическим процессорам, они повторяют ту же судьбу любых ускорителей в любых индустриальных сферах. В компьютерной отрасли они способны обеспечить более высокую скорость решения отдельных задач, но не могут лечь в основу магистрального пути развития из-за очевидных проблем с распараллеливанием. На данный момент ускорители стоят всего в 58 машинах из Top 500, из них в 53 — Nvidia Fermi, по два — IBM Cell и ATI Radeon и пока всего один — Intel MIC. (Компания Nvidia формально не участвовала в ISC’12, но провела в соседней с Центром конгрессов гостинице отдельное, относительно немногочисленное мероприятие, где представила свои новинки, в том числе графический процесссор Kepler — наследник Fermi. — Л. Ч.)
Во-вторых, очевиден повышенный интерес к межсоединениям на базе высокоскоростных коммутаторов. Теперь эта технология доступна не только таким крупным компаниям, как IBM, SGI и Cray, но и менее известным, среди них европейские Eurotech и Extoll, есть свои разработки в Японии, Индии и России. В основном это реализации идеи трехмерного (и более) тора, подобные решения имеют стратегическое значение, а потому они не попадают в категорию «продуктов с полки», не продаются, как оборудование для Infiniband или Ethernet, их можно приобрести либо в составе компьютера, либо разрабатывать самостоятельно. Показательно, что только в 2010 году первые машины на коммутаторах вошли в Top 500, а сегодня их более 50, причем они занимают верхнюю часть списка, а в десятке лидеров их подавляющее большинство. Можно лишь сожалеть, что на ISC’12 не была представлена команда из НИЦЭВТ, разрабатывающая свой собственный коммутатор, она бы выглядела вполне достойно на фоне именитых грандов.
Третья тенденция — распространение водяного охлаждения. Совсем недавно это непростое, но эффективное инженерное решение рассматривалось как экзотика. Так, например, смотрелись плата прошлогоднего лидера К Computer, где каждый процессор накрыт медным кожухом, а по платам протянуты медные трубки, подающие охлаждающую жидкость. Альтернативные решения достаточно остроумны, в частности английская компания Boston погружает стандартные платы в герметические корпуса, заполненные диэлектрической жидкостью, которая используется в качестве единственного теплоносителя или передает отобранное тепло воде. Еще более практичны решения Eurotech и отечественной компании РСК, в которых стандартные платы накрываются прецизионными теплоотводящими пластинами, где циркулирует вода. Самым крупным решением с водяным охлажением стал IBM Super MUG, занимающийbявший четвертое место, он работает на горячей воде, и эта вода в дальнейшем используется для технических целей.
Суперкомпьютинг по-русски
Организаторы конференции устроили чрезвычайно интересное действие, названное «горячим стулом». По строгому регламенту ровно 12 минут на сцене находился представитель компании; первые шесть отводилась под презентацию, вторые — под ответы на вопросы, в том числе, и неизвестные заранее. Вопросы были разные, но самый распространенным был следующий: «Вы кто, создатель нового или эффективный интегратор?» Разумеется, все представляли себя творцами, но показательна сама постановка вопроса: сборка из готовых компонентов перестала цениться. На неудобном месте побывали представители и двух отечественных компаний, «Т-Платформы» и РСК. Надо отдать им должное: они прошли это испытание вполне успешно.
«Т-Платформы» видят свою добавленную стоимость в создании конфигураций, в наибольшей степени соответствующих запросам потребителей, для чего используются серверные платы и корпуса собственной конструкции. В компании считают, что наибольшим спросом у пользователей пользуются два типа решений — начинающие предпочитают небольшой предварительно сконфигурированный параллельный компьютер, готовый к работе с момента включения, как ПК, а более искушенные избирают для себя модульные варианты, позволяющие собрать систему «под задачу». По этой причине из более чем трех сотен поставленных «Т-Платформами» систем суперкомпьютеры составляют меньшинство. Основой же производственной программы стали два продукта. Первый — компьютеры для рабочих групп T-Mini P в компактных корпусах, их вес — около 100 кг, они строятся на процессорах х86-архитектуры и Nvidia, предел расширения — 16 узлов. Основой второго служит автономное шасси V5000 System Enclosure, имеющее собственные системы управления, электропитания и охлаждения. Заказчик вправе выбрать предпочтительную систему межсоединения и нужный ему набор вычислительных модулей одного из двух типов — на процессорах Intel Xeon E5 2600 или AMD Opteron 6100/6200 и Nvidia Tesla.
РСК собирает свои компьютеры из готовых плат, поставляемых такими компаниями, как Supermicro, а ее добавленная стоимость заключается в инженерной обвязке. Прежде всего, это водяное охлаждение, которое позволяет интегрировать воедино вычислительную часть машины с системами электропитания и охлаждения. В состав продуктовой линейки входят решения на базе архитектуры «РСК Торнадо»: «РСК микроЦОД» (от 16 до 64 узлов), «РСК миниЦОД» (от 64 до 256 узлов) и «РСК ЦОД» (более двух стоек, производительность — до десятков петафлопсов).
Новое
Наиболее интересные технологические новинки предложили компании Intel и Mellanox, а также доселе малоизвестный стартап Skyera. В Intel объявили о выходе на рынок уже в текущем году мультиядерной технологии MIC (Many Integrated Core), прежде известной как Knights Corner, а теперь под новым названием Xeon Phi, подчеркивающим ее близость к архитектуре х86. Предполагаемая производительность платы с двумя Xeon E5 и одним чипом MIC должна быть равна примерно одному терафлопсу, причем на долю последнего приходится 700-800 GFLOPS. Сначала новыми процессорами будут комплектоваться суперкомпьютеры Cascade, которые намеревается производить Cray. В расчете на новый процессор в Dell разрабатывается 10-петафлопный компьютер Stampede, проводятся исследования в университетах Германии, Японии и Кореи. О готовности строить свои системы на базе Xeon Phi заявили крупные вендоры IBM, HP, Dell, Bull, SGI и Fujitsu, а также компании второго эшелона — Appro, «Т-Платформы» и Penguin Computing. Совершенно очевидно, что Intel создает собственную альтернативу Nvidia Kepler. Принципиальное отличие Xeon Phi от графического процессора как ускорителя заключается в способности выполнять непосредственно весь код приложений, а не отдельные части, которые можно перенести на последний. Это не значит, что обеспечивается полная совместимость на уровне системы команд, но она реализуется с использованием компиляторов и других программных инструментов. Отсюда коэффициент «рабочая производительность/пиковая производительность» Xeon Phi, равный 75-80%, ниже, чем у центральных процессоров, где он в пределах 85-90%, но выше 50%, обычных для графических (приведенные цифры условны, они заметно варьируются в зависимости от архитектуры компьютера, но пропорции сохраняются).
Mellanox представила четвертую версию межсоединения Connect-IB со скоростью передачи данных 100 Гбит/с. Технология Dynamic Connected Transport, лежащая в основе Connect-IB и спроектированная в расчете на так называемые сверхмасштабируемые ЦОДы, она поддерживает оба наиболее популярные средства для обмена данными, интерфейс MPI (Message Passing Interface), ориентированный как на системы с распределенной памятью, так и на системы с разделенным глобально адресуемым пространством (Partitioned Global Address Space, PGAS). В первую очередь Mellanox намеревается выпустить пять разных адаптеров по технологии Connect-IB в расчете на разные версии PCI с поддержкой Windows Server различных версий, Linux и другого популярного ПО.
Skyera была не самой заметной на ISC’12, но то, что она показала, возможно, является самым революционным из всего представленного. Эта компания специализируется на контроллерах для твердотельных накопителей. Ключевой момент в разрабатываемых ею технологиях — конвергенция сетевых технологий с технологиями хранения данных, ее отличие в том, что в своих проектах Skyera не пытается эмулировать жесткие диски, а строит законченную инфраструктуру из относительно недорогих накопителей с многоуровневыми ячейками (MultiLevel Cell, MLC), обеспечивая ей на системном уровне необходимые эксплуатационные качества.
В следующем году конференция ISC переезжает в Лейпциг. Возможно, именно там, лет через шесть, будет объявлено о преодолении экзафлопного барьера.