Крупномасштабные вычисления и Grid
В качестве одного из примеров применения Grid-технологий можно назвать использование программного обеспечения Globus для создания распределенной высокопроизводительной компьютерной системы, предназначенной для решения ресурсоемких задач кристаллографического анализа |
В МГУ прошла Восьмая Международная конференция, посвященная перспективным вычислительным и аналитическим методам физических исследований (International Workshop on Advanced Computing and Analysis Techniques in Physics Research).
Стартовала она со своеобразного «курса лекций» по Grid-технологиям, подготовленного с участием Карла Кессельмана из Университета Южной Калифорнии, одного из отцов-основателей Grid (в переводе с английского — «решетка», «сеть»).
И хотя на конференции работало одновременно несколько параллельных секций, а основной уклон был все-таки на применение современных компьютерных технологий в физике (именно задачи обработки получаемых на ускорителях экспериментальных данных и стали едва ли не основным испытательным полигоном технологий Grid), де-факто главной стала тема «Крупномасштабные вычисления и Grid».
От лица спонсоров выступили главы московских представительств Hewlett-Packard и IBM — Хилмар Лоренц и Кирилл Корнильев.
C пленарным докладом о Grid выступил и сам Кессельман. C окладистой бородой, в джинсах и красной рубахе навыпуск, он вполне соответствовал современному «научному» этапу развития технологий Grid: джентльмены в костюмах появляются на трибунах тогда, когда сформирован реальный рынок.
Из доклада Кессельмана, как и из многих других выступлений (в частности, сообщения Александра Константинова о проекте NorduGrid, объединяющем соответствующую инфраструктуру ряда северных стран, из доклада Дарона Грина и Натальи Железных об опыте работы IBM с технологиями Grid) и не в меньшей степени из кулуарных обсуждений стало ясно, что Grid находится в самом начале развития. Разработчики полны наполеоновских планов. Так, говорилось о череде революций в информационных технологиях: Internet в 80-х годах, Web-технологии в 90-х годах и, наконец, Grid в начинающемся тысячелетии. Если мы будем формально говорить о такой экстраполяции, то, по моему мнению, последующие шаги получаются все-таки менее значимыми, чем предыдущие.
Вообще говоря, Grid — это предложенная совсем недавно концепция, относящаяся к области метакомпьютинга, то есть к глобальной организации вычислительного процесса. В этой концепции, базирующейся на использовании стандартных протоколов и служб, описываются соответствующие функциональные требования. К сожалению, официально принятых стандартов Grid на сегодня не имеется, хотя де-факто современные разработки в этой области используют программное обеспечение Globus.
Сейчас у Grid две основные сферы применения. Это задачи интеграции ресурсов суперкомпьютерных центров с целью перераспределения пакетных заданий, то есть «вычислительный» Grid, и аналогичные задачи при обработке сверхбольших массивов экспериментальных данных в физике высоких энергий, которые относятся к технологиям Grid для обработки данных. Сейчас «решетке» пытаются дать новые задачи, среди них — работа с Web-службами, использующими архитектуру OGSA (Open Grid Service Architecture), и «услугами по запросу». Эти области уже ориентированы не столько на научные, сколько на коммерческие приложения, и о такой перспективе много говорят, в частности, в IBM и Sun Microsystems. Технологии Grid могут быть использованы, например, коммерческими фирмами, у которых в период пиковой нагрузки не хватает компьютерных ресурсов. Некоторые крупные корпорации уже подумывают об использовании Grid для «объединения» территориально распределенных ресурсов.
Вообще же суть концепции Grid состоит в ориентации на виртуализацию, в частности на создание «виртуальных организаций». За этим термином в Grid стоит технологически вполне определенное понятие.
Однако сегодняшние реализации Grid-проектов относятся к двум указанным выше традиционным областям применения Grid. Кроме «классических», общеизвестных примеров (проекты TeraGrid в CША и европейский EU DataGrid) упомяну, например, проект национального архива цифровых маммографических данных в CША (тип Grid — обработка данных). Объединение ресурсов в Grid, как и следовало ожидать, cопровождается большими проблемами организационного характера, о которых больше говорили в кулуарах.
Но даже в традиционной (если так можно говорить о технологии, насчитывающей всего несколько лет) области интеграции вычислительных ресурсов суперкомпьютерных центров Grid не предлагает готовых решений. Работы по созданию общей системы пакетных очередей для Grid начались и в нашей стране, в ИПМ РАН (Москва) и ИВВиИC (Санкт-Петербург). Фактически сейчас имеется только один стандарт — все разработчики применяют средства Globus, а альтернативные продукты, например Legion, оказались неиспользуемыми. Естественно, все это ориентировано в первую очередь на применение в среде Linux, хотя имеются реализации и для Sun Solaris, и для IBM AIX.