Сегодня на ИТ-рынке востребованы открытые Web-протоколы и распределенные вычисления
Мишель Тейсседре: «Наша бизнес-модель для Grid аналогична бизнесу таких компаний, как PepsiCo, продвигающей брэнд ?Аква-минерале?» |
Тревожные для ИТ-индустрии тенденции побуждают ведущих игроков этого рынка искать пути интенсификации своего бизнеса, делая, в частности, ставку на оптимизацию использования уже накопленных клиентами компьютерных инфраструктур. Одно из возможных решений — коммерциализация зародившейся в академических и университетских кругах концепции сетей распределенных вычислений и метакомпьютинга, более известной сегодня как технология Grid. Корпорация IBM провела недавно в Монпелье (Франция) пресс-брифинг, посвященный перспективам развития данной технологии. На вопросы главного редактора журнала «Открытые системы» Дмитрия Волкова отвечает Мишель Тейсседре, вице-президент IBM по стратегическому развитию электронного бизнеса для региона EMEA.
Что для IBM сегодня означают технологии Grid? Не выходит ли здесь на первое место маркетинг, как считает один из «отцов» Grid Карл Кесселман?
Категорически не согласен. Конечно, как представитель академического мира и видный деятель университетских кругов, Кесселман может утверждать, что внимание коммерческих поставщиков к детищу сообщества независимых разработчиков и создателей свободно распространяемого программного обеспечения преследует маркетинговые цели, однако сегодня Grid — это реальная бизнес-стратегия IBM.
Бизнес волнует три ключевых вопроса: Как лучше управлять существующей ИТ-инфраструктурой? Как получить максимум выгоды от новых технологий? Как максимально удовлетворить свои потребности? И мы принимаем правила игры на современном техническом рынке, где востребованы открытые Web-протоколы и распределенные вычисления. Анализ динамики рынка показывает падение полезной загрузки серверов (в ряде исследований называется показатель не более 12%). Одновременно растет емкость хранилищ данных и их распределенность, что требует интеграции разрозненных ресурсов и виртуализации проектных команд. Все большую роль играют соглашения об уровне обслуживания (service level agreement, SLA) как независимая от внешних условий гарантия соблюдения заявленной поставщиком и оплаченной потребителем производительности и пропускной способности. А как этого достигнуть в условиях непредсказуемости пиковых нагрузок, сбоев компьютерных систем или форс-мажорных обстоятельств? Оказывается, сегодня Grid — одна из наиболее перспективных технологий, позволяющих оптимизировать затраты на бизнес, уменьшить стоимость владения и перераспределить вычислительную нагрузку на свободные ресурсы.
У IBM три центра, так или иначе связанных с технологиями Grid. В американском Остине занимаются оценкой и тестированием новых решений, во французском Монпелье — их разработкой и внедрением, в Токио — работой с клиентами. Все исследовательские лаборатории IBM включены в так называемый Blue GRID, объединяющий центры в Беблингене (Германия), Цюрихе (Швейцария), Монпелье (Франция), Токио (Япония) и Хайфе (Израиль).
Каковы сферы применения Grid? Есть ли примеры практического использования этой технологии?
От инфраструктуры Grid может извлечь пользу во множестве типов применений. Если Internet выступает в роли поставщика информации, то Grid — это практически неограниченно масштабируемый инструмент ее обработки. Среди конкретных инсталляций можно назвать TeraGRID — сеть для консорциума четырех ведущих исследовательских центров США. IBM построила эту крупнейшую в мире Grid-инфраструктуру путем объединения, в частности, множества Linux-кластеров с общей производительностью 13,6 трлн. операций в секунду. Еще примеры: DAS-2 (Национальная сеть Германии), Research Grid для Великобритании, Grid для ЦЕРН, Швейцария. Есть и коммерческие применения, архив медицинских данных — National Digital Mamographic Archive в США, компания Butterfly.net — использование Grid в индустрии развлечений для доставки видео по запросу. В последнем случае задействованы Linux-серверы IBM xSeries, способные поддержать работу более одного миллиона одновременно играющих пользователей. Предусмотрена возможность подключения персональных компьютеров, игровых консолей, даже устройств Pocket PC и Palm.
Примеров из бизнеса пока немного, да и готовы ли вообще коммерческие пользователи к применению Grid?
Согласно исследованиям аналитиков, 78% компаний из Fortune 500 в случае простоя своих ИТ-инфраструктур в течение более чем пяти дней уйдут из бизнеса. Все сегодня уже осознали, что Internet — это неисчерпаемый источник информации, но не все еще поняли, что для ее обработки требуются адекватные по масштабу источники вычислительных ресурсов. Бизнес — это не спокойно текущая по равнине река, на ее пути обязательно возникают водопады — пиковые нагрузки, пороги — неплановые выбросы трафика и т.п. Задача Grid — исключить провалы производительности при любых неожиданностях, перераспределить ресурсы для решения кратковременных, но интенсивных задач, таких, как обслуживание информационной системы Олимпийских игр, закрытие квартального баланса крупного банка и т.п.
Технология Grid, в частности система Globus, пришла в коммерческий мир из академических кругов, а каким собственным опытом располагает IBM в этой области?
Сегодня только старожилы помнят о первооснове Grid — системе IBM VM, предлагавшей пользователям виртуальные ресурсы конкретного мэйнфрейма: процессоры, память и диски. Базовым программным обеспечением для Grid и международным стандартом де-факто является сегодня система Globus, признанная ведущими игроками ИТ-рынка. Технологии Globus взяты за основу ведущих проектов в данной области: IPG, NCSA, Gryphyn, DataGrid, Butterfly.net. Большая часть новых исследований и разработок в области Grid ориентируется именно на Globus. Так, IBM бесплатно распространяет инструментарий Globus Toolkit, позволяющий коммерческим компаниям и университетам строить сети распределенных вычислений, создавать службы и приложения. Дистрибутив снабжен документацией, а также скриптами для развертывания системы на IBM eServer с операционными системами Linux и AIX или на других платформах. Обеспечено взаимодействие с решениями всех заинтересованных поставщиков: Avaki, DataSynapse, Entropia, Platform Computing и United Devices, а также с бесплатными системами наподобие OpenPBS и Condor.
На базе Globus в IBM Research создали географически распределенный «суперкомпьютер», объединяющий исследовательские и проектно-конструкторские лаборатории корпорации в США, Великобритании, Израиле, Швейцарии и Японии. Консолидированные ресурсы этой Blue Grid используются, например, для моделирования микропроцессоров. Более 2 тыс. человек в IBM так или иначе работают сегодня с технологиями Grid. Мы регулярно проводим конференции по данной технологии и активно сотрудничаем со всем сообществом разработчиков и администраторов, принимающих участие в создании и поддержке Globus.
В чем особенность подхода IBM к технологиям Grid?
Вполне естественно, что, как это уже случилось с Linux, технологии Grid не остались без внимания других игроков ИТ-рынка. Однако, скажем, Sun Grid Engine, на мой взгляд, — это скорее кластерная система с распределением нагрузки, а в состав Grid, как известно, могут входить не только кластеры, но и суперкомпьютеры, рабочие станции, ПК, вплоть до ноутбуков. Grid — изначально открытая, теоретически бесконечно масштабируемая система, как, скажем, международная телефонная сеть, в отличие от телефонной системы отеля. В какой-то степени, Grid — это кластер кластеров, образованных различными платформами. Решение от HP, например инсталляция для Министерства энергетики США, — это развитая конфигурация вокруг суперкомпьютера с производительностью 9,2 TFLOPS, интегрированного в систему DOE Science Grid, которая образована в конце 2001 года. Пока, как мне кажется, это экстенсивный путь, несмотря на то что в состав этой сети входят пять крупнейших национальных исследовательских лабораторий. С другой стороны, нельзя умалять вклад в технологию Grid каждого участника компьютерного сообщества. Grid — это набор служб, и, как и в случае Web-служб, здесь не обойтись без открытых стандартов.
Какова бизнес-модель IBM по отношению к Grid?
Наша бизнес-модель для Grid аналогична бизнесу таких компаний, как Pepsi Cola, продвигающей брэнд «Аква-минерале». В природе имеется чистая вода, и ее не надо производить. Однако сбор, фасовка, доставка потребителю, логистика — это инвестиции. Затраты на первоначальное приобретение ОС Linux близки к нулю, но сопровождение, поддержка, консалтинг решений на этой платформе стоят денег, а значит, есть место для бизнеса. По мнению аналитиков, только 30% ИТ-бюджета уходит на закупки программ и оборудования, остальное — сервис. Раньше не было потребности в Grid, а чистая вода была доступна всем, изменились рынок и экология — бизнес отреагировал. Если говорить шире, то стратегия IBM по отношению к Grid весьма проста: развивать партнерские отношения с поставщиками инструментария для Grid, поставщиками приложений, сообществом разработчиков Globus и промежуточного программного обеспечения, развивать Open Grid Services Architecture на основе J2EE.
Каков объем рынка решений Grid для региона EMEA?
Объем рынка в данном регионе мы оцениваем в 400-500 млн. евро. причем он будет увеличиваться, учитывая такие преимущества, привносимые в бизнес технологией Grid, как низкая стоимость владения за счет оптимизации использования всех имеющихся ресурсов и т.д.
Перспективы Grid?
Grid берет свое начало в 1996 году, когда появились первые распределенные вычислительные сети университетов и научных центров — это был intraGrid, или еще его называют «альтруистический Grid» для кампусов и коллабораций. Сегодня на арену вышел extraGrid, или «партнерский Grid», объединяющий подразделения компаний, их субподрядчиков внутри конкретной отрасли, например, машиностроения. Завтра нас ждет эпоха WWG (World Wide Grid) — динамическое объединение всех ресурсов, имеющих отношение к решению конкретной задачи. Предположим, вам нужно сварить кофе. Вы берете кофеварку, включаете ее в розетку, но еще ничего не происходит, пока вы не позвоните своему электропровайдеру — это и есть иллюстрация нынешнего состояния Grid. На уровне WWG вычислительные ресурсы будут так же доступны, как сейчас электричество: вставил вилку в розетку и получил кофе. Неважно, откуда пришел ток, где расположена электростанция и знает ли провайдер о вашем намерении использовать его ресурс в данный момент.
Белые пятна
Для Grid требуется разработать стратегии, исключающие потерю стабильности работы вопреки политическим, социальным и технологическим неурядицам, а также предложить инструментарий для создания соответствующих приложений: отладчики, инструменты поддержки отказоустойчивости, мониторы производительности, и т.п. Также необходимо решить следующие проблемы.
Структурно-инструментальные. Grid рассматривается как совокупность согласованных Web-служб, а для их безболезненной интеграции сегодня предлагается архитектура OGSA, которая войдет в третью версию Globus. Требуется еще разработать ряд протоколов.
Технологические. Речь идет о наполнении OGSA конкретным содержанием: нужно поддержать запуск заданий, реализовать информационную службу, мониторинг ресурсов, обеспечить безопасность. В каком-то виде все это было реализовано в предыдущих версиях Globus, но еще на недостаточно высоком уровне, чтобы строить решения для коммерческих пользователей. Почти не проработан вопрос эффективной координации использования ресурсов, предполагающей аккуратное планирование распределения нагрузки. Предстоит решить вопросы, связанные с биллингом, — сейчас пока нет общепринятого средства его реализации.
Организационные. Проблема общего рынка ресурсов для Grid (по аналогии с рынком электроэнергии) пока не совсем очевидна — предстоит разработать механизм вовлечения ресурсов, например, конкурирующих компаний, в состав Grid. Здесь же возникает проблема использования лицензионного программного обеспечения, защиты ноу-хау и т.п., что будет особенно актуально в связи с развитием extraGrid.