Продолжаем серию статей, отражающих общую стратегию компании Sun Microsystems (см. N5'97, 1'98 и 2'98). Ранее мы говорили о масштабируемости - главном средстве достижения требуемого уровня производительности и операционной системе Solaris.
В этот раз предлагается вниманию реализация принципов Sun Microsystems в стратегии построения систем хранения данных.
Компания Sun Microsystems не первый год активно работает на рынке систем хранения данных. Установив около 3000 ТБ систем хранения данных и устанавливая более 5 ТБ ежедневно, Sun Microsystems является лидирующим поставщиком дисковых подсистем для мира UNIX. Но следует отметить, что быстрорастущий рынок систем хранения данных весьма насыщен. Там успешно работают и EMC, предлагая систему Symmetrix, и Digital Equipment Corporation с семейством StorageWorks, и Data General, продвигающая свое семейство Clariion, и IBM с технологией SSA. Каждое из упомянутых решений обладает своими достоинствами и позволяет пользователю создать весьма эффективные вычислительные комплексы из серверов различных типов (мэйнфреймов или систем на базе ОС UNIX, VMS, NT и т.д.), систем хранения данных - дисковых массивов и устройств, предназначенных для архивации данных. Но все равно - это только островки информации. Каждый сервер, включенный в компьютерную сеть, имеет свое хранилище данных (рис. 1). В случае необходимости мы просто подсоединяем файловый сервер к компьютерной сети и обеспечиваем доступ к его дисковым подсистемам для всех пользователей и приложений в сети.
Традиционный подход: островки систем хранения
Но, к сожалению, большие приложения, работающие с файловыми серверами, "удушают" сеть, поскольку ее производительность относительно невелика, а объем используемых данных постоянно и очень быстро растет. В этой ситуации мы просто превращаем системы хранения данных в еще один источник проблем для компьютерной сети.
Следует особо учитывать то обстоятельство, что изменяется сама природа данных. Для старой информации все время находятся новые области применения, в особенности при работе систем класса Data Warehousing и систем поддержки принятия решений. Данные, разбросанные в локальной сети у множества пользователей, консолидируются, обеспечивая более широкую базу для работы аналитических систем (прыжок к дисковым системам терабайтного размера был вызван к жизни скорее потребностями систем Data Warehousing, чем Интернетом). Этот процесс приводит и к другому важному последствию: такого рода приложения имеют тенденцию удлинять жизненный цикл любой используемой информации, требуя все больших систем хранения и новых программных средств для управления огромными объемами данных.
Естественно, что возникающие огромные системы хранения информации заставляют строить их так, чтобы была обеспечена высокая степень надежности, минимальное время простоя (как профилактического, так и вызванного неисправностями различного рода) и простота обслуживания.
Таким образом, мы сталкиваемся с ситуацией, когда изменяющийся характер использования данных и неудержимый рост их объема заставляют создавать большие консолидированные системы хранения, а вычислительная сеть уже не справляется с дополнительной нагрузкой - обеспечением повсеместного доступа к этим данным.
Идея Sun очень проста - объединить все системы хранения, эти разрозненные островки информации своей сетью (рис. 2), которая обеспечила бы для данных те же преимущества, какие традиционная компьютерная сеть - для приложений и пользователей, а именно: доступность и способность управлять всей совокупной мощностью систем хранения данных, направляя их ресурсы в те места, где существует наибольшая в них потребность.
Что предлагает Sun: интеллектуальная сеть данных
Главное, что мы получаем от такой перемены точки зрения на системы хранения данных - ясное видение перспективы развития. Это дает нам возможность строить свои хранилища данных из имеющихся компонентов таким образом, чтобы на каждом этапе развития предприятия мы естественным образом составляли из них Интеллектуальную сеть хранения данных (Intelligent Storage Network - ISN) с учетом роста возможностей вычислительной техники.
Фактически нам для построения такой сети нужны: технология Fibre Channel, и коммутаторы Fibre Channel; ПО администрирования систем хранения на базе Java- технологии; интеллектуальные серверы данных; обеспечение одновременного доступа к данным; аппаратные компоненты для построения сети данных.
Технология Fibre Channel и коммутаторы Fibre Channel
Объединение носителей и хранилищ данных в свою собственную сеть - идея сравнительно новая. Истоки ее восходят к началу 90-х годов, к моменту разработки технологии Fibre Channel. Именно тогда была высказана идея создания "фабрики" Fibre Channel, которая позволила бы маршрутизировать весь поток информации между устройствами хранения и потребителями информации.
Ядром этой системы, в современном ее понимании, является коммутатор Fibre Channel, работающий в стандарте FC-AL (речь об этом стандарте пойдет ниже). К этому коммутатору подсоединяются все устройства хранения данных и потребители этих данных, а также серверы (рис. 3). В предельно простом случае коммутатор может отсутствовать - стандарт FC-AL допускает наличие на одном кольце большого числа как серверов, выступающих в качестве потребителей информации, так и дисков, дисковых массивов и средств архивации данных.
Fibre Channel - высокопроизводительный, воспринятый и широко поддержанный промышленностью стандарт, разработанный для двустороннего обмена данными между серверами, системами хранения, рабочими станциями, коммутаторами и хабами.
В некотором смысле технология Fibre Channel может рассматриваться как новый подход к решению характерных проблем, возникавших при создании систем хранения информации. Преимуществом Fibre Channel над другими технологиями является: эффективность и высокая производительность; масштабируемость; значительное увеличение расстояний между узлами сети; легкость использования и установки; поддержка популярных протоколов; отсутствие необходимости в использовании дорогостоящих кабельных технологий; низкий уровень электромагнитного излучения.
Fibre Channel Arbitrated Loop (FC-AL) - одно из важнейших достижений в обеспечении взаимосвязи между системами хранения базируется на технологии Fibre Channel. Используя простую топологию петли, FC-AL поддерживает как простые конфигурации, так и сложные сочетания хабов, коммутаторов, серверов и систем хранения. Более того, использование протоколов SCSI в системе FC-AL позволяет поднять уровень производительности существующих систем без дополнительных затрат и кардинальных изменений в драйверах устройств, операционной системе и микропрограммном ПО (firmware) дисковых систем.
Ключевые характеристики Fibre Channel Arbitrated Loop: пропускная способность канала 100 Мб/с в обоих направлениях (2,5 скорости Ultra Wide SCSI); возможность масштабирования сети; возможность увеличения расстояния между узлами сети до 10 км.
Ранее стандарт FC-AL был применен в SPARCstorage Array производства Sun, где оптоволокно использовалось для связи сервера и дискового массива. На следующем этапе, с появлением StorEdge А5000, FC-AL обеспечивает также и взаимодействие между всеми дисками, серверами, хабами, объединенными в общее кольцо.
Кроме того, Fibre Channel способствует значительному увеличению скорости взаимодействия и работы системы. Этот стандарт предусматривает широкий выбор популярных протоколов. Практически все требования, предъявляемые к работе компьютерной сети в масштабах крупнейшего предприятия, могут быть с успехом выполнены при использовании Fibre Channel. Применение данной технологии дает низкую стоимость, упрощенное администрирование и легкость реорганизации компьютерных ресурсов. Поскольку конкретные детали FC-технологии скрыты за интерфейсами используемых протоколов, увеличение объема программного обеспечения является минимальным. Обеспечивается поддержка следующих протоколов:
- SCSI
- TCP/IP
- Hippo
- IPPI
- ATM
- AAL5 (Adaption Layer for computer data)
- EC-LE (Link Encapsulation)
- IEEE 802.2
- TCP/IP
Можно предсказать успех технологии FC-AL, поскольку уже сейчас ее стремятся использовать как ведущие производители оборудования (Sun, HP, DEC, Compaq и др.), так и ведущие поставщики жестких дисков. Единственная жизнеспособная, конкурирующая технология SSA (Serial Storage Architecture), превосходящая по ряду показателей SCSI, принадлежит IBM. Однако IBM потерпела неудачу, пытаясь обеспечить своему стандарту повсеместное признание в промышленности, и, как результат, SSA, похоже, так и останется исключительно технологией IBM.
Хабы и коммутаторы. Решающее значение для FC-AL - технологии имеют хабы и коммутаторы. Хаб - неотъемлемая часть компьютерной сети, но его использование в массивах дискового хранения является новшеством. Использование хабов дает определенные преимущества: увеличивается возможность автоматического реконфигурирования контура в случае неполадок с одной из его составляющих; упрощается система кабельных связей путем перехода системы от контурной топологии к топологии звезды. Топология в форме звезды чрезвычайно удобна в том случае, если на один контур помещается более одного массива дискового хранения.
Хаб дает возможность увеличить количество связей внутри контура, но не способен поднять пропускную способность системы. Коммутаторы StorEdge способны решать обе эти задачи. Дисковые массивы хранения с коммутатором, в отличие от современных, обеспечивают пользователю необходимое соотношение между количеством связей в системе и пропускной способностью.
ПО администрирования систем хранения на базе Java-технологии
Sun StorEdge Enterprise Storage Manager (ESM) - краеугольный камень стратегии Sun. Это новое, действенное решение проблем в сфере управления хранением информации в открытом сетевом информационном центре. ESM - система централизованного управления всеми информационными ресурсами предприятия, объединенными компьютерной сетью, обеспечивает локальный и общий мониторинг и управление подсистемами хранения. Будущая версия позволит операторам работать с многочисленными приложениями по управлению хранением данных в постоянном web-интерфейсе.
Наряду с ESM, в области управления хранением информации существуют и другие программные продукты Sun, совершенствуемые в отношении Java и Web. Так, например, StorEdge Enterprise LibMON всегда базировался на Web, а Sun StorEdge Enterprise NetBackup и Sun StorEdgeVolume Manager в скором времени приобретут Java-интерфейс.
Программное обеспечение администрирования должно управлять распределением информации, производственным процессом, гарантировать отказоустойчивость системы и сохраняемость информации. Как бы то ни было, разнородная природа сегодняшней компьютерной сети ставит жесткие требования к решениям по управлению системой в целом. И потому становится необходимым создание программного обеспечения на базе Java - универсальной программной платформы.
Интеллектуальные серверы данных
Ключевым моментом идеологии интеллектуальных сетей данных является наличие интеллектуального сервера данных, обеспечивающего подключение серверов с операционными системами различных типов (MVS, UNIX, NT) и одновременный доступ к данным от систем с различными операционными системами. Для поддержания высокой производительности, управляемости, надежности сервер системы должен соответствовать понятию интеллектуального сервера, т. е. справляться с такими внешними факторами, как наличие разнородных машин-клиентов, пиковая нагрузка, сбои в компьютерной сети.
В настоящий момент Sun Microsystems обладает весьма интересной системой такого типа - интеллектуальным сервером данных A7000. Прилагательное "интеллектуальный" используется здесь не для придания наукообразия. Дело в том, что А7000 наделен двумя встроенными контроллерами - двумя SMP UNIX компьютерами с четырьмя процессорами каждый. В этом - принципиальное отличие системы от практически всех выпускающихся систем хранения данных. Конечно, все другие системы используют те или иные типы микропроцессоров, но это не SMP - системы, и не UNIX - системы.
Встроенная интеллектуальность Sun StorEdge А7000 обеспечивает высокую надежность системы посредством удаленного зеркалирования. Sun StorEdge А7000 имеет систему оперативной памяти, позволяющую серверам A7000 зеркалировать полученную информацию с минимальной задержкой. Sun StorEdge Remote Dual Copy позволяет клиенту, использующему Fibre Channel, располагать зеркалируемые объекты на расстоянии до 2 км, а в ближайшей перспективе - до 15 км. Зеркалирование протекает в реальном времени. В случае неполадок на одном из узлов, информация не только является надежно защищенной, но и доступной всем серверам, подключенным к A7000, и приложениям, работающим на этих серверах.
К преимуществам, полученным за счет встроенной интеллектуальности, следует отнести также: средства автоматической связи с администратором (Phone-home); дистанционную диагностику, мониторинг, значительную гибкость конфигурации.
К тому же, поскольку контроллеры работают под управлением операционной системы UNIX, возможности Sun StorEdge А7000 могут быть легко расширены за счет совершенствования программного обеспечения.
Обеспечение одновременного доступа к данным
Обеспечение одновременного доступа к данным (Sun StorEdge DataShare) - возможность прямого и безболезненного переноса информации между мэйнфреймами, открытыми сетевыми системами и NT-системами. Встроенная интеллектуальность позволяет А7000 обеспечивать связь с хост-машинами различных производителей. Sun StorEdge DataShare расширяет эти возможности, позволяя машинам различных производителей иметь доступ ко всей поступающей информации, не создавая при этом дополнительных или промежуточных копий данных.
Одновременный доступ к данным, осуществляемый интеллектуальными серверами хранения данных A7000, - редкое явление в промышленности. Единственным аналогом может считаться система Symmetrix от EMC. Но в отличие от нее A7000 не требует создания промежуточных копий данных для обеспечения одновременного доступа к ним от разных систем. В A7000 осуществляется доступ на чтение и запись для одной из подключенных систем. Другие же системы имеют доступ на чтение к той же физической копии данных. Данное решение исключает непроизводительные и громоздкие способы межплатформного сообщения между мейнфреймами, UNIX и NT - системами.
Аппаратные компоненты для построения сети данных
Компания Sun Microsystems предлагает полный набор программных и аппаратных средств для построения систем хранения информации самого разного масштаба - от рабочих групп до терабайтных хранилищ данных. Дополнительную информацию можно получить на Web - серверах: www.sun.ru, www.sun.com .
ISN в исполнении Sun Microsystems обладает всеми свойствами традиционных высококачественных систем хранения данных - надежностью, отказоустойчивостью, высокой производительностью и управляемостью. Кроме того, она обеспечивает пользователю такие преимущества как доступность данных с различных платформ и распределенный доступ к информации. Тем самым, ISN демонстрирует характерные признаки, ассоциирующиеся, в традиционном понимании, с особенностями компьютерной сети.
Технология Fibre Channel позволяет создать большое, высокоскоростное сетевое информационное хранилище, к которому могут подключаться не только диски и RAID-массивы, но и, непосредственно, архив, иерархические системы управления хранением информации (Hierarchical Storage Manager - HSM) и ленточные библиотеки. Информация внутри такой системы перемещается не со скоростью T1, T3, ESCON, SCSI, Fast Ethernet, но гораздо быстрее. ISN будет питать информацией большие серверные системы, которые, в свою очередь, обеспечивают более медленные корпоративные сети информацией, необходимой для работы сотрудников, потребителей и их локальных приложений (рис. 4).
Очевидно, что имея доступ к большим объемам информации, мы находим новые пути ее использования. По мере расширения компьютерная сеть становится доступной для все большего числа пользователей, увеличивается число сетевых приложений, а, следовательно, постоянно увеличивается объем информации, требующей сохранения. Особенно хорошо это известно крупным предприятиям.