Сеть SAN на базе технологии Fibre Channel.
Конечно, сегодня ее значение возросло многократно. Благодаря таким приложениям, как "добыча данных", из в большинстве своем бесполезных данных, как из необогащенной руды, удается добыть порой поистине бесценные сведения о деятельности компании, действительном состоянии отрасли, реальном положении дел в стране... Впрочем, важность обладания информацией никому доказывать не надо, однако для того, чтобы та же добыча данных была возможна, весь необходимый для этого объем информации должен где-то храниться, причем объемы хранимой информации удваиваются в среднем за год.
Несмотря на то что современные дисковые массивы RAID, магнитооптические библиотеки и т. д. обладают гигантской емкостью, ее тем не менее требуется все больше и больше в связи с появлением таких новых приложений, как электронная коммерция, цифровая обработка изображений, добыча данных и многие другие. Но главную проблему составляют даже не быстрые темпы роста объемов хранимой информации, а обеспечение их доступности для множества клиентов.
Одним из наиболее перспективных решений этой проблемы являются активно пропагандируемые в последнее время сети устройств хранения или просто сети хранения (Storage Area Network, SAN). Мы будем рассматривать сети SAN в контексте сетей Fibre Channel. Хотя знак равенства между двумя этими технологиями ставить нельзя, они все чаще упоминаются вместе, поскольку Fibre Channel является основной транспортной технологией в сетях SAN, а сеть хранения - основным приложением технологии Fibre Channel. (Другие приложения Fibre Channel, такие, как дисковые массивы Fibre Channel или кластеры с межсоединением на базе Fibre Channel, могут рассматриватьcя в контексте сети SAN.) Таким образом, эта статья будет посвящена истории появления, основным преимуществам и приложениям сетей SAN.
НА ПУТИ К SAN
Прежде чем переходить непосредственно к рассмотрению самих сетей хранения, мы остановимся на других методах организации доступа к внешним системам хранения и причинах возникновения потребности в SAN.
Доступ клиентов к хранящейся обособленно общей или персональной информации осуществляется обычно через файловые серверы. Однако, ввиду ограниченности места внутри корпуса сервера и других причин, при больших объемах информации файлы часто хранятся на внешних, непосредственно подключенных к серверу дисковых массивах и в других периферийных хранилищах информации, доступ к которым осуществляется через интерфейсы типа SCSI. Такой подход позволяет значительно увеличить емкость хранения файлового сервера, и он до сих пор остается преобладающим. По данным Fibre Channel Association, в настоящее время около 95% данных хранится на файловых серверах и непосредственно подключенных к ним дисковых массивах и других устройствах хранения.
Такой подход обладает целым рядом недостатков. Так, в случае SCSI расстояние между сервером и хранилищем, как правило, не должно превышать 6 м. Обычно дисковый массив размещается рядом с сервером, поэтому данное ограничение оказывается вполне приемлемым, но расположение сервера и хранилища по соседству бывает не всегда возможно или целесообразно. Например, в целях безопасности, на случай аварии, для централизации хранения хранилище может оказаться желательно разместить в другом помещении или здании.
Справедливости ради, следует сказать, что благодаря применению технологий LVD и HVD расстояние может быть увеличено до 12 и 25 м соответственно, даже несмотря на бо,льшие скорости у таких высокоскоростных разновидностей SCSI, как Wide Ultra2 SCSI и Ultra160 SCSI. Однако SCSI обладает и другими ограничениями, например на число поддерживаемых устройств. Многие из них позволяет снять применение дисковых массивов на базе Fibre Channel. В случае дисковых систем Fibre Channel внутренней шиной массива является петля FC-AL. Каждое посадочное место на шине поддерживает схему обхода порта (Port Bypass Circuit) для автоматического замыкания петли при отсутствии диска. При добавлении или изъятии диска он автоматически включается в петлю или исключается из нее. Однако такое решение достаточно дорого.
Помимо предоставления файлов файловый сервер зачастую выполняет и другие задачи, поэтому отсутствие прямого доступа к данным увеличивает длительность операций ввода/вывода при большой загруженности сервера. Кроме того, при отказе сервера все подключенные к нему устройства хранения тоже оказываются недоступными. Наряду с ограничениями на расстояния это привело к появлению концепции сетевых устройств хранения (Network-Attached Storage, NAS) по аналогии с сетевыми принтерами и сканерами. Такие устройства хранения подключаются непосредственно к сети через интерфейс Ethernet или какой-нибудь другой интерфейс локальной сети. Они функционируют как файловый сервер при клиент-серверных отношениях, имеют собственные процессоры и операционные системы (или микроядро) и поддерживают протоколы ввода/вывода файлов наподобие SMB и NFS.
Однако, решая одни проблемы, такой подход, как это нередко бывает, порождает другие. Обмен данными по локальной сети возлагает на нее дополнительную нагрузку, кроме того, доступ к данным вынужден конкурировать с другими приложениями за пропускную способность. Все это ведет к ограничению скорости доступа к данным, к тому же многие производители предлагают сегодня в лучшем случае интерфейсы Fast Ethernet (100 Мбит/с). Кроме того, из-за разрозненности устройств, отсутствия логической связи между ними управление такими устройствами как единым целым - создание из них целостной системы хранения - представляет собой непростую задачу. Последнее обстоятельство приобретает особую важность в случае корпоративных распределенных сред.
КОНЦЕПЦИЯ SAN
Область применения двух рассмотренных выше подходов ограничивается случаями, когда объем передаваемых на хранение и извлекаемых из хранилища данных относительно невелик. Когда же требуется быстрый и гарантированный доступ к большим объемам информации, наилучшим решением является организация сети хранения.
Что же собой представляет сеть SAN? Это высокоскоростная сеть, наподобие локальной сети связывающая напрямую серверы (и клиенты) с устройствами хранения, т. е., по сути, это еще одна независимая сеть, параллельная локальной сети. Она позволяет составляющим ее конечным узлам обмениваться друг с другом данными напрямую по принципу "каждый с каждым" (если не введены соответствующие ограничения), т. е. серверу с устройством хранения, серверу с сервером и устройству хранения с другим устройством хранения. Кроме того, такая сеть обеспечивает избыточные пути доступа к информации, например при отказе какого-либо сервера клиент может получить доступ к ней через другой сервер, так как устройства хранения не привязаны конкретно к какому-либо серверу.
Концепция SAN возникла не на пустом месте. Как и многие другие современные компьютерные технологии, она была заимствована из мира мэйнфреймов, где применялась, например, в центрах обработки данных для подключения мэйнфреймов к системам хранения и распределенным сетям через интерфейс ESCON. Прообразом SAN, вероятно, можно считать устройства хранения с возможностью прямого доступа (Direct Access Storage Device, DASD).
Создание отдельной сети хранения имеет в крупных корпоративных средах множество преимуществ, наиболее очевидным из которых является уменьшение нагрузки на основную локальную сеть. В частности, как известно, резервное копирование ложится на локальную сеть тяжелым бременем и приводит к заметному замедлению работы других приложений. В случае же сети SAN оно никак не скажется на работе пользователей, за исключением того, что некоторые файлы могут оказаться временно блокированы для их копирования, но в этом виновата будет во всяком случае не сеть.
Другое важное для корпоративных сред преимущество - практически неограниченная масштабируемость сетей SAN. Это утверждение касается как увеличения пропускной способности самой сети хранения, так и общей емкости системы хранения. Устройства хранения можно добавлять в сеть по мере необходимости, причем они оказываются непосредственно доступны из любой точки сети.
Еще одно немаловажное преимущество - централизация управления устройствами хранения. В случае SAN системой хранения можно управлять как единым целым, что особенно важно, когда она состоит из десятков или даже сотен устройств. Кроме того, все устройства хранения можно разместить в одном месте отдельно от серверов и обеспечить для них надлежащие условия окружающей среды, физическую защиту доступа и т. д. Это повышает удобство их обслуживания, так как администратору системы хранения не приходится рыскать по помещениям в поисках отказавшего устройства. (Впрочем, сеть хранения позволяет не только централизовать, но и обособленно разместить устройства хранения в целях защиты от аварий, по соображениям безопасности и т. д. в разных помещениях, зданиях и даже городах, при этом такая распределенная система будет продолжать оставаться единым целым.)
SAN КАК СЕТЬ FC-AL
Как мы уже упоминали в начале статьи, сети SAN реализуются обычно на базе технологии Fibre Channel. Такой выбор имеет целый ряд достоинств. (Помимо Fibre Channel это могут интерфейсы ESCON, HIPPI, SSA, SCSI, но практически никогда Ethernet.)
В частности, Fibre Channel позволяет одновременно поддерживать в сети такие высокоуровневые протоколы, как IP и SCSI, а также IEEE 802.2, ATM Adaptation Layer и др. Fibre Channel обеспечивает скорости передачи до 100 Мбайт/с (1,0625 Гбит/с без учета накладных расходов), а в настоящее время рассматривается предложение по стандарту со скоростью в четыре раза большей.
Кроме того, эта технология поддерживает расстояния до 10 км в случае одномодового оптического кабеля и до 30 км при применении специальных расширителей (см. Таблицу). Более того, посредством организации соединений ATM между коммутаторами Fibre Channel это расстояние можно сделать практически неограниченным.
Далее, даже в случае простейшей конфигурации, петли с арбитражем доступа, сеть SAN может поддерживать свыше сотни различных устройств, т. е. почти на порядок больше, чем SCSI. В случае же применения хотя бы одного коммутатора Fibre Channel это число увеличивается еще на порядок и составляет несколько тысяч (типичный коммутатор имеет 16 портов FL_Port, каждый из которых может поддерживать петлю со 127 портами NL_Port).
Эта транспортная технология оптимизирована для блочной передачи и, в отличие от сетей Ethernet, позволяет создать выделенное соединение (канал) между двумя взаимодействующими узлами в любой, а не только в коммутируемой топологии. Это обеспечивает высокую скорость передачи (средняя скорость составляет 90 Мбайт/с, т. е. 90% от номинальной, что в случае разделяемых технологий Ethernet просто недостижимо) и гарантирует не только доставку, но и ее своевременность и т. д.
Простейшая сеть SAN представляет собой петлю FC-AL или двойную петлю FC-AL для обеспечения отказоустойчивости в случае обрыва кабеля. Кроме того, двойная петля дает возможность практически удвоить пропускную способность при функционировании в обычном режиме. Часто подключение устройств организуется при помощи концентратора. Это упрощает проводку и подключение/отключение устройств, а также позволяет автоматически изолировать отказавшие участки. Такая реализация наиболее экономична с точки зрения финансовых затрат.
Помимо концентратора по сути обязательным компонентом сети SAN является мост между Fibre Channel и SCSI. Очевидно, что ни одна организация не станет отказываться от имеющихся у нее дисковых массивов, оптических библиотек и т. д., а многие из таких устройств имеют интерфейс SCSI, а отнюдь не Fibre Channel. Применение же моста позволяет подключить к сети SAN любые уже имеющиеся устройства. Кроме того, для доступа к ним серверу будет теперь достаточно иметь всего один порт ввода/вывода - главный адаптер шины Fibre Channel (Fibre Channel Host Bus Adapter, FC-HBA).
При необходимости сеть SAN может наращиваться практически до бесконечности за счет введения коммутаторов Fibre Channel, а при наличии на этих коммутаторах интерфейсов ATM она сможет объединить в единое целое все устройства хранения распределенной организации, где бы и как бы далеко они ни находились (см. Рисунок).
Риcунок. Сети устройств хранения на базе Fibre Channel. |
ОСНОВНЫЕ ПРИМЕНЕНИЯ SAN
В своем исследовании рынка сетей хранения Strategic Research Corp. выделяет шесть основных на сегодняшний день областей применения сетей SAN. Основное из них соответствует прямому назначению SAN и состоит в обеспечении независимого и надежного доступа к информации, т. е. в устранении жесткой привязки устройств хранения к серверам и обеспечении их доступности.
Другое назначение состоит в поддержке кластерных конфигураций, при этом сеть хранения обеспечивает доступ к данным как к общему ресурсу. Далее - обеспечение защиты (дублирования) данных за счет установки избыточных устройств хранения, при этом резервное копирование может производиться непосредственно с одного устройства хранения на другое.
Следующее применение - в решениях по восстановлению после аварий, когда хранилище информации находится в другом месте на значительном удалении. При аварии в офисе деятельность компании можно будет восстановить, установив серверы и клиенты в другом месте. К данному применению примыкает так называемая переброска данных - т. е. передача данных электронным образом для автономного хранения в другом месте. Это позволяет возобновить работу компании при аварии не только в рабочем офисе, но и в самом хранилище.
Наконец, последнее выделяемое специалистами SRC направление - обмен данными между разными средами.
БОЛЬНОЙ ВОПРОС
Как и в случае многих перспективных технологий, вопрос стандартизации является ахиллесовой пятой сетей SAN. Одну из главных проблем в данном случае составляет управление. Как уже говорилось, SAN обеспечивает принципиальную возможность управления распределенной системой хранения как единым целым, но для практической ее реализации элементы сети должны иметь стандартный способ взаимодействия друг с другом в контексте SAN.
Впрочем, поставщики оборудования для SAN хорошо понимают стоящую перед ними проблему, и они создали рабочую группу по управлению системами хранения на базе Fibre Channel. Эта группа занимается разработкой стандартов для таких аспектов управления, как управление конфигурацией, управление кластером, управление защитой и т. д.
Таким образом, реализация SAN требует более тщательного планирования, чем простое подключение накопителя к серверу. Однако она и дает гораздо более существенные преимущества.
Дмитрий Ганьжа - ответственный редактор LAN. С ним можно связаться по адресу:
diga@lanmag.ru.