Одно из наиболее активно развивающихся направлений в отрасли хранения данных — разработка и внедрение средств управления ресурсами хранения и их автоматизация. Лежащие в основе решения данной задачи методы виртуализации начинают проникать в инфраструктуру сетей хранения.
Термин «виртуализация» применительно к ресурсам хранения вошел в активный оборот примерно два года тому назад. Загадочное иностранное слово с неясным значением как нельзя лучше соответствовало тому туману, которым было окружено это понятие. С той поры виртуализация стала настоящим маркетинговым жупелом: без упоминания о новой технологии не обходилась ни одна пресс-конференция, имеющая хоть какое-то отношение к средствам хранения информации. Разъясняя значение термина, все менеджеры как один проводили однажды пришедшую кому-то в голову аналогию между виртуализацией и коммунальными службами.
Однако, как оказалось, концепция «все отнять, поделить и раздать» не так уж и нова. Давлекие аналогии можно провести с технологией виртуальной памяти, которая в 1970-х гг. с успехом применялась в компании IBM идеологами операционной системы S/360, а затем была использована в архитектуре линейки S/370. Механизмы виртуализации нашли воплощение и в технологии Storage Sharing. Последняя подразумевала совместное использование одной запоминающей подсистемы несколькими хостами: каждому серверу выделялась фиксированная емкость или логические разделы.
Два года тому назад технологии построения сетей устройств хранения (Storage Area Networks, SAN) только-только набирали силу. В то время виртуальное хранение данных, т. е. возможность использовать внешнюю память в качестве ресурса общего доступа, традиционно считалась функцией устройства хранения данных или сервера. Несмотря на это, аналитики Gartner Dataquest были убеждены, что в 2003 г. основные разработки сконцентрируются на уровне сети хранения.
Сегодня сети хранения внедряются достаточно широко, и если поначалу в нашей стране эту роскошь могли себе позволить лишь очень немногие компании, то теперь построение и использование сетей хранения стало в России привычной практикой, едва ли не массовым явлением. В какой-то степени такая тенденция укрепилась в результате снижения цен на компоненты Fibre Channel — коммутаторы, адаптеры, шлюзы, системы хранения. Плюс к тому произошел переворот в сознании массового потребителя.
Сами по себе сети хранения не обеспечивали создания единого пула из дисковых массивов и ленточных библиотек, на которых хранятся данные. Однако именно «облако» SAN (SAN fabric) послужило той средой, в которой было проще всего, как изначально представлялось, реализовать виртуализацию. Дело оставалось только за внедрением. Презентации закончились, страсти понемногу улеглись, наступили неспешные рабочие будни без особых потрясений. Однако вот уже несколько месяцев наблюдается заметное повышение активности в этой области: ведущие производители отрасли ИТ выпустили на рынок ряд интересных новинок, а системные интеграторы реализуют проекты построения SAN, благодаря которым пользователи получили серьезный выигрыш в использовании ресурсов хранения и более удобное управление.
ВСЕ ВРУТ КАЛЕНДАРИ?
Согласно оценкам специалистов Gartner Group, объем продаж ПО виртуализации в 2005 г. составит 1,2 млрд долларов, но, как полагает Джон Вильям Тойгу, автор многих публикаций на тему виртуализации ресурсов хранения, в настоящее время этот показатель довольно низок и не отвечает потребительскому потенциалу технологии.
Хотя стоимость хранения в расчете на 1 Тбайт из года в год сокращается, управление становится все дороже. По данным Gartner Group, на каждый доллар, который компания вкладывает в закупку средств хранения, затрачивается до 8 долларов на управление хранением данных. По данным Meta-Group, если еще в недавнем прошлом администратор мог вполне эффективно справиться с задачей управления данными, объем которых в среднем не превышал 1,2 Тбайт, то с появлением сверхкрупных баз данных, приложений Web и других корпоративных приложений общий объем информации стал стремительно расти. В результате в нынешнем году на каждого администратора ресурсов хранения в крупных компаниях в среднем будет приходиться по 14 Тбайт, которыми предстоит управлять. И сделать это можно лишь при помощи сокращения расходов, рисков и сложности.
Между тем, по свидетельству аналитиков, в подавляющем большинстве компаний работа с данными организована непроизводительно: до 45%, а иногда и до 70% дискового пространства остается неиспользованным — и это в условиях, когда бюджеты на инфраструктуру ИТ сокращаются ввиду разразившегося на Западе кризиса отрасли. Согласно проведенному по заказу IBM исследованию, если организация оперирует данными объемом около 5 Тбайт, то она может потенциально сберечь более 170 тыс. долларов ежегодно за счет оптимизации использования оборудования и более 80 тыс. долларов благодаря повышению производительности работы администратора, которому пока еще приходится выполнять массу рутинной работы. Особенно остро задача управления ресурсами хранения и автоматизации этих процессов встает в крупных вычислительных центрах для критических приложений. Методы виртуализации — один из инструментов ее решения.
Выгодам, которые сулит применение этой технологии, посвящено множество статей. Одно из ее основных назначений состоит в предоставлении другим приложениям единого пула ресурсов хранения. Реализовать данное преимущество возможно лишь при тщательной проработке самого важного звена схемы виртуализации — управления консолидированным хранилищем.
В нашей стране компании пока нечасто решаются на вложение дополнительных средств в технологию виртуализации при построении сетей хранения, хотя удачные примеры внедрения все-таки есть (см. врезку «Пример построения сети хранения»). Методы виртуализации классифицированы, производители хорошо известны, и серьезных потрясений, казалось, не стоит ожидать. Впрочем, для тех, кто следит за эволюцией сетей хранения, обретающих все более интеллектуальные черты, недавнее появление на этом рынке новых игроков — ведущих производителей сетевых компонентов Brocade и Cisco Systems — не стало сюрпризом. Благодаря их продуктам, виртуализация будет осуществляться самой сетью хранения, а не поверх нее.
МОЙ АДРЕС СЕГОДНЯ ТАКОЙ
Различные производители дают разное определение понятию «виртуализация», единого соглашения нет и по поводу стандартов, а применяемые для реализации подходы существенно отличаются друг от друга. Отчасти это обусловлено историческими причинами.
Одним из этапов эволюции архитектуры ресурсов хранения была эпоха развития файловых систем. Со временем возникла потребность подразделять и комбинировать адресные пространства на запоминающих устройствах в соответствии с решаемыми задачами и необходимостью повышения надежности. Комбинация, деление и дублирование адресного пространства составляют суть виртуализации. Марк Фарли из компании StorAge дал ей такое определение: «Виртуализация создает новые пространства виртуальных адресов из подмножеств или объединения подмножеств адресных пространств на физических устройствах». Таким образом, виртуализация подразумевает отображение адресов логических устройств (Logical Unit Number, LUN) на физическую память, разграничение доступа путем наложения масок на номера логических устройств, создание единого пула дисковой подсистемы, применение методов динамического выделения адресного пространства с использованием множественных путей доступа. Она существенно упрощает представление логических томов: их отображение на физические устройства скрывает от пользователей и приложений более сложную физическую конфигурацию.
Главный посул сторонников идеи состоит в том, что наконец-то найдено средство, способное разом решить основные проблемы администраторов сетей в области управления хранением. С помощью виртуализации можно было бы существенно упростить управление объединенным пулом хранения, оптимизировать использование имеющихся в наличии дисковых накопителей, освободить обслуживающих серверы администраторов от рутинной работы по обслуживанию массивов RAID. Технология позволила бы легко вводить новые емкости хранения без перезагрузки операционной системы, упростить тиражирование (replication), выполнять мгновенные снимки (snap-shot), осуществлять зеркалирование (mirroring), а в итоге — снизить стоимость владения. Присматривающимся к виртуализации пользователям следует обратить внимание на гибкость при создании и управлении томами, возможность реально расширить границы массива и сервера. Полезным следствием виртуализации является также предотвращение нагрузки на дисководы при интенсивном потоке запросов на ввод/вывод. Кроме того, когда изменяются требования со стороны приложения, значительно упрощается перераспределение емкости, в результате чего повышается производительность труда администраторов. Среди преимуществ технологии следует отметить снижение расходов на содержание и обучение персонала, поскольку большую емкость можно разместить на меньшем количестве устройств.
На практике виртуализация реализуется непосредственно в массивах (см. врезку «Виртуализация в концепции Hitachi Data Systems), с помощью программного обеспечения на хостах, а также на уровне SAN.
РАЗЛИЧИЯ В АРХИТЕКТУРЕ
Архитектуру виртуализации хранения определяют три элемента: независимые пути для передачи данных и осуществления управления и способ размещения виртуализатора — основного активного элемента в технологии виртуализации, которым обозначаются различные продукты разных производителей. В общем случае виртуализатор обеспечивает преобразование между виртуальными и реальными адресными пространствами.
Путь, по которому проходят данные, — это совокупность сетевых компонентов, устройств и каналов, используемых для передачи данных между серверами и дисковыми накопителями. Виртуализация и управление томом могут существенно изменить топологию путей в сетях хранения.
Путь, по которому осуществляется управление в сети хранения, — это совокупность сетевых соединений, по которым ведется управление сетевыми устройствами. Этот путь может проходить по совершенно иной сети. Например, сеть хранения построена на базе Fibre Channel, а путь управления оборудованием SAN проходит по сети Ethernet, поскольку управление выполняется через консоль управления SNMP или HTTP.
Активный элемент виртуализации может быть реализован на хосте, на уровне контроллера системы хранения или на специализированном устройстве в сети хранения. В зависимости от его местоположения различают несколько архитектурных подходов. Виртуализирующее программное обеспечение на хосте обычно называется менеджером тома (volume manager). Совершенно новый класс программного обеспечения ориентирован на архитектуру SAN и функционирует как распределенная система виртуализации, при этом на хостах устанавливаются агенты виртуализации.
Наиболее распространенной архитектурой виртуализации являются контроллеры дисковых массивов. Если системы проектируются в расчете на подключение к сети хранения, то они обычно имеют множество портов и способны поддерживать многочисленные хосты. В той или иной форме виртуализация в дисковых накопителях применялась давно. Цель, которая при этом преследовалась, состояла в защите данных (т. е. RAID), улучшении производительности или просто выделении памяти того размера, какой требуется приложению. О поддержке виртуализации на уровне контроллеров дисковых массивов заявляют многие производители: 3PARdata, Data Direct Networks, Dell Computer, Dot Hill Systems, EMC, EqualLogic, Fujitsu Technology Solution, Hewlett-Packard, Hitachi Data Systems, IBM, LSI Logic, Network Appliance, Storage Technology, Sun Microsystems, XIOtech.
Gartner Group употребляет термин «монолит» или «монолитный» по отношению к системам хранения старшего класса таких производителей, как EMC, IBM, Hitachi Data Systems и Storage Technology. Определение указывает на тот факт, что эти системы имеют в едином корпусе достаточные ресурсы для удовлетворения большинства потребностей приложений. Быть может, термин cache-centric более точно отражает специфику этих систем.
Однако сегодня разворачиваются все более крупные сети, а учитывая, что в будущем эта тенденция будет только крепнуть, становится ясно, что их потребности в емкости ресурсов хранения перекрывают самые крупные массивы, вследствие чего может понадобиться значительное число этих устройств для обеспечения нужной емкости и производительности. Последние разработки в области хранения информации были направлены на реализацию активного элемента виртуализации в системе или на устройстве, находящемся в сети. Активный элемент, роль которого выполняет выделенный сервер внутри SAN, не содержит ни данных, ни приложений, но способен «видеть» множество массивов и хостов.
Понятия «виртуализация» и «сети хранения» не связаны между собой непосредственно, хотя сегодня сеть хранения трудно представить без виртуализации, поскольку в этой среде емкость хранения совместно используется множеством серверов приложений. Виртуализация позволяет видеть все устройства и управлять ими, как если бы они были единым пулом без физических границ. Нехватка емкости системы RAID решается путем обращения к дополнительной доступной емкости на другом устройстве без какой-либо переконфигурации.
ПЕРЕКРЕСТОК И ОБОЧИНА
Виртуализация может быть реализована либо симметричным (in-band), либо асимметричным (out-of-band) способом. При симметричном подходе активный элемент находится на пути, по которому пересылаются данные, при асимметричном — уровень абстракции и контроль обработки лежат вне этого пути.
Роль активного элемента при симметричной виртуализации выполняет программное обеспечение, установленное на одном или нескольких специализированных устройствах (менеджерах доменов). Формирование пула происходит с помощью таблиц отображения, куда заносятся связи между логическими томами и реальными физическими адресами. Эти таблицы размещаются на менеджере домена. По замыслу архитекторов такого подхода администраторы могут начать с одного-единственного устройства хранения и минимального количества физических дисков и добавлять практически неограниченное число ресурсов хранения любого производителя. Основной недостаток симметричного подхода состоит в том, что отказ менеджера доменов ведет к недоступности ресурса хранения. К тому же устройство должно иметь адекватную пропускную способность.
Во избежание подобных проблем некоторые производители прибегают к кластерным технологиям. Введение избыточности исключает точку отказа, однако обработка запроса выполняется несколько дольше. Кластерная организация менеджеров доменов позволяет масштабировать пропускную способность, но затрудняет объединение ресурсов хранения в пул. Решения на основе симметричной виртуализации предлагают DataCore Software, FalconStor Software, Fujitsu Softek, Hewlett-Packard, IBM, Veritas Software, Vicom Systems.
Активные элементы виртуализации устанавливаются между серверами и внешними системами хранения, их еще называют серверами виртуализации SAN. Одни из них представляют собой комбинацию программно-аппаратных средств, другие — только программных. Если виртуализаторы находятся на пути передачи данных, они, по сути, выполняют те же функции, что и контроллеры массивов, только называются иначе. Как и контроллеры массивов, они размещаются на пути передачи данных, агрегируют диски, поддерживают RAID, «нарезают» тома, имеют резервирование в целях предотвращения отказа, могут предоставлять кэш, способны служить ключевым узлом, через который проходят данные при копировании, обеспечивают удаленное тиражирование, а также назначение дискам виртуальных имен.
Основное преимущество асимметричного подхода заключается в том, что отсутствует критическая точка отказа — активный элемент находится вне пути передачи данных. Как и в случае симметричного подхода, ресурсы хранения виртуализируются путем создания таблиц отображения и организации их в домены. Емкость из неограниченного числа дисковых устройств может быть объединена в пул, при этом не возникает проблем с пропускной способностью или адресацией. Основной недостаток асимметричного подхода — необходимость передавать отображение виртуальных томов на физическую память всем хостам и обеспечивать средства их использования (т. е. клиентское ПО или аппаратные средства). Асимметричная архитектура в целом более сложна, она включает больше элементов и требует применения методов управления распределенными системами. Асимметричную виртуализацию предлагает по сути только один производитель — StorAge Networks.
HP — единственная компания, в перечне продуктов которой присутствуют решения с поддержкой виртуализации сразу в трех категориях: на уровне контроллера системы хранения, на уровне серверов и в сети хранения SAN. Реализация технологии на уровне сервера — это программное решение для небольших хранилищ начального уровня HP OpenView Storage Virtual Replicator. Оно реализуется путем установки ПО на серверах, совместимо с рядом программных и аппаратных компонентов и зависит от поддержки работающей на сервере операционной системы. Обращение операционной системы к виртуальному диску осуществляется с помощью драйверов, а те, в свою очередь, взаимодействуют с физическими устройствами. Данное решение функционирует в операционной среде Windows 2000 и Windows NT.
Рисунок 1. Архтектура EVA на базе систем хранения HP Storage Works Enterprise Virtual Array. |
В данной концепции применение принципов виртуализации позволило существенно упростить управление, более эффективно распорядиться имеющимся дисковым пространством, заметно сократить время восстановления данных, а пользователей вооружить средствами их тиражирования. Концепция задумывалась как открытый стандарт, некое универсальное решение, в рамках которого любой производитель мог сделать свой дисковый массив совместимым с данной платформой путем установки на стороне хоста специального контроллера, реализованного в соответствии с предоставленной HP спецификацией. Дело осталось за малым — договориться производителям.
Для виртуализации сетей хранения, где в настоящее время сосредоточены интересы основных игроков этого рынка, HP предлагает использовать специализированные системы HP OpenView Continuous Access Storage Appliance (CASA) из двух узлов, устанавливаемые на пути передачи данных между сервером и устройством хранения (см. Рисунок 2). В этих системах хранятся все метаданные о конфигурации ресурсов хранения. Концепция CASA предусматривает консолидировать всю имеющуюся емкость дисковых систем от различных производителей и сделать ее доступной любому серверу любого производителя.
НОВИНКИ В ОБЛАСТИ ВИРТУАЛИЗАЦИИ
Весной 2003 г. компания IBM анонсировала SAN Volume Controller (SAN-VC) — программно-аппаратное решение под кодовым названием Lodestone (cм. Рисунок 3). SAN-VC объединяет все ресурсы хранения в единый динамический пул, так что емкость можно добавлять или перераспределять, а данные прозрачно мигрируют между множеством гетерогенных серверов и дисковых массивов. Его применение позволяет облегчить администрирование и оптимизировать использование ресурсов, к тому же серверы приложений не требуется перезагружать при замене дискового массива либо при обновлении программного обеспечения. SAN-VC может применяться в качестве средства защиты от локальных катастроф, поскольку оно поддерживает синхронное зеркалирование на удаленную дисковую систему. Создание мгновенных копий — полезная функция для организации непрерывного резервного копирования в обход сервера.
В сети может находиться несколько узлов SAN-VC, однако конфигурирование и управление осуществляется из одного пункта — с центральной консоли управления. Каждый узел располагается на пути обмена данными между подключенными к SAN на базе Fibre Channel серверами и системами хранения. Один выделенный сервер IBM xSeries под управлением Windows 2000 служит консолью управления, в качестве узлов SAN-VC используются кластеры из двух серверов IBM xSeries с процессорами Pentium 4 с тактовой частотой 2,4 ГГц, двумя портами FC на 2 Гбайт/с, кэш-памятью 4 Гбайт и внутренними дисками SCSI 18 Гбайт под управлением Linux. Пакет решений по виртуализации включает также SAN Integration Server, используемый в тех случаях, когда предполагается добавлять дополнительную емкость. В его состав входят два SAN-VC, выделенное устройство управления для организации консоли, коммутатор Ethernet, два коммутатора Fibre Channel (Brocade 3900), а также дисковая система.
Продукт поддерживает систему хранения старшего класса IBM TotalStorage Enterprise Storage Server (Shark), а также систему среднего уровня IBM FAStT Storage Server (они подключаются к серверам, работающим под управлением Windows, Linux-Red Hat, AIX, Solaris и HP-UX). В следующем году перечень поддержки дисковых массивов будет расширен.
Одной из первых инсталляций данного решения стало внедрение SAN-VC в крупном австрийском медицинском центре, объединяющем шесть госпиталей, где очень высока потребность в хранении цифровых изображений (например, рентгеновских снимков) и прочих медицинских данных. Благодаря этому внедрению удалось не только повысить степень используемости дискового пространства, куда ежедневно стекаются большие объемы данных, но и, что более важно, был наведен порядок в управлении консолидированной информацией из одной точки и усилена защита с помощью резервного копирования в удаленное региональное подразделение.
Очередную версию симметричной виртуализации предложила нынешним летом компания Fujitsu Softek. Изначально продукт Softek Virtualization базировался на открытых кодах системы виртуализации компании DataCore Software — решении SANSymphony. (Подробнее о SANSymphony рассказывается в статье «Фокусы виртуализации» в январском номере «Журнала сетевых решений/LAN» за 2002 г.) Вся емкость хранения, управляемая посредством Softek Virtualization, выделяется приложениям из единого пула. Дисковое пространство физически распределяется между разнородными дисковыми массивами, которые к тому же могут располагаться на значительном удалении друг от друга. Физические диски и соответствующие интеллектуальным массивам логические номера устройств могут быть «нарезаны» в виде небольших виртуальных томов либо консолидированы в крупные объемы.
В решении Softek Virtualization используется центральная консоль с поддержкой графического интерфейса; с ее помощью выделение памяти происходит без прерывания работы узлов гетерогенного окружения. Основное отличительное преимущество продукта состоит в том, что он практически в любой среде поддерживает работу с серверами, а также с системами хранения самых разных производителей самого различного уровня сложности — от простых JBOD до монолитов старшего уровня. В июле Fujitsu Softek заключила официальное дистрибьюторское соглашение с компанией Fujitsu Siemens Computers, доверив ей продвижение нового решения в Европе (в том числе и в России).
Рисунок 4. Виртуальная ленточная библиотека Fujitsu-Siemens CentricStor. |
Сама же компания Fujitsu Siemens Computers недавно выпустила новую версию виртуальной ленточной библиотеки CentricStor (см. Рисунок 4). Это универсальное программно-аппаратное решение поддерживает ленточные библиотеки всех основных производителей, все популярные серверные операционные системы (ОС для мэйнфреймов, все промышленные ОС UNIX, Windows, NetWare, Linux и др.) и основные типы соединений. CentricStor консолидирует вокруг себя хостовые системы и физические архивные ленточные системы и может одновременно поддерживать большое число скоростных независимых сеансов резервного копирования и архивации данных. Ядром решения является распределенное ПО, оно функционирует на группе специализированных серверов и использует выделенный дисковый массив как долговременную вытесняемую кэш-память для быстрого выполнения сеансов. Данное ПО не зависит от типа и ОС клиентских серверов и типов и форматов ленточных устройств. Мощная внутренняя сеть Fibre Channel позволяет управлять параллельными потоками данных между хостом, буфером и лентой.
CentricStor физически соединяет и логически изолирует физические ленточные архивы и хосты, позволяет их менять независимо друг от друга, сам легко адаптируется к любым изменениям в системном окружении и обладает превосходной для такого типа решений производительностью и масштабируемостью.
СЕТИ ХРАНЕНИЯ СТАНОВЯТСЯ УМНЕЕ
Инфраструктура сетей хранения создает почву для консолидации серверных ресурсов и ресурсов хранения, к тому же среда SAN наиболее удобна для сосредоточения в ней средств управления. В результате современная инфраструктура SAN предоставляет возможности для реализации многих ключевых сервисов, в том числе на базе открытых интерфейсов управления. После аппаратной консолидации SAN следующая фаза — консолидация определенных функций управления ресурсами хранения в виде программных приложений, реализованных в «облаке» SAN. Эти приложения размещаются на устройствах внутри инфраструктуры сети хранения и обеспечивают реализацию таких сервисов, как виртуализация, тиражирование данных и управление ими.
Для решения широкого спектра проблем, связанных с управлением, компания Brocade разработала платформу приложений для «облака» SAN — SilkWarm Fabric Application Platform (SilkWarm Fabric AP). Новая платформа специально спроектирована для поддержки приложений, легко интегрируется в существующую инфраструктуру SAN и представляет собой новый класс интеллектуальных устройств для организации «облака» SAN на базе собственной технологии Brocade XPath Technology. Платформа открывает чрезвычайно широкие возможности для реализации функций управления путем размещения приложений на интеллектуальных устройствах. В числе таких функций — виртуализация на уровне «облака» SAN и управление томами. В результате SilkWarm Fabric AP обеспечивает гораздо более простое и масштабируемое решение по сравнению с размещением приложений на специализированном устройстве как при симметричном, так и асимметричном подходах.
В ближайшем будущем Brocade и ее партнеры планируют представить ряд приложений на базе SilkWarm Fabric AP. Среди них — виртуализация устройств, образующих инфраструктуру сети хранения; управление томами (создание пула из дисковых накопителей и миграция данных); виртуализация ленточных и дисковых накопителей для ускорения резервного копирования и восстановления; удаленное тиражирование и восстановление после катастроф; управление данными для резервного копирования, восстановления и архивирования. Дальнейшее развитие этого подхода в немалой степени будет зависеть от его поддержки ведущими производителями систем хранения. Brocade заключила OEM-соглашения с компаниями HP и EMC на разработку программного обеспечения виртуализации на уровне коммутаторов сети SAN.
Другой поставщик оборудования для сетевой инфраструктуры, компания Cisco Systems, придерживается примерно того же направления, но ставит перед собой еще более масштабные задачи по преодолению границ, разделяющих различных производителей. Она намерена, вместе с компанией VERITAS Software, объединить усилия по созданию так называемой концепции интеллектуальной коммутации ресурсов хранения. Основная цель инициатив состоит в том, чтобы обеспечить централизованное администрирование систем хранения различных производителей, работающих под управлением разных операционных систем, установленных на хостах. В недавно представленных устройствах Cisco MDS 9509 и Cisco MDS 9216, на базе которых планируется строить интеллектуальные сети хранения, предусмотрены свободные слоты для встроенных плат для поддержки разнообразных сервисов. Разработкой плат, скорее всего, займутся партнеры компании. Первый модуль Advanced Service планируется выпустить в следующем квартале, а еще через квартал выйдет модуль с поддержкой кэширования. С помощью программного обеспечения, установленного на интеллектуальных коммутаторах SAN, системы хранения различных производителей можно будет использовать в качестве разделяемого ресурса, а на хостах установить операционные системы, опять-таки принадлежащие разным производителям.
Параллельно формированию новой концепции специалисты Cisco Systems и VERITAS участвуют в разработке стандартов: в июне 2003 г. по инициативе Американского института национальных стандартов (American National Standart Institute, ANSI) организована рабочая группа T11.5 по созданию прикладного программного интерфейса управления (API) для сети хранения с интеллектуальными функциями. (ANSI TT11 отвечает за подготовку стандартов для Fibre Channel и других стандартов для систем хранения.)
Таким образом, реализация приложений для инфраструктуры сетей хранения представляет следующую фазу в эволюции SAN, на базе которых строятся центры обработки данных во всем мире. С добавлением интеллектуальности «облаку» SAN эти приложения снимают многие ограничения на возможности управления и создают новую парадигму в области управления сетевыми ресурсами.
В целом же технология виртуализации как нельзя лучше отвечает современному подходу к хранению данных — концепции отказа от использования дисков на хостах — подобно тому, как серверные «лезвия» через адаптеры Fibre Channel подключаются к сети хранения SAN. Такой подход облегчит решение задачи автоматизации управления, так что администратору останется заниматься лишь распределением памяти для приложений, а система будет сама оповещать о наступающем истощении ресурса и необходимости вовремя предпринять упреждающие меры.
К сожалению, об удобстве управления приходится пока говорить как о потенциальной возможности. Автоматизация хранения все еще остается слабым звеном и реализована в имеющихся продуктах лишь до некоторой степени. Но пути движения к желанной цели уже обозначились, и виртуализация — один из тех инструментов, без которых невозможно ее достижение.
Наталья Жилкина — научный редактор «Журнала сетевых решений/LAN» . С ней можно связаться по адресу: nzil@lanmag.ru.
Виртуализация в концепции Hitachi Data Systems
В мае 2002 г. Hitachi Data Systems выпустила на рынок новое поколение систем хранения уровня предприятия — Lightning 9900V, а в конце 2002 г. — новое поколение модульных распределенных систем семейства Thunder 9500 V с поддержкой виртуализации. Каждый из портов Fibre Channel, через которые устанавливается соединение, может работать с разными группами серверов, подсоединенных к нему посредством SAN. Один порт способен поддерживать разные протоколы, а физически подключенным к нему различным серверам могут назначаться определенные группы дисков. Благодаря разграничению доступа каждый из серверов, работая физически через один порт, «не видит» других.
На каждом порту определяются некие группы, так называемые домены хранения. В такой домен включается определенное количество серверов, требующих организации однотипного доступа, и определенное количество дисков, к которым нужно разрешить доступ. Для входящих в домен серверов и дисков указываются параметры их взаимодействия. Виртуализация состоит в том, что каждый сервер или группа серверов «видит» только нужные ему диски с конкретными свойствами. На одном порту эмулируются различные режимы работы с дисковым пространством для разных операционных систем и для кластеров. Кроме того, каждый из протоколов поддержки функционирования операционных систем и кластера имеет небольшие дополнительные расширения, и порт эмулирует группы команд расширения для каждого типа кластера, тем самым не давая ему запутаться. Например, если на порт приходит с одного из серверов кластера команда reset, это не скажется отрицательно на других серверах, которые работают, например, с теми же дисками.
Пример построения сети хранения
Реализация специалистами компании «Открытые Технологии» сети хранения данных SAN с использованием поддерживающего виртуализацию ПО Veritas Software в одном из крупных банков позволила решить многие типичные для организаций такого уровня проблемы. На определенном этапе администраторам сети банка пришлось столкнуться с проблемой неэффективного распределения имеющегося дискового пространства и, как следствие, нехваткой свободной емкости ресурсов хранения. Кроме того, из-за роста объемов резервируемых данных стало невозможным их копирование в течение ночной смены, в период минимальной нагрузки серверов. К тому же проведение профилактических работ с дисковыми массивами было затруднено: для ряда серверных приложений требовался круглосуточный доступ к хранимым на дисковых массивах данным. Специфические задачи, которые стояли перед заказчиком проекта, предъявляли повышенные требования к скорости доступа, общей надежности сети и ее масштабируемости с учетом роста бизнеса. К тому же одним из условий, поставленных перед исполнителем проекта, было жесткое ограничение на привлечение дополнительных инвестиций с целью приобретения нового оборудования.
К моменту начала проектных работ в информационной сети банка функционировали кластер из двух серверов Sun Enterprise, три сервера Intel под управлением Novell NetWare и Windows и сервер Sun Microsystems для управления резервным копированием. Данные хранились на двух дисковых массивах HP OmniRAID, напрямую подключенных к серверам по интерфейсу SCSI, а для резервного копирования использовались ленточная библиотека и ленточный накопитель. Управление хранением данных осуществлялось с помощью ПО компании Veritas Software. В рамках проекта по реконструкции инфраструктуры хранения данных специалисты «Открытых Технологий» предложили вариант организации сети хранения с применением протокола Fibre Channel с использованием двух 16-портовых коммутаторов SilkWorm производства Brocade, а также двух мостов FC-SCSI для интеграции в нее дисковых массивов. Для подключения серверного оборудования к SAN предлагалось использовать адаптеры шины хоста (HBA).
Виртуализацию дисковых устройств было предложено реализовать средствами ПО Veritas Volume Manager (VxVM). Проект основывался на комбинированном решении организации доступа к конечным устройствам хранения: на начальном этапе для серверов Sun реализовали доступ на уровне оптических коммутаторов Brocade и их оптических портов с организацией физических зон (Hard Zoning), а затем на уровне операционной системы использовались гибкие возможности логических зон (Soft Zoning — разграничение доступа с помощью маскировки LUN). Далее видимую часть дискового пространства передали под управление VxVM.
Благодаря использованию ПО Veritas Volume Manager стало возможно распределять логические диски между дисковыми массивами. Это позволило гораздо более эффективно задействовать общую емкость дисковых массивов и решить существовавшую ранее проблему дефицита свободной емкости. В дополнение, благодаря гибким возможностям SAN на уровне логических дисков удалось построить отказоустойчивый кластер с зеркалированием между двумя массивами, территориально размещенными в разных комнатах, решив, таким образом, задачу повышения надежности. Правильность выбранного решения подтвердилась впоследствии. Когда у одного из массивов отказал его системный контроллер, случившееся никак не отразилось на общей работоспособности сети, поскольку серверные приложения имели альтернативный доступ к зеркальным копиям дисков во втором массиве.
Возможности пакета Veritas NetBackup для работы в окружении SAN позволили осуществлять резервное копирование данных в обход сервера приложений. Если прежде все данные копировались с дискового массива на ленточную библиотеку через сервер, то теперь эта работа была «перепоручена» мосту FC-SCSI. В результате копирование определенных блоков данных стало возможным напрямую с дисков на ленту. Благодаря такой схеме удалось, с одной стороны, разгрузить сервер приложений, а с другой, — существенно увеличить скорость резервного копирования данных за счет использования режима Netbackup ServerFree. Скорость ограничивалась лишь производительностью ленточного привода библиотеки.
Следует отметить, что создание сети хранения данных в банке позволило в последующем без труда интегрировать вновь приобретенные системы хранения и безболезненно перенести на них наиболее актуальные данные с устаревших массивов. Кроме этого, применение оптических кабелей избавило от ограничений, присущих соединениям SCSI, и помогло объединить все необходимое серверное оборудование и устройства хранения, размещенные в разных помещениях, в единое, гибкое и динамически конфигурируемое пространство. По сути, возможности SAN и виртуализация дисковых устройств способствовали получению высокомасштабируемого и высоконадежного решения. Именно оно обеспечило экономию средств на приобретение дополнительного, более современного дискового массива старшего класса.
Словарь терминов
Виртуализатор — основной активный элемент в технологии виртуализации, которым обозначаются различные продукты у различных производителей. В общем случае виртуализатор представляет алгебраическое преобразование между виртуальными и реальными адресными пространствами.
Менеджер тома — программное обеспечение, которое выполняется на стороне хоста и используется в технологии виртуализации для создания томов. Менеджер тома может оперировать с адресным пространством нескольких устройств либо виртуальным адресным пространством других систем хранения.
Том — адресное пространство, используемое файловой системой или базой данных, независимо от того, является ли адресное пространство виртуальным или реальным. Понятие «том» употребляется вместо «устройство» для обозначения адресного пространства, когда адресное пространство охватывает более одного устройства или часть устройства.
LUN — логический номер устройства. Это адрес, который применяется для доступа к памяти в SAN. Первоначально он был введен как метод адресации для доступа к устройствам внутри подсистемы по параллельному интерфейсу SCSI. Идея подобна тому, как нумеруются апартаменты внутри здания, имеющего адрес. LUN используется для идентификации виртуальной памяти, которая представлена системой хранения или сетевым устройством.