SNIA определяет пять видов виртуализации систем хранения.
В последние два-три года виртуализация в отрасли хранения привлекала к себе самое пристальное внимание. Старт был задан небольшими предприятиями, а позже к ним присоединились практически все крупные производители систем хранения, продвигая на рынок собственные решения, предложения по ОЕМ-договорам, реселлерские программы и приобретенные технологии. Но каковы перспективы у этого направления?
Шумиха вокруг виртуализации немного поутихла, и теперь некоторые предприятия, недавно с большой помпой заявившие о себе, бьются за выживание. Рынок развивается медленнее, чем ожидалось, и причина заключается в громадном количестве предлагаемых решений и вавилонской путанице понятий, многообразие которых приводит конечного пользователя в замешательство. Многие производители слишком часто вводят в названия своих продуктов слово «виртуализация» без разъяснения их специфических преимуществ и четкого размежевания с другими имеющимися на рынке подходами.
В зависимости от объектов виртуализации — диски, блоки, ленточные накопители, файловые системы и файлы/записи — SNIA определяет пять соответствующих видов виртуализации систем хранения. Мы попытаемся рассказать о характеристиках каждого из них, а также об их достоинствах и недостатках.
ТЕХНОЛОГИЯ ВИРТУАЛИЗАЦИИ
Виртуализация хранения, в принципе, не что иное, как разбиение физических жестких дисков на виртуальные элементы хранения с возможностью их гибкой адресации, благодаря чему облегчается управление крупными массивами данных. Виртуализация хранимых данных между множеством систем хранения помогает эффективно распределять их ресурсы, автоматизировать процессы хранения, а также обеспечивает повышение производительности и выполнение приложений управления хранилищами. Под виртуализацией хранения обычно подразумевают виртуализацию блоков, когда множество небольших физических блоков на диске объединяется в крупные, высокопроизводительные и надежные логические или виртуальные элементы хранения (Block Aggregation).
Администратор создает логические тома, которые хосты, приложения и пользователи воспринимают как традиционные физические диски. Благодаря преодолению физических границ виртуальные устройства хранения могут быть такими емкими, быстрыми и безотказными, как это требуется пользователю в данный момент, причем впоследствии их можно адаптировать к новым условиям без прерывания работы: с целью повышения емкости дисков либо создаются новые логические тома, либо увеличиваются размеры уже имеющихся. Более высокая производительность достигается за счет изменения структуры логического тома посредством чередования (striping), а для повышения отказоустойчивости один и тот же логический том несколько раз записывается на независимые физические диски (зеркалирование).
РАЗЛИЧНЫЕ ФОРМЫ ВИРТУАЛИЗАЦИИ
Производители размещают свои решения по виртуализации в различных частях инфраструктуры — от хоста с приложениями, базами данных, файловыми системами и менеджерами логических томов через сеть хранения данных и контроллер хранилища до физических систем хранения. При этом различают три подхода:
- виртуализация на базе хоста;
- виртуализация на базе накопителя;
- виртуализация на базе сети.
ВИРТУАЛИЗАЦИЯ НА БАЗЕ ХОСТА
Эта форма виртуализации в большинстве случаев ассоциируется с понятием управления логическими томами. Менеджеры логических томов, как и решения виртуализации на базе накопителей, вовсе не обязательно должны быть привязаны к сети хранения данных (Storage Area Network, SAN). По историческим причинам, а также из-за широкого распространения непосредственно подключаемых к серверу систем хранения (Direct Attached Storage, DAS) они сегодня наиболее популярны.
Менеджер логических томов либо является частью операционной системы, либо реализуется в качестве самостоятельного программного продукта. Подобные решения создают на хосте уровень виртуализации, благодаря которому физические дисковые накопители и номера логических устройств (Logical Unit Number, LUN) представляются в виде групп дисков и логических томов (см. Рисунок 1).
Главное преимущество виртуализации на базе хоста заключается в стабильном, проверенном многолетней практикой функционировании и открытости для гетерогенных систем хранения данных. Факт нахождения на хосте, подобно файловой системе, облегчает интеграцию между двумя компонентами для более эффективного управления емкостью. Тома и связанные с ними файловые системы могут увеличиваться и уменьшаться без остановки работы приложений.
ВИРТУАЛИЗАЦИЯ НА БАЗЕ НАКОПИТЕЛЕЙ
В случае виртуализации на базе накопителей объединение в блоки осуществляется в системах хранения данных с интеллектуальными контроллерами, часто предлагающими дополнительные функции: маскирование LUN, кэширование, создание моментальных снимков или тиражирование для копирования массивов данных. Такая виртуализация обеспечивает оптимальную для соответствующей системы хранения производительность. Как и классическое управление томами, эта технология присутствует на рынке достаточно длительное время и не предполагает наличие сети хранения данных.
Решения виртуализации на базе накопителей не привязаны к хосту и потому способны поддерживать множество гетерогенных хостов. Недостаток заключается в том, что они являются собственными для каждой отдельной подсистемы хранения и не распространяются на другие ресурсы хранения.
ВИРТУАЛИЗАЦИЯ НА БАЗЕ СЕТИ
Преимущества обеих описанных выше технологий сочетает в себе виртуализация на базе сети хранения. С ее помощью можно реализовать управление хранением информации во всем вычислительном центре вне зависимости от того, какие серверы и устройства хранения используются.
Задачу виртуализации берут на себя специализированные устройства виртуализации (SAN Appliance). Они доступны в виде либо собственных решений, либо стандартных серверов Windows, UNIX или Linux с соответствующим программным обеспечением.
Устройство виртуализации SAN может быть интегрировано в среду хранения данных двумя способами — в зависимости от того, где оно располагается:
- непосредственно на пути передачи данных между серверами и конечными устройствами хранения (симметричная интеграция);
- вне пути передачи данных (несимметричная интеграция), откуда метаданные о физической структуре и местонахождении логических томов передаются хостам, например через соединения по локальной сети или инфраструктуру SAN.
УСТРОЙСТВА НА ПУТИ
При симметричном (in-band) подходе устройство виртуализации располагается на пути передачи данных между хостами и системами хранения данных (см. Рисунок 2), и вместе с логическими томами представляет себя хостам в качестве такой системы. Как мета-, так и полезные данные проходят через устройство. Тем самым достигается высокий уровень безопасности, поскольку устройство в известной степени выполняет роль брандмауэра для сети хранения, препятствуя доступу к системам хранения в SAN, когда хосту не разрешен доступ к тому явным образом.
Эта концепция виртуализации не требует установки на хосте специальных драйверов, за исключением программного обеспечения переключения на другой путь в случае отказа, и поэтому, в отличие от ассиметричного подхода, реализуется просто. Кроме того, она позволяет обеспечить поддержку множества гетерогенных хост-систем. Несовершенство решения в том, что устройство виртуализации представляет собой еще один транзитный элемент на пути передачи данных. Для минимизации результирующих проблем с производительностью активные устройства виртуализации, как правило, поддерживают функции кэширования.
УСТРОЙСТВА СБОКУ
При асимметричном подходе устройство виртуализации располагается вне пути передачи данных и взаимодействует с хост-системой, например по соединениям через локальную сеть или инфраструктуру SAN (см. Рисунок 3). Поэтому на хостах должен быть установлен «клиент виртуализации» или «агент» в виде программного обеспечения либо специальных драйверов для адаптера главной шины (Host Bus Adapter, HBA), в задачи которого входит получение от устройства сведений о структуре и свойствах логических томов, а также соответствующей физической/ логической информации об отображении блоков. Получив эти данные, хост может обращаться напрямую к соответствующим физическим блокам систем хранения данных в SAN.
Необходимость установки на хосте агента осложняет внедрение несимметричных решений, однако программного обеспечения необходимо меньше, чем это требуется для полноценного логического менеджера томов на базе хоста. К тому же, поскольку поток данных не проходит через отвечающее за виртуализацию устройство, технические требования к его аппаратной платформе, адаптерам главной шины, центральному процессору, памяти и кэшу заметно ниже, чем для устройств виртуализации при симметричном подходе. Рост «виртуализованного» потока данных в среде SAN напрямую не влияет на находящееся вне пути их следования устройство виртуализации. Тем самым достигается высокая масштабируемость среды SAN, к тому же дополнительная проводка Fibre Channel не нужна.
По причине низких требований к системе внедрение устройств асимметричной виртуализации возможно, к примеру, на традиционном кластеризованном сервере в качестве полностью программного функционала, так что конечному пользователю не придется платить за дополнительное аппаратное обеспечение.
ВИРТУАЛИЗАЦИЯ НА БАЗЕ КОММУТАТОРОВ
Коммутаторы с интегрированными функциями виртуализации могут рассматриваться как в роли симметричных, так и асимметричных устройств. На первый взгляд это симметричное решение, поскольку коммутаторы располагаются на пути передачи данных. Однако при ближайшем рассмотрении такие «интеллектуальные» коммутаторы сочетают свойства обоих типов: распознавание устройств, обнаружение томов и обработка ошибок ввода/вывода производятся посредством «асимметричного мета-контроллера»; последний размещается либо в коммутаторе в виде управляющего модуля, либо на расположенном в стороне устройстве. Лишь при управлении обработкой ошибок конфигурации или ввода/вывода коммутатор действительно находится на пути передачи данных, в большинстве процессов же он функционирует как асимметричное решение. Симметричные процессы, например тиражирование, реализуются через интеллектуальные порты, которые при этом выступают в качестве клиентов виртуализации. После получения от контроллеров информации о томах они могут работать независимо, транслировать физический ввод/вывод в виртуальный и направлять данные соответствующим адресатам.
Потребность в виртуализации на базе сети испытывают многие пользователи. Хотя она и отменяет зависимость от серверов и компонентов хранения, однако до сих пор нескольким гетерогенным серверным системам в SAN пока невозможно предоставить одинаковый объем виртуального хранилища. Различные операционные системы накладывают свой отпечаток на логические тома и файловые системы. Их еще надо «виртуализовать», дабы обеспечить возможность доступа из различных серверных операционных систем. Целый ряд компаний работает сейчас над подобными концепциями, некоторые уже объявили о готовых решениях. По достижении этой цели прозрачному доступу к информации — независимо от вида серверов, операционных систем, сетей и накопителей — уже ничто не будет препятствовать.
ДРУГИЕ ФОРМЫ ВИРТУАЛИЗАЦИИ
Наряду с описанной выше виртуализацией блоков в дисковых системах существует целый ряд решений для виртуализации файлов, файловых систем и ленточных накопителей:
- виртуализация файловых систем, также применяемая в системах NAS, объединяет несколько различных файловых систем в одну крупную "виртуальную" файловую систему, абсолютно прозрачную для пользователя. Доступ осуществляется посредством обычного распространенного протокола NFS или CIFS, в то время как физическая реализация и внутренняя адаптация остаются скрытыми. Примером виртуализации файлов являются решения по управлению иерархическим хранением или жизненным циклом данных, суть которых состоит в переносе редко используемых или архивируемых данных на недорогие вторичные носители - оптические диски или магнитные ленты, при этом пользователь получает полную прозрачность и стабильный доступ к этим данным;
- виртуализация ленточных носителей в мэйнфреймовых средах благодаря установленным перед ними дисковым кэширующим системам и интегрированной эмуляции ленты обеспечивает лучшее распределение нагрузки на ленточные ресурсы и ускоряет доступ к ленточным блокам, поскольку нет нужды в длительной загрузке и выгрузке ленты, эмуляция которых осуществляется посредством быстрого доступа к дисковому кэшу. В открытых системах пользователи получают выгоду благодаря совместному использованию лентопротяжных механизмов в ленточных библиотеках большим количеством хост-систем. Технологии SAN хотя и позволяют реализовать общую адресацию ленточных накопителей с различных серверов, однако только их виртуализация способствует созданию ленточного пула с максимальной целостностью данных.
ЗАКЛЮЧЕНИЕ
Универсального решения для виртуализации не существует, и оно вряд ли появится в ближайшем будущем. Для каждого окружения необходимо подобрать наиболее подходящую методологию, дабы различные функциональные блоки в разных местах сети хранения данных работали согласованным образом. Так, например, функции кэширования и операции RAID лучше всего размещать в самой системе хранения. Из-за близости к файловой системе и приложению, а также, не в последнюю очередь благодаря отказоустойчивости, с точки зрения сервера виртуализация на базе хоста предлагает множество преимуществ, в то время как виртуализация на базе сети лучше всего обеспечивает открытость в случае гетерогенных накопителей и серверов.
Виртуализация хранения не является решением всех проблем, однако это важный инструмент администратора системы хранения. Для всеохватывающего управления хранением ей необходимы дополнительные сервисы: резервное копирование данных, обеспечение высокой готовности и управление ресурсами хранения. Накопитель может быть виртуализирован и предоставлен потребителю по его индивидуальному запросу лишь тогда, когда он обнаружен и визуализирован со всеми атрибутами. Если по отношению к серверу он находится в другой зоне сети хранения, то она должна быть дополнительно переконфигурирована, чтобы сервер и накопитель могли работать вместе. Соответствующие функции предлагают решения для активного управления ресурсами хранения, которые обеспечивают управление объектами хранения через оригинальные программные интерфейсы приложений или стандартные интерфейсы, например SMI, и, кроме того, интегрируют открытые интерфейсы для вызова функций виртуализации.
Франк Бунн — главный менеджер по маркетингу и менеджер по продуктам и решениям в регионе ЕМЕА компании Veritas Software, активный член европейского подразделения SNIA. С ним можно связаться по адресу: http://www.veritas.com.
? AWi Verlag