Нынешний этап в развитии систем хранения данных проходит под знаком соперничества протоколов Fibre Channel и iSCSI (Internet Small Computer System Interface). Первый старше и «солиднее», работа над ним началась в 1988 году, он был принят в качестве стандарта ANSI взамен HIPPI и сегодня является доминирующим стандартом в сетях хранения SAN корпоративного уровня, но присущие ему ограничения на дистанцию передачи данных и необходимость построения специальной инфраструктуры потребовали создания обновленных версий. Известны три основные такие версии, еще не принятые в качестве стандартов: Internet Fibre Channel Protocol (iFCP), Fibre Channel over IP (FCIP) и Fibre Channel over Ethernet (FCoE), имеющий наибольшие шансы. Однако в 2000 году совершенно неожиданно у этих решений появился конкурент в лице протокола iSCSI, впервые предложенного Джулианом Сатраном, сотрудником лаборатории IBM в Хайфе. Сатран, в прошлом сотрудник академии наук Румынии, в 1969 году эмигрировал в Израиль, где в 1997 году пришел к выводу, что передача данных по TCP/IP вполне может составить конкуренцию Fibre Channel. Несколько позже к аналогичным выводам пришла группа исследователей из Cisco, и в 2003 году еженедельник InfoWorld признал трех членов этого коллектива и Сатрана изобретателями года. Распространение систем iSCSI откроет предприятиям со скромным ИТ-бюджетом возможность доступа к виртуализированным системам.
Реакция со стороны производителей оборудования и программного обеспечения для сетей хранения (Storage Area Network, SAN) на появление дешевой альтернативы была неоднозначной, от полного непризнания до убежденности в абсолютном преимуществе iSCSI перед Fibre Channel. Сейчас iSCSI реализован в продуктах Storage Center (Compellent Technologies), EqualLogic PS Series (Dell), NSM Series (HP) и ряде других. С появлением iSCSI можно говорить о двух направлениях в развитии SAN и, соответственно, двух направлениях в виртуализации систем хранения.
Целью виртуализации, вне зависимости от области приложения, обычно является упрощение администрирования гетерогенного оборудования, повышение надежности, снижение простоев, повышение степени использования оборудования, что, в конечном счете, ведет к снижению издержек. Первые разработки, связанные с виртуализацией систем хранения в их современном понимании, датируются концом прошлого десятилетия. Сначала со своими продуктами вышли компании IBM и HDS, позже к ним присоединились EMC и Datacore. Усилиями этих компаний сложился сегмент рынка, основанный на сетях хранения с использованием Fibre Channel, ориентированный на крупных корпоративных заказчиков. А после 2005 года вместе с ростом популярности iSCSI виртуализация систем хранения стала доступна среднему бизнесу, и лидерами здесь являются компании LeftHand, Dell и некоторые другие, использующие технологии виртуализации VMware и Citrix.
Виртуализация систем хранения в общем
В общем стеке виртуализации виртуализация систем хранения данных занимает промежуточное место между процессорным и сетевым уровнями, благодаря ей приложения лишаются зависимости от конкретных технологий хранения, они могут потреблять данные, представленные в логической форме.
Казалось бы, все просто, но сложность ответа на вопрос «что и где хранить» объясняется тем, что для хранения данных используются разные устройства, отличающиеся по физическим и конструктивным признаком. Примечательно, что при создании других составляющих компьютерных систем были хотя бы какие-то теоретические предпосылки: у процессоров – машина Тьюринга, у каналов связи – теория передачи данных Шеннона и т.д., а к записи данных обычно подходили исключительно с инженерных позиций. К тому же собственно данные никогда не были предметом изучения, к ним отношение было и остается предельно утилитарным. С первых серийных дисков IBM 305 RAMAC (Random Access Method of Accounting and Control), созданных в 1956 году и имевших емкость 5 млн 7-битовых байтов и весивших не одну сотню килограммов, и до сегодняшних 2,5-дюймовых, емкость которых измеряется терабайтами, с точки зрения отношения к данным изменения минимальны. Разве что, когда возникла необходимость усовершенствовать доступ к данным, добавили описывающие их метаданные. Формально термин «теория данных» (data theory) существует, и его можно найти в словарях, но никаких научных обобщений, связанных с данными, нет. Отсутствие теоретических предпосылок и упрощенное отношение к данным стали причиной того, что и системы хранения данных, и средства для управления данными (data management), и виртуализация в применении к данным построены исходя из интуитивных инженерных представлений.
Модель хранения SNIA и сети Fibre Channel
Пока системы хранения данных оставались периферией ИТ-индустрии и существовал единственный способ подключения – напрямую (Direct Attached Storage, DAS), с отсутствием системности можно было мириться, но с появлением сетей хранения возникла насущная потребность упорядочить зоопарк устройств хранения, и эта функция было возложена на созданную в конце 1997 года некоммерческую организацию SNIA (Storage Networking Industry Association), выпускающую отраслевые стандарты и модели. В 2001-2003 годах SNIA создала модель Shared Storage Model, призванную сыграть примерно ту же роль, которую играет многоуровневая модель открытых систем OSI. Модель SNIA описывает архитектуру, но сама не является архитектурой и служит инструментом систематизации. Эту модель нельзя сравнивать с таблицей Менделеева, отражающей природные закономерности, скорее она похожа на систематизацию в биологии, где требуется свести воедино виды, возникшие независимо друг от друга. Следует учитывать, что объектом моделирования являются не сами данные, а контейнеры, содержащие эти данные, то есть форма, а не содержание.
Обычно модель распределенного хранения данных SNIA представляют в виде четырехуровневого стека (рис. 1). На верхнем уровне файлов и записей, как и на лежащих ниже уровнях, меньшие по объему представления данных упаковываются в более крупные – файлы и кортежи (записи) баз данных преобразуются в тома или в логические устройства. Эту функцию реализуют компоненты, входящие в состав систем управления базами данных и/или в файловые системы, использующие механизмы имен и индексов, они же обеспечивают резервирование пространства, кластеризацию и кэширование. Реализация функций третьего уровня может осуществляться двумя способами: программами, выполняемыми на хосте, на котором полностью размещается СУБД или файловая система, а интерфейс с устройством осуществляется на блочном уровне (крайняя левая стрелка на рис. 1); через файловые серверы (вторая слева стрелка) и такие сетевые файловые системы, как NFS или CIFS.
Второй уровень (блочный), делится на три подуровня, и на нем преобразуется низкоуровневое представление данных в более высокоуровневое, например, из интерфейса SCSI формируются логические устройства (LU). На этом же уровне осуществляется управление распределением дискового пространства и изменение размеров блока, поскольку конкретные устройства в зависимости от их конструкции могут иметь собственные блоки (раньше эти функции осуществляли резидентные на хостах менеджеры томов). Здесь же выполняется сегментирование данных (data striping) между разными шпинделями для повышения скорости работы и надежности хранения, в частности на этом уровне поддерживаются RAID-массивы. Как показано тремя центральными стрелками (рис. 1), эти преобразования могут осуществляться непосредственно на хостах менеджерами томов, драйверами устройств или адаптерами шин HBA (Host Bus Adapter). Кроме того, эту функцию берут на себя специализированные сетевые устройства либо используются современные диски с мощными встроенными контроллерами. В конечном итоге задача этого уровня сводится к агрегированию блоков, к замене физических блоков виртуальными и ее можно назвать нижним уровнем виртуализации.
Модель SNIA упорядочивает различные архитектуры хранения категории DAS, сети хранения (SAN) и сетевые накопители (Network Attached Storage, NAS). Об архитектуре DAS можно сказать, что она допускает не более одного хоста на канал и в ней отсутствуют какие-либо коммутаторы или концентраторы, используется блочный интерфейс и агрегирование возможно на хосте или в устройстве. Архитектура SAN отличается тем, что в ней множество хостов подключается к множеству накопителей с использованием сетевого оборудования, а агрегирование возможно не только на хосте и на устройстве, но и в сети, если используется специализированное устройство типа SAN Appliance. В случае NAS все почти так же, но это устройство помимо агрегирования блоков еще включает в себя сервер метаданных. Бытующее мнение о разделении SAN и NAS является следствием того, что производители не учитывают предлагаемое «горизонтальное деление» на уровни, а предпочитают свое собственное «вертикальное». В SNIA используется SN (Storage Network), где могут быть различные решения на аппаратном уровне (Fibre Channel, Ethernet или InfiniBand), транспортные протоколы (FCP, TCP/IP), доступ на блочном или на файловом уровне, и все это в самых разнообразных сочетаниях.
Виртуализация и модель SNIA Shared Storage
В SNIA дается двуединое определение виртуализации хранения. С одной стороны, это акт абстрагирования, сокрытия и изоляции внутренних функций систем и подсистем хранения данных от приложений, хост-компьютеров, общих сетевых ресурсов с целью обеспечения независимости данных и средств управления ими от приложений и сетей. С другой стороны, приложение виртуализационных технологий к устройствам хранения и сервисам данных позволяет скрыть их сложность и повысить функциональность низкоуровневых ресурсов хранения. Иначе говоря, все сводится к абстрагированию от деталей в тех случаях, когда эти детали не имеют значения, собственно, на этом принципе строятся любые технические системы.
Для виртуализации на каждом из уровней модели SNIA используется собственная технология и не предполагаются такие строгость и единство, как в случае процессорной виртуализации. Виртуализация дисков и лент на нижнем уровне, записей и файлов на верхнем и блочная виртуализация не предполагают ничего общего, но тем не менее они вписываются в одну модель.
Важность данной модели иллюстрирует заочная дискуссия между компаниями HDS и EMC, развернувшаяся после выхода весной 2009 года новой модели Symmetrix V-max. В EMC утверждают, что Symmetrix V-max являет собой новую парадигму в виртуализации систем хранения, а оппоненты из HDS опровергают это утверждение, считая, что V-max всего лишь усовершенствованная модель Symmetrix. Однако по сути разногласия нет – полемизирующие стороны просто не договорились о предмете спора, забыв, что есть близкие технологии storage virtualization и virtualized storage, которые обычно не различают. Первая – это технология для виртуализации накопителей, например Hitachi TagmaStore USP, IBM SAN Volume Controller (SVC) и EMC Invista, позволяющая объединить в пул накопители разных моделей. Вторая – это устройства со встроенной виртуализацией, объединяющие не чужие, а свои собственные ресурсы в единый пул, например Symmetrix V-max. Оба подхода имеют право на существование: устройства Hitachi TagmaStore USP, IBM SAN Volume Controller (SVC) и EMC Invistа находятся на верхних этажах уровня II, а Symmetrix V-max на нижних.
Виртуализация дисков
Со времен, когда диаметр диска был равен метру, и до нынешних 2,5-дюймовых дисков принцип адресации к данным, записываемым на них, не изменился – CHS (cylinder, head и sector). Естественно, такую разбивку желательно как-то нормализовать, заменив физическую адресацию логической, то есть агрегировать дорожки, цилиндры и сектора в логические блоки – CHS-LBA. Попытки такого рода были предприняты с появлением винчестерных дисков, однако дисками и операционными системами занимались одни и те же компании, разнообразие типов дисков было невелико: достаточно было сообщить системе имя диска, и ОС «знала» его параметры (число дорожек, цилиндров, секторов и т.д.). Но вместе с винчестерами возникла новая индустрия, отдельная от производства операционных систем, которая быстро выросла, и пришлось делить диски на части, называть эти части именами съемных дисков, известных операционным системам, и эмулировать их работу средствами ОС. С этого момента и началась виртуализация дисков, суть которой была в замене физического адреса блока логическим, и поэтому можно утверждать, что все современные системы хранения являются виртуальными.
Чтобы совсем разорвать прямую связь ОС с устройствами, в начале восьмидесятых годов был предложен стандарт SCSI (Small Computer System Interface), включающий в себя набор команд для работы с логическими блоками LUN (Logical Unit Number). В своей первой редакции он всего лишь обеспечивал универсальный доступ по шине к устройствам хранения независимо от их типа, в дальнейшем стандарт развивался, был адаптирован для работы с массивами RAID. Прямым предшественником SCSI был проект SASI (Shugart Associates System Interface), разработанный в компании Shugart, в нем использовался 50-жильный плоский кабель, и его команды являются подмножеством SCSI-1. Признанный «отец SCSI» Ларри Бушер предполагал, что стандарт будут называть sexy, но издательство ENDL Publications, с 1984 года специализирующееся на литературе по SCSI, предложило название scuzzy, переводимое как «неряха», и оно приклеилось. Примерно в то же время специально для ПК был разработан дисковый интерфейс Integrated Drive Electronics (IDE), позже названный AT Attachment Packet Interface (ATA/ATAPI). В последующем «параллельные» SCSI и ATA подверглись сериализации, появились «последовательные» версии SAS и SATA. С середины 90-х годов получили развитие решения SAN, сначала с Fibre Channel Protocol (FCP) в роли транспортного протокола для передачи команд SCSI по сетям Fibre Channel, а позже вместе с технологией для передачи команд, адресованных дисковым контроллерам по сетям IP, появилась модификация iSCSI. Для сети Ethernet разработан вариант Fibre Channel over Ethernet (FСoE), и для дисков ATA есть своя аналогичная сетевая версия протокола AoE (ATA over Ethernet).
Виртуализация лент
Решения, поддерживающие виртуализацию лент, отражают специфику этого типа накопителей и распадаются на две части: одни обеспечивают виртуализацию носителя, другие – виртуализацию библиотек. Лента может работать в старт-стопном режиме (его еще называют shoeshining, по аналогии с чисткой обуви бархоткой) и в потоковом режиме (streaming). Второй предпочтительнее, он быстрее и надежнее, к тому же гораздо эффективнее с точки с точки зрения использования носителя. Чтобы перевести фрагментированные входные потоки данных в непрерывные, используются дополнительные диски, накапливающие необходимые объемы данных, которые потом в потоковом режиме переписываются на ленты. С внедрением сетевых технологий в системы хранения открылась возможность распределенного пользования ленточными библиотеками с разных хостов (раньше библиотека могла быть подключена только к одному компьютеру). Но здесь возникают новые задачи, решение которых возможно при условии объединения нескольких лентопротяжек в общий пул: автоматическая проверка и выбраковка дефектных лент, создание по аналогии с дисковыми RAID-массивами массивов независимых лент RAIT (Redundant Array of Independant Tapes) и библиотек RAIL (Redundant Array of Independant Libraries).
Виртуализация третьего уровня
Простейшая форма виртуализации файловых систем – концепция удаленных файловых систем, реализованная в NAS на основе NFS или CIFS. Она предполагает, что выделенный файловый сервер управляет доступом к файлам в распределенной файловой системе, где правом на доступ обладает множество хостов, работающих под управлением различных операционных систем. В таком случае вне зависимости от типа ОС приложения получают доступ к файлам, используя один и тот же интерфейс, не зная при этом, где эти файлы находятся. Подобное «сокрытие» местоположения файла представляет собой типичный пример виртуализации. Другой пример виртуализации файловой системы можно взять из области баз данных. Известно, что для повышения производительности СУБД разумнее использовать диск без файловой системы, что неудобно с позиций администрирования. Виртуализация обеспечивает возможность двух представлений одного и того же ресурса. Для СУБД данные остаются представленными в виде строк и столбцов, а для администратора – в виде файлов. Еще одна разновидность виртуализации файлов и записей (File/Record Virtualization) может быть использована в системах управления жизненным циклом информации (Information Lifesycle Management, ILM) или в иерархических системах управления (Hierrarchical Storage Management, HSM). Предназначение этих систем в поддержке миграции данных между высокоскоростными корпоративными дисками SCSI и большими по объему, но не столь быстрыми дисками ATA или лентами. В данном случае виртуализация освобождает от необходимости знания реального местоположения файла или записи – независимый от этого знания доступ поддерживается метаданными и указателями.
Блочная виртуализация
Сегодня наибольшее внимание привлекает к себе так называемая блочная виртуализация, ее можно считать следующим шагом по отношению к CHS-LBA. Нередко производители сводят все возможные представления о виртуализации к блочной схеме, что принципиально неверно. Блочная виртуализация позволяет представить все дисковое пространство сети хранения, состоящее из множества дисков, как один большой диск и затем делить его так, как угодно, снабжая создаваемые виртуальные диски любыми требуемыми характеристикам. Цель блочной виртуализации заключается в управлении физическими ресурсами и получении (путем комбинирования) виртуальных дисков с заданными свойствами в режиме, прозрачном для пользователя. Реальный физический диск имеет фиксированный размер, ограниченную производительность и может выходить из строя, а виртуальный может иметь любой размер, за счет распараллеливания может обладать требуемой пользователю производительностью и у него управляемые параметры надежности.
Емкость масштабируется путем объединения в один логический том нескольких физических либо за счет разделения физического диска на несколько логических (slicing, «нарезка»). Производительность повышается посредством приема, называемого striping, когда данные разносятся на нужное число шпинделей, что увеличивает скорость выполнения операций ввода/вывода. Надежность и готовность обеспечиваются созданием RAID-массивов, кластеризацией, зеркалированием, синхронной и асинхронной репликацией, причем все это делается на втором уровне модели средствами блочной виртуализации.
Где и как?
Ответив на вопрос: «Что является предметом виртуализации систем хранения?», теперь поймем, опираясь на модель SNIA, что и на каком уровне следует делать. Какой бы ни была реализация, при обращении к данным последовательность действий остается неизменной:
-
приложение выполняет запрос на запись или чтение, адресованный операционной системе;
-
запрос проходит через файловую систему или через СУБД и преобразуется в логические адреса блоков;
-
логические адреса переводятся в физические;
-
выполняется операция чтения/записи.
Виртуализация распространяется на все четыре действия, причем, что касается дисков и файловых систем, здесь проблем нет, в первом случае эту функцию реализуют дисковые контроллеры, во втором – серверы либо самих хостов, либо специализированных файловых серверов. Самая большая сложность с переводом логических адресов в физические, то есть с тем, что называется блочной виртуализацией. Иногда виртуализацию систем хранения вообще рассматривают только на этом уровне. На протяжении нескольких лет блочная виртуализация остается предметом острой дискуссии, в которой ключевым является вопрос «где?», поскольку осуществлена она может быть на любом из трех подуровней второго уровня модели SNIA. Трансформация может осуществляться на хосте (Host-based), может быть перенесена на само устройство (Storage-based) или же на разные накопители, которые могут быть подключены к серверам через специализированный контроллер дисковых массивов (Array-based), и, наконец, она может быть вынесена в сеть (Network-based). Подмножеством последней схемы можно считать использование коммутирующих структур (fabric), создаваемых с использованием интеллектуальных коммутаторов (Switch-based).
Виртуализация на хосте чаще всего представляется в виде логических менеджеров томов (Logical Volume Manager, LVM), мощность которых зависит от того, что является хостом – настольный компьютер или ЦОД. Область их действия распространяется на непосредственно подключенную память и на сеть хранения. Основные функции LVM: агрегирование множества устройств LUN в один «супер-LUN», который рассматривается операционной системой как единый диск; реализация различных типов RAID, «мгновенных копий» и репликации; мониторинг работоспособности дисков. Этот тип виртуализации был предложен раньше других, отсюда его отработанность, но он привязан к определенному серверу, нагружает его дополнительной работой, частично этот недостаток компенсируется кластерными LVM, способными работать с однородной серверной средой. Решения такого типа чаще всего ассоциируются с продуктами Veritas.
Виртуализация систем хранения обеспечивает гибкую связь между хостами и системами хранения, но в простейшем случае ограничивает область одним накопителем, что сокращает возможности создания моментальных снимков системы и повышения надежности. Этот недостаток может быть компенсирован при использовании специализированных контроллеров, таких как Hitachi TagmaStore USP (Universal Storage Platform), названных платформой за возможность использования в крупной корпоративной информационной системе в качестве единственного, консолидированного узла хранения и управления одновременно пулом внутренних и внешних накопителей как объединенным виртуальным пространством.
Сетевая виртуализация объединяет в себе возможности двух первых вариантов. Этот подход может быть распространен на все системы хранения в ЦОД, обеспечивая удобство управления гетерогенным оборудованием. Он реализуется посредством специализированных устройств (appliance) и программных агентов, размещаемых на хостах. Технологии такого рода дают возможность либо объединять несколько LUN в один большой массив, либо, наоборот, разделять один массив на несколько меньших по размеру LUN. Кроме того, с их помощью обеспечивается синхронная или асинхронная репликация данных в сети хранения и ограничение доступа к определенным устройствам, если это необходимо для обеспечения безопасности.
Существуют два возможных варианта реализации сетевой виртуализации: in-band и out-of-band, различающиеся по тому, как сочетается передача метаданных и данных. В первом случае управляющие данные передаются в одном потоке с основными данными. Этот способ известен со времен изобретения телефона и телеграфа, где номер абонента и управляющие последовательности символов идут по той же линии, что и основной поток данных. По своей логике виртуализация на хосте и виртуализация систем хранения являются решениями типа in-band. Несколько позже был изобретен вариант out-of-band, где для передачи данных и метаданных используются разные каналы. В TCP-сетях out-of-band используется для «срочной» передачи служебных данных. Типичным представителем этого класса решений является специализированное устройство IBM SAN Volume Controller (SVC).
Коммутируемая виртуализация объединяет в себе in-band и out-of-band, она строится на основе подключаемых к серверам-хостам интеллектуальных коммутаторов Fibre Channel, которые берут на себя такие функции, как репликация данных. Достоинство этого подхода в том, что, беря на себя часть функций хоста, такие коммутаторы повышают производительность, а их недостаток в высокой стоимости решения. Примером решения Switch-based можно считать программный продукт EMC Invista (рис. 2), устанавливаемый на коммутаторах Cisco и Brocade. Программное обеспечение EMC Invista позволяет использовать вычислительную мощность стандартных коммутаторов для выполнения всех функций виртуализации, разгружая тем самым хосты.
Виртуализация сетей хранения iSCSI
Все перечисленные решения, реализующие блочную виртуализацию, являются «тяжелыми». Они были предложены в тот период, когда сети хранения строились лишь на основе Fibre Channel и были ограничены крупными корпоративными системами, в которых используются мощные серверы и накопители, относящиеся к категории вертикально масштабируемых. Но с тех пор в отрасли произошли заметные сдвиги в сторону горизонтального масштабирования, и эта тенденция только распространилась на системы хранения данных.
Коммуникационной основой для систем хранения типа scale-out, альтернативой Fibre Channel может стать передача данных по сетям TCP/IP и протокол iSCSI. Передача команд SCSI по сетям этого типа позволяет упростить создание сетей хранения данных и увеличить расстояние между узлами. Невысокая стоимость таких решений делает их доступными для среднего и малого бизнеса. Протокол позволяет клиентам на хостах («инициаторам») передавать команды SCSI, адресованные устройствам («целям»). Программные агенты-инициаторы входят в состав всех современных операционных систем, они позволяют наладить обмен на блочном уровне между хостами и целями. Протокол iSCSI инкапсулирует команды SCSI в пакеты TCP/IP, при получении целевое устройство распаковывает его и выполняет команды. Физически для подключения используются стандартные контроллеры Gigabit Ethernet, что избавляет от сложностей, связанных с сетями хранения Fibre Channel.
Существует два способа реализации iSCSI. Аппаратный недорог, имеет высокую производительность, но не обеспечивает гарантированную полосу пропускания и несет все недостатки, свойственные IP-сетям. Программный iSCSI еще дешевле, но отличается низкой производительностью и предполагает дополнительную нагрузку на процессоры хостов и серверы хранилищ.
Для построения сетей хранения на основе iSCSI можно использовать существующую инфраструктуру сетей не только Ethernet, но и WAN на основе IP: кабели, адаптеры, коммутаторы, маршрутизаторы, средства сетевого мониторинга и управления и т. д. В этом их экономическое преимущество, хотя надо принимать во внимание, что данные по протоколу iSCSI передаются по открытым IP-сетям, поэтому необходимо предпринимать меры для шифрование на нижних по отношению к iSCSI уровнях: IPSec, Kerberos или обмен публичными/приватными ключами. Еще следует учитывать противоречие между тем, что по своей природе SCSI – это канальный интерфейс, он должен передавать пакеты последовательно и без задержки, но нарушение последовательности приводит к потере данных, а сети IP по определению менее надежны и могут терять пакеты, к тому же пакеты доставляются получателю без соблюдения строгой последовательности, и на ее восстановление требуется дополнительное время и ресурсы. Эти недостатки компенсируются контроллерами iSCSI, способными разгружать процессор и выполнять операции, связанные непосредственно с обработкой протокола iSCSI и появлением сетей 10G, а в будущем 40G и 100G Ethernet.
Простота виртуализации iSCSI объясняется более гибкой системой имен. В сетях Fibre Channel используется система World Wide Name (WWN), где 64-разрядный адрес присваивается каждому узлу сети, а для обеспечения безопасности используется технология Soft Zoning, что довольно неудобно. Напротив, в iSCSI реализовано принятое в Internet соглашение об именах, которые расшифровываются и преобразуются в числовые адреса серверами имен DNS, что гарантирует глобальную уникальность имен и предоставляет администратору сети широкие возможности. Для установления соответствия между iSCSI-именами и адресами применяется сервис имен устройств хранения Internet Storage Name Service (iSNS).
Блочная виртуализации, построенная на принципах вертикального масштабирования, не привязана к строго ограниченному типу накопителей, она позволяет интегрировать гетерогенные устройства в единый пул, обеспечивает удобство доступа к данным, однако в сеть приходится добавлять дополнительные (внешние) устройства, что усложняет управление. Компании, производящие системы хранения iSCSI, пошли иным путем. Они собирают крупные хранилища данных из стандартных модулей, как, например ферма, управляемая программным обеспечением VMware или Citrix (рис. 3), которая образует основу для ЦОД, состоящего из стандартных модулей хранения и стандартных серверов, собранных в два виртуальных облака, объединенных инфраструктурой Ethernet. Подобное виртуализированное хранилище Dell EqualLogic собирается из модулей PS Series, каждый из которых содержит диски с резервированием, контроллеры и блоки питания. В них используются высокоскоростные диски SAS и большие по объему, но и более медленные SATA-II. Удельная стоимость такого хранения на порядок или даже не порядки ниже, чем в классических системах. Аналогичные накопители предлагает компания D-Link.
FCoE или iSCSI?
Ответом на появление iSCSI стал протокол Fibre Channel over Ethernet, где непосредственно Fibre Channel передается по протоколу Ethernet, в то время как в iSCSI используется TCP/IP поверх Ethernet. То есть в первом случае получается сеть хранения Fibre Channel SAN, работающая по Ethernet, а в последнем IP SAN. В итоге сложилась замечательная ситуация, когда соперничают две близкие технологии, взаимно стимулирующее друг друга. На данный момент нет явного лидера, и основные события впереди.
Стек виртуализации
Виртуализация доступа. Независимость доступа к приложению от параметров используемого устройства – устройство и приложение обладают автономной от пользователя способностью к взаимной адаптации.
Виртуализация приложений. Поддержка возможности выполнения приложений на различных аппаратных платформах под управлением различных операционных систем.
Процессорная виртуализация. Группа наиболее распространенных технологий виртуализации, позволяющих объединять или делить процессорные ресурсы с использованием виртуальных машин.
Виртуализация систем хранения. Совокупность решений, позволяющих представить физические ресурсы хранения данных в логической форме.
Сетевая виртуализация. Интерпретация ресурсов сети в форме, не зависящей от их физического устройства.
Виртуализация хранения, вторая волна
Начиная с 2003 года примерно с годовым интервалом компании IBM, Hiatchi Data Systems и EMC предлагали перспективные решения, нацеленные на виртуализацию масштабных корпоративных систем хранения данных. Их решения не похожи друг на друга, но высокое качество виртуализации обеспечивается в них за счет эффективности обратной связи, которая позволяет системе управления быть в курсе состояния дисковых накопителей.
Сетевые технологии радикально изменили общую картину корпоративных информационных систем, и теперь ИТ-инфраструктуры представляются не иначе как в виде многоуровневой модели, простирающейся от пользовательских приложений до аппаратуры.