Однако в отношении архитектуры определенности до сих пор нет, и борьбу за лояльность заказчиков ведут разные подходы — на основе вертикального или горизонтального масштабирования. По мере все более широкого применения в ЦОД оборудования 10 Gigabit Ethernet все более важную роль начнут играть новые технологии, в частности Fibre Channel over Ethernet и Lossless Ethernet. Среди других тенденций — иерархическое хранение информации и технология многоуровневого хранения.
В деле распространения эффективных методов управления хранением важную роль сыграли недавно созданные компании 3PAR и Equallogic. Они были одними из первых производителей, которые представили на рынке дисковые массивы с функциями Thin Provisioning и Thin Reclamation. Недавно 3PAR вошла в состав HP, а Equallogic уже довольно продолжительное время принадлежит Dell. К настоящему времени большинство производителей интегрировало подобные функции в свои системы хранения, и теперь разработчики постоянно совершенствуют их для решения новых задач, к примеру для эффективного предоставления виртуальных настольных систем с помощью функции Thin Cloning.
Рисунок 1. По данным Quantum, виртуальная ленточная библиотека (Virtual Tape Library, VTL) DXi 8500 способна производить резервное копирование данных со скоростью до 6,4 Тбайт в час. |
При обеспечении резервного копирования широко используется дедупликация данных, которая позволяет существенно сократить их объемы. Среди пионеров этого направления были как малоизвестные компании, например Data Domain (к настоящему времени принадлежит EMC), так и именитые производители — Quantum (cм Рисунок 1). Для рабочих данных дедупликация используется редко, но активно пропагандируется, в том числе компанией NetApp. Убедительный аргумент в пользу дедупликации — возможная экономия затрат на ресурсы хранения. В дисковых массивах NetApp среднего (Midrange) и старшего (High-end) класса дедупликация осуществляется со сдвигом по времени (к примеру, ночью или в выходные), чтобы не мешать производственным процессам.
СОРЕВНОВАНИЕ СИСТЕМНЫХ АРХИТЕКТУР
За последние годы на рынке дисковых массивов представлен ряд новых технических подходов. И новички, и предприятия мирового уровня стремились достичь высокой производительности и хорошей масштабируемости ресурсов хранения за счет тщательно разработанной системной архитектуры. В результате были созданы системы, которые для предоставления логических устройств (LUN) задействуют все жесткие диски, имеющиеся в массиве. При этом используемые логическим устройством области данных разделяются на малые блоки (Chunks), распределяемые по всем дискам массива. Таким образом, для всех логических устройств обеспечивается очень высокая производительность операций ввода/вывода.
К числу производителей подобных систем хранения относятся, к примеру, Pillar Data Systems и компания IBM, которая недавно приобрела израильское предприятие XIV. Особенность системы, созданной разработчиками XIV, заключается в использовании дешевых дисков SATA. Первопроходцем этой системной архитектуры можно считать Compaq — системы Enterprise Virtual Array (EVA) еще десять лет назад умели распределять логические устройства по всем жестким дискам системы.
Особым видом новых архитектур дисковых массивов являются так называемые массивы с отключаемыми дисками (Massive Array of Idle Discs, MAID), которые предлагают Nexsan и SGI. В этих массивах невостребованные жесткие диски могут переключаться в энергосберегающий режим или даже отключаться полностью. Подобные решения используются и для резервного копирования на жесткие диски, что позволяет снизить затраты на питание и охлаждение систем. Для обеспечения быстрого доступа система MAID должна одновременно запускать все свои жесткие диски. Согласно заявлению компании SGI, ей удалось реализовать массив MAID из 1200 жестких дисков общей емкостью около 2,5 Пбайт.
ВЕРТИКАЛЬНОЕ ИЛИ ГОРИЗОНТАЛЬНОЕ МАСШТАБИРОВАНИЕ
В сегменте решений старшего класса до сих пор широко распространены монолитные системы хранения вроде IBM DS8000 или EMC Symmetrix. Они оснащаются избыточными контроллерами хранения, способными централизованно управлять более чем одной тысячей жестких дисков и более. Симметричное зеркалирование данных на расположенную в другом месте вторую систему обеспечивает высокую степень сохранности данных. Спроектированные в расчете на высокие требования к производительности, подобные системы обеспечивают очень быстрое время отклика, однако их масштабируемость имеет пределы, так как монолитная система с ограниченным числом контроллеров хранения данных не может управлять любым количеством жестких дисков. Поэтому некоторые производители (к примеру, EMC, выпускающая решение VMAX) расширили свои системы таким образом, чтобы несколько контроллеров хранения данных можно было объединить в одной матричной или ячеистой архитектуре. В результате обеспечивается существенно лучшее масштабирование производительности, чем это было возможно во всех предшествующих монолитных системах.
Инновационные решения — например, IBM XIV или дисковые системы от Pillar Data Systems (производитель дисковых систем) — спроектированы таким образом, что позволяют осуществлять как вертикальное, так и горизонтальное масштабирование. Массивы состоят из модулей данных и ввода/вывода, которые можно комбинировать, поэтому одна и та же система сможет соответствовать высоким требованиям к производительности систем ввода/вывода и к емкости ресурсов хранения.
Горизонтальное масштабирование особенно актуально для неструктурированных данных. Для этого сегмента IBM выпускает семейство DS3000, тогда как для нижнего диапазона среднего ценового сегмента предназначена система Storwize v7000. Это устройство использует для предоставления ресурсов хранения разработанную этой компанией технологию виртуализации SAN Volume Controller (SVC). Верхняя часть среднего уровня охвачена системами от XIV.
Платформа VPLEX компании EMC обеспечивает горизонтальное масштабирование за счет кластеризации модулей системы хранения, поддерживает функцию кэширования данных для соединений с удаленными площадками и оптимизирована для виртуализации серверов. Кроме того, EMC недавно объявила о приобретении производителя Isilon, специализирующегося на системах хранения с горизонтальным масштабированием. Isilon предлагает платформу для унифицированного хранения (Unified Storage), которая поддерживает как блочные протоколы FC и iSCSI, так и NAS-ориентированные протоколы NFS и CIFS.
Рисунок 2. Решение Virtual Storage Platform (VSP) компании HDS поддерживает как вертикальное, так и горизонтальное масштабирование и способно управлять системами хранения других производителей. |
Решения для хранения данных, масштабируемые по разным направлениям, выпускает и Hitachi Data Systems (HDS). Новейшая система этой компании называется Virtual Storage Platform (VSP); она удовлетворяет требованиям как к вертикальному, так и к горизонтальному масштабированию (см. Рисунок 2). Благодаря встроенным функциям виртуализации, VSP может интегрировать различные системы хранения данных в централизованно администрируемый пул хранения. Аналогичные функции имеются в решениях для симметричной (In-band) виртуализации, которые производят Datacore или Falconstor. Эти решения также рассчитаны на централизованное администрирование самых разнообразных систем хранения. Кроме того, уже несколько лет они поддерживают функции Thin Provisioning для эффективного управления системами хранения.
СТАНДАРТНОЕ АППАРАТНОЕ ОБЕСПЕЧЕНИЕ СОКРАЩАЕТ ЗАТРАТЫ
Системы хранения, разработанные недавно созданными предприятиями, почти всегда базируются на стандартном серверном оборудовании архитектуры x86 вместо принятых раньше проприетарных контроллеров систем хранения. Компания HP тоже планирует использовать в инфраструктурах для ЦОД привлекательное по цене стандартное аппаратное обеспечение. Такие серверы должны быть достаточно гибкими, для того чтобы они могли служить как в роли хостов при виртуализации серверов, так и в качестве контроллеров для систем хранения.
Функции, выполняемые в тот или иной момент соответствующим элементом, будут определяться управляющим программным обеспечением, способным динамично перенастраивать компоненты в зависимости от текущих требований. Функции вроде дедупликации данных или архивирования можно будет интегрировать с помощью дополнительных программных модулей (Plug-ins). Однако пройдет еще некоторое время, прежде чем на рынке появятся первые продукты, способные предоставить столь высокую гибкость.
Уже сегодня можно приобрести шасси X9000 компании HP. В нем имеются независимые блоки для расширения емкости систем хранения и увеличения производительности контроллеров, причем как на уровне файлов, так и на уровне блоков. Продукты Lefthand, которые до сих пор выпускаются в виде отдельных устройств (Appliance), HP собирается реализовать в виде модульных серверов, функции которых можно будет индивидуально настраивать с помощью подключаемых модулей (Plug-In). В сегменте устройств старшего класса HP намеревается и дальше предлагать системы HDS в виде OEM-продуктов. Для предприятий, делающих в вопросах хранения основной акцент на предоставлении услуг (Service Provisioning), отличным выбором станут системы, добавившиеся в результате присоединения компании 3PAR. Системы EVA и MSA тоже появятся в ассортименте компании HP.
РЕЗЕРВНОЕ КОПИРОВАНИЕ И АРХИВИРОВАНИЕ
Рисунок 3. Simpana 9 производства CommVault в процессе резервного копирования может через API использовать моментальные снимки виртуальных серверов, созданные дисковыми массивами. |
Для сохранения данных виртуальных серверов, помимо классического программного обеспечения для резервного копирования на базе агентов, уже появились решения, способные за короткий промежуток времени создать резервные копии большого количества серверов путем формирования моментальных «снимков» (Snapshots). Так, в продукте Simpana Version 9 производства CommVault поддерживается функция Snap Protect (см. Рисунок 3). С ее помощью программное обеспечение может через API вовлекать созданные дисковыми массивами моментальные снимки прямо в процесс сохранения данных. Благодаря этому можно одновременно создавать резервные копии гораздо большего количества виртуальных серверов, чем раньше. По данным CommVault, этот способ позволяет за 20 мин создать резервные копии для примерно 500 виртуальных машин.
Благодаря осуществляемой на клиенте дедупликации, которую можно комбинировать с процессами сжатия и шифрования, это программное обеспечение пригодно и для создания резервных копий в филиалах. Simpana индексирует моментальные снимки и может их использовать для восстановления данных. Кроме того, в Simpana 9 появились поддержка правил сохранения (Retention) и индексирование содержимого. Таким образом, это решение для резервного копирования и архивирования теперь соответствует и управленческим требованиям к сохранению важных бизнес-данных,.
Решения для виртуализации систем хранения (Datacore и Falconstor, к примеру, уже не один год выпускают подобные продукты) позволяют реализовать сравнительно дешевые проекты для аварийного восстановления данных (Disaster Recovery). Их главное преимущество — независимость от производителей, что позволяет копировать дисковые массивы среднего или старшего класса одного производителя на более дешевые системы хранения другой марки. Кроме того, виртуализация систем хранения обеспечивает прозрачность функций преодоления сбоев (Failover) и возобновления после отказа (Failback).
Редко используемыми данными можно эффективно управлять с помощью решений HSM. Эти решения автоматически переносят данные, не востребованные в течение определенного промежутка времени, на более дешевые носители. Пользователи видят те же данные на старом месте и могут их просматривать, но времени для этого понадобится несколько больше, поскольку требуемый файл нужно сначала считать из ленточной библиотеки.
Подобные решения HSM уже доступны. Некоторые производители систем хранения пошли дальше и предлагают дисковые массивы, которые — в соответствии с текущей потребностью в производительности — автоматически переносят области данных с быстрых дисков на более медленные и обратно. У компании EMC эта технология именуется Fully Automated Storage Tiering (FAST). HDS предлагает аналогичную функцию в своем решении USP. Та же технология поддерживается в системах, разработанных компаниями Equallogic, 3PAR и Pillar Data Systems.
Рисунок 4. Системы хранения, предлагаемые компанией NetApp (здесь: новая модель FAS3240), по умолчанию поддерживают дедупликацию данных в сочетании с технологией сжатия. |
NetApp недавно представила новое поколение систем хранения среднего и старшего класса — FAS 3200 и FAS 6200 (см. Рисунок 4). Эти дисковые массивы поддерживают так называемую функцию прозрачной мобильности данных (Transparent Data Mobility), с помощью которой можно бесперебойно перемещать данные между различными уровнями хранения (FC, SAS, SATA или SSD).
Рисунок 5. F5 предлагает решение ARX, обеспечивающее автоматическое иерархическое сохранение данных, при этом система выступает как Full Proxy, который перенаправляет пользователей к их данным. |
А компания F5 Networks в своем решении ARX выбрала другой путь для автоматического иерархического хранения: эта система выступает в качестве Full Proxy, который перенаправляет пользователей к требуемым данным (см. Рисунок 5). Физическое место хранения данных сохраняется, не требуется ни указателей места, ни агентов. Кроме того, File Service API позволяет осуществлять интеграцию в другие решения для администрирования данных.
ИЗМЕНЕНИЯ ИНФРАСТРУКТУРЫ В ЦОД
Первый стимул для разработки конвергентных решений, ориентированных на использование в локальных сетях и сетях хранения, исходил от модульных серверов (Blade Server), обращавшихся к централизованной системе хранения. Модульная стойка может вмещать до 200 серверов и более, каждому из которых требуются подключения Ethernet и SAN. Для того чтобы не подсоединять каждый модульный сервер с помощью отдельного кабеля, производители модульных систем интегрировали в каждое шасси коммутаторы Ethernet и SAN. Объединительная плата в шасси обеспечивала избыточное подключение модульных серверов к коммутаторам.
Современные модульные системы иногда выходят за рамки этого подхода. Например, компания Cisco в своей платформе Unified Computing System (UCS) использовала так называемые централизованные коммутаторы (Fabric Interconnect), с помощью которых трафик LAN и SAN модульных серверов может передаваться по одному централизованному соединению. Подключение 10 Gigabit Ethernet поддерживает функцию Fibre Channel over Ethernet (FCoE) и с ее помощью одновременно передает протоколы LAN и SAN. Конвергентные решения для модульных серверов разработали Fujitsu, HP и IBM.
Совсем скоро можно ожидать новых важных изменений в инфраструктуре ЦОД: с появлением 10 Gigabit Ethernet производительность сетей хранения на базе iSCSI и NAS вплотную приближается к показателям, свойственным для традиционного протокола Fibre Channel. Организация SNIA недавно ратифицировала стандарт FC на 16 Гбит/с, и на очереди, согласно плану развития, стандарт FC с поддержкой 32 Гбит/с, но в сегменте Ethernet уже появились первые коммутаторы с портами 40 Гбит/с и тестовые инсталляции с Ethernet на 100 Гбит/с. Так, компания Blade Network, совсем недавно перешедшая в собственность IBM, скоро выпустит коммутатор 10 GbE, который будет оснащен четырьмя портами для каскадирования (Uplink) с поддержкой 40 Гбит/с. Таким образом, в ближайшие годы использование FCoE в качестве моста будет расширяться.
Лидеры сетевого рынка Cisco, Juniper и Brocade уже нацелились на следующий большой прорыв. Все три производителя сейчас заняты разработкой архитектуры Ethernet Fabric, которая будет обеспечивать Ethernet без потерь кадров (Lossless). Для этого они применяют технологии Data Center Bridging и Converged Enhanced Ethernet в сочетании с протоколом Transparent Interconnection of Lots of Links (TRILL) — последний должен прийти на смену протоколу Spanning Tree. Эти новые архитектуры Ethernet смогут использовать для передачи трафика LAN и SAN одну и ту же коммутационную инфраструктуру.
Кристоф Ланге — независимый журналист и консультант по ИТ.