Все современные ЦОДы сталкиваются с проблемой постоянного увеличения объемов данных разной степени критичности, которые обязательно нужно надежно хранить. Это могут быть данные продуктивных систем конечных заказчиков ЦОДов, к которым предъявляются повышенные требования к доступности (как правило, более чем 99,9% доступности) или архивные данные, к которым требования доступности ниже, но которые следует долго хранить (например, архивы видеонаблюдения или резервные копии продуктивных систем). Также каждый тип данных имеет свои специфические требования к производительности дисковых подсистем.
В этих условиях на первый план выходят две следующие задачи:
1. Как правильно организовать хранение данных с учетом различных требований к их доступности и производительности?
2. Как при этом оптимизировать затраты в условиях постоянно растущих объемов данных?
Традиционным подходом является использование классических аппаратных систем хранения данных c вертикально масштабируемой архитектурой (scale-up) и сетью хранения данных на базе протокола Fibre Channel. При таком подходе в зависимости от типа задачи приходится использовать разные системы хранения данных различных производителей. Этот подход позволяет организовать хранение данных с учетом различных требований, но при этом имеет ряд существенных минусов:
• Высокая стоимость покупки и обслуживания аппаратных СХД (особенно после трех лет эксплуатации, когда нужно продлевать контракт на поддержку СХД по сильно завышенной стоимости либо покупать новую СХД).
• Большое количество разных СХД различных производителей повышает сложность администрирования (на профессиональном сленге: «зоопарк»).
• Серьезные ограничения при масштабировании систем (предел вертикального масштабирования СХД обычно только 8 контроллеров, и если он достигнут, нужно покупать новую СХД).
• Нет возможности задействовать оборудование сторонних производителей для оптимизации стоимости (так называемый vendor-lock).
• Высокая стоимость SAS-дисков (особенно SSD) и невозможность использования SATA- дисков в отказоустойчивых конфигурациях.
Данный подход позволяет решить задачу корректного хранения данных с учетом различных требований к доступности и производительности, но при этом стоимость такого подхода является слишком высокой, а отсутствие гибкости при масштабировании и управлении СХД не позволяет оперативно реагировать на постоянно возрастающие требования заказчиков ЦОДов.
На сегодняшний день существуют два подхода к решению данной проблемы (которые можно комбинировать), и оба подхода основаны на применении программно-определяемых систем хранения данных.
Подход №1. Использование программных СХД с архитектурой scale-up
Суть подхода — постепенно заменить аппаратные СХД программными с архитектурой scale-up.
На текущий момент программно-определяемые СХД по надежности и функциональности не уступают классическим аппаратным решениям. К примеру, СХД AERODISK ENGINE российской разработки поставляется как в аппаратном варианте, так и в программном. При этом программный вариант СХД AERODISK ENGINE с точки зрения надежности, производительности и функциональности ничуть не уступает аппаратному, но дает следующие преимущества:
- Возможность резко снизить затраты на покупку и эксплуатацию СХД, используя собственное x-86-совместимое оборудование и диски.
- Обычные x-86 серверы (которые применяются в качестве контроллеров программных СХД) и дисковые полки значительно дешевле (обычно в 2–3 раза) аналогичного оборудования, поставляемого в аппаратных СХД.
- Оригинальные Enterprise-диски от их производителей (HGST, Seagate, WD) также в 2–3 раза дешевле, чем аналогичные диски (по сути те же самые), поставляемые в рамках аппаратных СХД.
- По истечении 3 лет эксплуатации нет надобности продлевать гарантию на аппаратную СХД по завышенной стоимости:
• вместо продления гарантии на устаревшие диски лучше использовать новые современные диски, что в итоге получается дешевле и при этом объем новых дисков всегда больше;
• жизненный цикл контроллеров СХД (серверов x-86) — 5 лет, в течение этого срока стоимость их аппаратного обслуживания находится на умеренном уровне.
- Лицензирование программных СХД (во всяком случае AERODISK) выполняется по количеству контроллеров и по количеству дисков (объем дисков неважен), поэтому данные затраты можно нести по мере необходимости (с учетом фактического роста объема данных и нагрузки). Также, если есть потребность в снижении CAPEX-затрат на лицензии ПО AERODISK ENGINE, можно получать СХД как услугу.
- Стандартизация и снижение сложности управления инфраструктурой хранения данных осуществляются за счет использования единого программного решения.
В данный момент ПО AERODISK ENGINE может закрыть большинство потребностей, в частности:
• высокопроизводительное гибридное хранилище для продуктивных систем (виртуализация, СУБД, электронная почта) с использованием SSD-дисков для ускорения производительности;
• облачное файловое хранилище с использованием дисков большого объема;
• СХД для видеонаблюдения с большим постоянным потоком записи и с возможностью долговременного хранения;
• хранилище архивов и резервных копий с поддержкой компрессии и автоматической дедупликацией для экономии места на дисках.
Интерфейс управления программно-определяемой СХД AERODISK ENGINE |
Такой подход позволит в несколько раз снизить стоимость владения инфраструктурой СХД за счет снижения затрат на оборудование и повышения стандартизации инфраструктуры. При этом остаются актуальными следующие издержки архитектуры scale-up:
• ограничение при масштабировании (до 8 контроллеров на одну логическую систему);
• невозможность использования недорогих SATA-дисков для отказоустойчивых конфигураций;
• остается актуальной проблема большого количества различных элементов ИТ-инфраструктуры, которыми нужно управлять (то .есть. серверы, сеть хранения, СХД, системы виртуализации и т. п.).
Подход №2. Использование гиперконвергентных вычислительных комплексов с архитектурой scale-out
Использование гиперконвергентных систем является наиболее инновационным подходом к созданию ИТ-инфраструктур ЦОД-ов любого масштаба и сложности, который позволяет объединить scale-out СХД и систему виртуализации в одну легко масштабируемую систему с централизованным управлением.
В отличие от вертикального масштабирования (scale-up), принцип горизонтального масштабирования (scale-out) снимает ограничения по количеству контроллеров СХД и позволяет использовать недорогие SATA-диски в отказоустойчивых конфигурациях СХД. Для реализации данного подхода компания AERODISK разработала гиперконвергентный комплекс AERODISK vAIR, сочетающий в себе СХД с архитектурой scale-out и систему виртуализации. Этот комплекс будет доступен в конце 2017 года и позволит в полной мере устранить текущие экономические издержки умного хранения данных.
Продукт AERODISK vAIR, как и ENGINE, будет поставляться как в аппаратном варианте, так и в программном. Отказоустойчивость в данной системе, в отличие от классических СХД с архитектурой scale-up, будет организована на базе растянутых между контроллерами томов и файловых систем, что позволит использовать недорогие SATA-диски (в том числе и SSD), количество контроллеров в СХД не будет иметь логических ограничений.
На схеме ниже приведено наглядное сравнение двух подходов к созданию ИТ-инфраструктуры на примере небольшого кластера высокой доступности (HA-cluster).
Как видно из схемы, использование гиперконвергентных систем, объединяя в себе виртуализацию, серверы, СХД и сеть хранения в одном масштабируемом решении, радикально упрощает эксплуатацию и масштабирование ИТ-инфраструктуры.
Дополнительную гибкость системе придает возможность использования различных систем виртуализации. На текущий момент поддерживается встроенная виртуализация на базе KVM, а также популярные системы VMware vSphere и MS Hyper-V, что позволяет максимально гибко подходить к планированию инфраструктуры и при необходимости использовать существующие (уже купленные) лицензии на сторонние системы виртуализации.
Кроме того, использование данного подхода решает проблемы, связанные с высокой стоимостью и низкой степенью гибкости традиционных инфраструктур хранения данных.
Вывод
На сегодняшний день оптимальным вариантом развития систем хранения данных ЦОДов, с учетом эффективного подхода к затратам, несомненно является использование гиперконвергентных программно-определяемых СХД, так как они позволяют серьезно снизить затраты на инфраструктуру, более гибко и оперативно реагировать на новые требования и продлить жизненный цикл оборудования систем хранения данных.
Для инфраструктур, в которые уже вложены серьезные средства в сеть хранения данных на базе Fibre Channel или в которых есть задачи по дезагрегации отдельных хранилищ (дезагрегация — противоположность гиперконвергентности), разумным будет совмещать программные scale-up СХД с гиперконвергентными системами там, где это возможно.
Подробнее о системах хранения данных российской разработки: www.aerodisk.ru