Первичной системой хранения данных, вероятно, следует считать «жесткий» диск вычислительной машины — пример так называемого «сырого» пространства хранения. По мере развития таких систем в них начали использовать технологии, существенно повысившие функциональность решений для хранения данных. В конце концов, цена «сырого» пространства стала составлять, по некоторым оценкам, меньше 10% стоимости всего решения среднего и высокого уровня функциональности.
Сегодня ценность системы хранения для потребителя заключается в таких ее возможностях, как снижение затрат на управление, обеспечение гарантированной доступности данных (например, с помощью усовершенствованных функций резервного копирования, репликации данных). Одним словом, востребован, в первую очередь, интеллект системы. В связи с этим покупатель обращает больше внимания на совокупную стоимость владения системой, чем на цену ее продажи.
Революция RAID
Концепция создания внешнего дискового массива с возможностью обращения к нему через стандартизованный интерфейс была реализована еще в мэйнфреймах на начальной стадии их развития. В своем решении System/360 в 1964 году IBM впервые предложила внешнее устройство хранения, управляемое не процессором вычислительной машины, а отдельным контроллером, который транслировал команды ввода/вывода центрального процессора в управляющие инструкции. Так была реализована возможность управления этим устройством асинхронно с работой центрального процессора. Контроллер поддерживал буферизацию, позволявшую параллельно выполнять некоторые операции центрального процессора и устройства хранения. Со временем контроллеры устройств внешней памяти (как их тогда называли) стали обеспечивать и несколько путей доступа к устройству хранения, и кэширование, и кластеризацию.
С возникновением в 80–90-е годы прошлого столетия распределенной архитектуры ЦОДов, построенной по принципу «одно приложение — один сервер», хранение начало осуществляться на встроенном в сервер жестком диске (или нескольких дисках). Развитие в «открытых» операционных системах идея внешнего хранения данных получила в начале 90-х годов — с появлением технологии RAID (Redundant Array of Independent Disks), хотя первые массивы с применением такой технологии были встроены в сам сервер.
Изначально предлагались несколько вариаций дисковой организации RAID, но лишь RAID 0, 1, 5 и их комбинации (10, 50 и пр.) получили широкое коммерческое распространение. Именно в это время появились первые системы хранения Symmetrix производства EMC. Они завоевали большую популярность, как и дисковые подсистемы Hitachi Data Systems (ранее — одного из наиболее успешных производителей мэйнфреймов), IBM (единственного оставшегося сейчас производителя мэйнфреймов), MTI и более мелких компаний.
Все они, как правило, предлагали дисковую организацию RAID 0, 1 и 5 в разных вариациях и под различными названиями, в зависимости от аппаратной реализации. В соответствии с определенным статусом паритетности поддерживался тот или иной уровень сохранности данных и работоспособности системы в условиях отказа одного или нескольких дисков. Параллельность считывания обеспечивала более высокую производительность при предоставлении данных серверам, соединенным с системой хранения. В самих системах хранения появились возможности внутреннего блочного копирования данных для операций резервного копирования (зеркалирования) и сохранения последней известной рабочей версии (на случай непредвиденного нарушения целостности данных в рабочем томе).
Катастрофоустойчивость, ставшая одним из основных требований к ИТ-инфрастуктуре, привела к появлению возможности блочного копирования через несколько систем, подчас достаточно далеко разнесенных. Идеей, объединявшей в то время все системы хранения данных, была консолидация ресурсов хранения.
Объединяющая идея
Житейской мудрости «Не складывай все яйца в одну корзину» была противопоставлена «самоуверенность» высоких технологий. Мол, если эта корзина будет современной и надежной, яйца в ней останутся целыми, а ресурсов на обслуживание и места для хранения потребуется гораздо меньше. Если к тому же «корзина» научится делать такие полезные вещи, о которых ее хозяин раньше и не догадывался, выбор в пользу единого хранилища данных станет очевидным. Таким образом, системы хранения начали обретать собственный интеллект и предоставлять пользователю дополнительный функционал, имевший для него существенную ценность.
Вскоре большинство производителей систем хранения предлагали продукты с похожими функциями. Различия состояли в легкости интеграции новых функций в производственные системы, возможности их модификации в «горячем» режиме и в наборах услуг (например, интеграции или технической поддержки). Порой сервисные отделы некоторых производителей предпочитали использовать в проектах системы хранения, выпускаемые конкурентами, так как с ними было легче работать, чем с собственными продуктами. Большое значение получила открытость систем при работе в разных серверных средах, с различными операционными системами и даже приложениями.
Стандартизация начала играть заметную роль с появлением протокола Fibre Channel (FC), который был ни чем иным, как развитием известного SCSI (Small Computer Systems Interface) — протокола надежного и с хорошим потенциалом. Правда, SCSI имеет известные ограничения дальности передачи данных и количества подключаемых устройств, а также неудобный физический интерфейс (это протокол параллельной передачи). FC обеспечил возможность коммутации потока данных между системами хранения и подключаемыми к ним серверами.
Коммутация для хранения
Изначально на рынке сетевого оборудования для систем хранения сфокусировалось множество компаний разного масштаба, наиболее известные из которых — Brocade, McDATA, Gadzoox Networks, Vixel, CNT и InRange. Со временем слабые марки канули в Лету, и остались лишь те немногие производители, чьим продуктам удалось завоевать доверие строителей центров обработки данных. У них были разные истории становления, и они отстаивали разные взгляды на построение сетей хранения. К середине 2003 года в списке серьезных игроков остались Brocade, McDATA, CNT и Cisco Systems — новичок в области сетей хранения, но признанный лидер в производстве сетевого оборудования.
McDATA начала с коммутаторов класса «Директор» — полностью зарезервированных устройств хранения с расширенными возможностями масштабирования, обеспечиваемыми объемным шасси, в котором размещается большое количество линейных карт. Этот продукт достоин применения в солидных центрах обработки данных. Однако в мире — ограниченное число крупных корпоративных сред, а растущие компании не начинают строительство ЦОДов с масштабных сетей хранения. На первых этапах развития им нужны небольшие коммутаторы.
Brocade с самого начала предлагал небольшие коммутаторы с 8–16 портами. По мнению их создателей, из них при необходимости можно было организовать сеть, в которой уровень резервирования оказался бы не меньшим, чем у коммутатора класса «Директор». Эти небольшие устройства были просты в эксплуатации, недороги и достаточно надежны. Но когда небольшие сети хранения «вырастали» в крупные корпоративные центры обработки данных, компании сталкивались с необходимостью той же консолидации, которая привела их к построению среды внешнего хранения.
Так или иначе, McDATA и Brocade были вынуждены расширить спектр предложений. Однако идти в гору всегда тяжелее, чем спускаться, и задача Brocade оказалась гораздо сложнее задачи конкурента.
Фирма CNT (как и поглощенная ею к тому времени InRange) начинала с расширителей каналов для связи систем хранения (преимущественно мэйнфреймов IBM). Эти расширители работали на больших расстояниях по закрытым протоколам. Со временем CNT выпустила очень хороший коммутатор класса «Директор UMD». Но компании, очевидно, не хватило финансовых ресурсов для полномасштабной конкуренции с остальными игроками рынка, и со временем CNT была поглощена McDATA.
Cisco Systems пришла на рынок последней, но обладала большим опытом построения сетей передачи данных, солидной финансовой мощью и готовым «тяжелым» решением. В ее портфеле числился наиболее масштабируемый в тот момент коммутатор класса «Директор» с интегрированными сервисами. По прошествии некоторого времени Cisco выпустила целое семейство коммутаторов среднего и начального уровней, сопоставимых по функциональности с «верхней» линейкой ее коммутаторов хранения. Для коммерческого успеха на новом рынке корпорации требовалось лишь завоевать доверие потребителя.
Что дальше?
История развития сред хранения ЦОДов и вычислительных сред показывает: на каждом уровне обработки и передачи информации присутствует свой интеллект, который и определяет развитие этого уровня. Появился уровень хранения как отдельная среда, и тут же в ней появился свой интеллект — сервисы, свойственные только этой среде. Мы, конечно, можем сделать копию рабочего массива данных и при помощи сервера, но будет ли это эффективным использованием серверного ресурса, предназначенного для обработки приложения? Понятно, вопрос риторический. Или же появился уровень сети хранения, и тут же возникли сервисы, помогающие решать задачи на этом уровне (например, виртуализация среды хранения), и т.д.
Поместив физические носители в единый конструктив системы хранения и предложив внутри системы сервисы для удобства использования информации, мы виртуализовали эту среду. Мы освободили потребителя от необходимости обращаться к каждому физическому диску, дав ему возможность работы со средой хранения на логическом уровне. Виртуализация ресурса — естественный следующий шаг после консолидации. За ним, как правило, следует автоматизация работы с ресурсом. И мы уже видим этот процесс в средах хранения, когда пользователи пишут небольшие программы, позволяющие автоматически выполнять часто повторяющиеся операции.
Эволюция предполагает движение по спирали: тенденции, наблюдавшиеся на ранних стадиях развития среды, обычно повторяются на более поздних. Совершенствование интеллекта систем хранения, предоставление пользователю дополнительных сервисов на всех уровнях ЦОДа (в частности, в среде хранения с целью полной интеграции с приложениями), автоматизация управления ресурсами — вот перспективные тенденции в области хранения данных.
Вероятно, эти тенденции проявятся в готовых продуктах, но уже в другой ипостаси. Пользователь получит возможность работать не с конкретной системой, а со средой хранения, состоящей из нескольких систем. Об их конкретных характеристиках ему не будет необходимости даже знать, так же как сегодня он не задумывается о том, какие диски находятся в его системе хранения. В итоге пользователь сможет работать не с отдельным коммутатором и даже не с отдельной сетью (будь то сеть хранения, передачи данных или серверного кластера), а с ресурсом сети, объединяющим все эти инфраструктуры для централизованного управления ими.
Конечная цель построения ЦОДов будущего состоит в том, чтобы вывести из них самый дорогостоящий и ненадежный компонент — человека. Уже есть целые заводы, в которых весь цикл производства полностью автоматизирован. Когда-нибудь так будут организованы и процессы в центрах обработки данных.
Вениамин Иванов (beivanov@cisco.com) — региональный менеджер по развитию бизнеса Cisco в сфере центров обработки данных