Объемы корпоративных данных ежегодно увеличиваются на 50–80%, что заставляет ИТ-департаменты искать решения, эффективно использующие ресурсы ЦОД и упрощающие администрирование. Повысить эффективность хранения данных можно путем построения многоуровневых систем.
Как показывает практика, доступ к подавляющему большинству данных осуществляется очень редко, если происходит вообще. Идея отделить востребованные данные и поместить их на более дорогие и быстрые носители, а все остальное хранить на дешевых и медленных легла в основу многоуровневого, иерархического хранения информации. Этой классической модели уже около 30 лет, и со временем подходы к ее построению постепенно менялись. Ключевой проблемой с этой точки зрения является процесс управления данными. Ранее он осуществлялся исключительно администраторами, а современные решения делают этот процесс полностью автоматизированным.
Комбинация технологий
«УралТрансБанк» завершил проект модернизации системы хранения данных. В его рамках в инфраструктуру СХД внедрен дисковый массив Hitachi HUS 130, произведена замена коммутаторов SAN на более производительные, а система оптимизирована с учетом возросших требований по производительности. Отличительной особенностью проекта стало одновременное применение технологии Hitachi Dynamic Tiering, ранее доступной только для массивов старшего уровня, и Hitachi Dynamic Provisioning. Проект реализован компанией «Инфосистемы Джет».
Технология Hitachi Dynamic Tiering позволяет оптимизировать использование дисковых ресурсов. Массив с помощью технологии HDT автоматически перемещает высоконагруженные страницы данных логических томов на «быстрые» SAS- и SSD-диски, и наоборот — наименее востребованные по количеству операций чтения и записи отправляются на емкие, но менее быстрые диски NL-SAS.
Эффективное хранение данных также гарантируют механизмы Hitachi Dynamic Provisioning, которые обеспечивают создание виртуальных дисковых пулов и своевременное динамическое выделение пространства в них. Таким образом устраняется проблема дефицита емкости на одних серверах при ее избытке на других.
Как считает начальник управления ИТ «УралТрансБанка» Артур Новрузов, реализованная компанией комбинация двух программных решений — Dynamic Tiering и Dynamic Provisioning — позволила создать уникальную среду для хранения данных, которая может гибко масштабироваться и дополняться в соответствии с растущими потребностями банка. «Благодаря решению не только в полтора раза сократилось время резервного копирования, но и возросла производительность банковских систем, и все это при общем уменьшении расходов на хранение данных», — отметил он.
В зависимости от частоты использования, данные обычно распределяют между тремя уровнями хранения. Первый уровень — «уровень производительности» (Performance Tier) — составляют наиболее востребованные данные, его формируют первичные источники информации, расположенные на высокопроизводительных и высокодоступных решениях. Второй уровень — «уровень емкости» (Capacity Tier) — реализуется с использованием более дешевых систем большой емкости. Третий уровень — «уровень архивирования» (Archive Tier) — предназначается для долгосрочного хранения невостребованных данных и строится на базе ленточных библиотек и оптических дисков. За автоматическую миграцию данных между уровнями отвечает специализированное ПО.
«В настоящее время прослеживается тенденция переноса технологий иерархического хранения, ранее доступных в самых дорогих решениях, в сегмент СХД среднего класса», — комментирует Александр Журавлев, руководитель отдела СХД департамента корпоративных систем компании «Астерос». Сейчас практически у всех ведущих производителей систем хранения существует подобный функционал, а значит, данная технология становится доступной не только крупным компаниям, но и представителям SMB.
Технологически многоуровневое хранение реализовано у всех вендоров по-разному, и в силу этого у каждого решения есть свои уникальные особенности. В одних решениях (например, HP, HDS и EMC) применяется классическая трехуровневая модель хранения с использованием твердотельных накопителей (SSD), а также дисков с разной скоростью, емкостью и ценой (SAS и SATA). В других (например, у IBM) — двухуровневая модель SSD-SAS или SAS-SATA, и при этом она считается оптимальной и целесообразной. В зависимости от выбранного решения, перемещаться могут и отдельные тома и блоки данных, а само перемещение становится все более интеллектуальным и автоматизированным. В решениях NetApp вместо многоуровневого хранения в его традиционном понимании используются флэш-накопители в технологии интеллектуального кэширования операций ввода-вывода Flash Cache, а у EMC накопители SSD используются как в многоуровневом хранении FAST VP, так и для оптимизации работы с кэш-памятью FAST Cache.
Несмотря на привлекательность концепции многоуровневого хранения, не все так однозначно. Данный функционал применим не ко всем типам нагрузки, а накопители SSD остаются по-прежнему ощутимо дорогими.
«На практике, как правило, нет ни достаточных вводных данных, ни времени, ни средств на дополнительные исследования инфраструктуры заказчика, — констатирует Журавлев. — Зачастую заказчику проще, дешевле и надежнее купить современный быстрый массив с одним или двумя типами дисков SAS и SATA.
Администраторы стали на четверть свободнее
Ижевский электромеханический завод «Купол», входящий в концерн «Алмаз-Антей», в качестве систем хранения данных выбрал решение Dell Compellent. Важной особенностью системы является технология Automatic Tiered Storage, позволяющая автоматически классифицировать информацию по значимости. Исходя из частоты обращения системы к различным областям дисков, она может распределять данные по уровням хранения массивов. Кроме того, технология Fast Track размещает на дорожках, обладающих максимальным быстродействием (наиболее удаленных от центра диска) часто требуемую информацию.
Начиная этот проект, руководство завода ставило перед собой несколько задач: увеличить скорость обработки данных, ускорить работу имеющихся приложений, сократить операционные расходы.
«Сначала мы планировали провести апгрейд существующих систем. Но после расчетов выяснилось, что стоимость модернизации равняется стоимости нового продукта, поэтому было решено приобрести новые системы хранения», — говорит Алексей Стерхов, начальник отдела сетевых технологий завода «Купол». В результате платформа хранения данных завода «Купол» была полностью построена на решениях Dell Compellent.
После внедрения новой СХД емкость хранения ЦОД увеличилась на 40%. Решения Compellent помогли высвободить 25% рабочего времени ИТ-специалистов, так как перемещение, хранение данных и управление ими выполняются автоматически. Кроме того, затраты на обслуживание ИТ-инфраструктуры сократились на 10%, а скорость работы приложений возросла на 20%.
Взлет к 2015 году
Согласно результатам исследования TechTarget, 53% зарубежных компаний уже применяют инфраструктуру многоуровневого хранения, причем 60% пользователей используют в ней флэш-память или SSD. Из традиционных накопителей HDD наиболее популярны диски SAS. По всей видимости, с внедрением данных технологий российские заказчики отстают от западных компаний.
«Иерархическое хранение данных — это лишь вершина айсберга управления жизненным циклом документа в частности и информации в целом. Проявляется это в государственном и коммерческом секторе по-разному», — говорит Денис Андриков, заместитель технического директора по работе с заказчиками компании «Открытые Технологии».
Из-за низкой культуры работы с информацией в коммерческих структурах мало внимания уделяется управлению документами. В госсекторе другая крайность — сильная регламентированность документооборота и недостаток нормативной базы для полноценного перехода с бумажных носителей на электронные, что приводит к дублированию данных. Этот факт только запутывает и без того сложные процессы движения и хранения документов.
Поэтому тема иерархического хранения — лишь технологический аспект, автоматизирующий часть бизнес-процесса организации, и понятно, почему при всей очевидности преимуществ этот способ не так часто используется.
В коммерческом сегменте зачастую технологию даже не замечают, поскольку относятся к управлению информацией как к ненужной бюрократии, увеличивающей накладные расходы. А в госсекторе необходимы титанические усилия, чтобы переубедить номенклатуру, работающую по принципу «зачем что-то менять, если и так все работает».
«На мой взгляд, ситуация будет исправляться, хотя пока похвастаться России нечем. Резкий взлет нас ожидает к 2015 году», — считает Андриков. К этому времени наберут силу процессы информатизации органов власти и развития инфраструктуры по предоставлению госуслуг в электронном виде. Преимущества Tiered Storage в части снижения капитальных затрат на хранилища будут как нельзя кстати.
Самый популярный подход к построению иерархии хранения — это индекс востребованности данных. Худо-бедно на местах в региональных отделах информатизации органов государственной власти вопросы иерархизации решаются. Жесточайшая экономия на ИТ-бюджетах заставила искать пути снижения затрат на закупку новых дисковых массивов. Пожалуй, в госсекторе это единственный движитель технологии.
Намного лучше дело обстоит в банках, но здесь в большей степени заслуга отраслевой методологии работы с информацией и толковых рекомендаций ЦБ РФ. Что касается малого и отчасти среднего бизнеса, то в условиях нестабильной экономической ситуации предпочтение отдается приобретению необходимой дисковой емкости, а не внедрению инноваций.
В итоге на сегодня с технологической точки зрения все прозрачно, вендоры готовы к внедрениям, понимание у заказчика необходимости и потребности есть. Осталось ждать последствий естественного роста количества информации в госсекторе, адаптации технологии для отечественных реалий и массового перехода решений в коммерческий сегмент. Возможно даже появление облачной услуги по управлению хранением данных, в которой будет объединена концепция удаленного хранения «ненужных» и «старых» данных в публичном облаке с оперативным доступом к частному облаку.