Когда три года назад Марти Гаррисон стал техническим директором в ChoicePoint, ситуация с хранением данных была плачевной. А это не пустяк для компании, управляющей 16 миллионами записей, такими как проверка анкетных данных и заявки на страхование, поглощающие два петабайта хранилища (2 тыс. Тбайт). И объем продолжал расти. Как многие ИТ-руководители, он столкнулся с огромным количеством данных в большом числе хранилищ. «Хранилища разрастались с каждым проектом и были неэффективны с точки зрения затрат. У нас было от восьми до десяти изолированных инфраструктур SAN (сетей хранения данных), они не сообщались друг с другом. Не было возможности объединить пространства отдельных хранилищ, мы не могли разбить на уровни наши данные», — вспоминает он.
В такой ситуации невозможно было осуществлять оптовые закупки, оптимизировать использование существующей емкости хранилища или реализовать единый подход в управлении, чтобы уменьшить потребность в персонале. Поэтому Гаррисон создал централизованное, единое хранилище, единую архитектуру и стратегию. Он освободил от обязанностей управления хранением тамошних Unix-администраторов и нанял специалистов по хранению для глобального управления. Он объединил все сети хранения в одну, сократив затраты на управление ими и сделав возможным более эффективное использование данных. Он сократил число поставщиков, оставив по два на каждый тип технологии. Все это позволило упростить управление и, делая оптовые закупки, получать более существенные скидки. «А при покупке сотен Тбайт ежеквартально, — говорит Гаррисон, — это существенно снижает затраты».
Также он ввел многоуровневое хранение данных, используя более дешевые, медленные накопители для не очень востребованных данных. «Прежде мы не проводили эксплуатационных испытаний, определяющих требования к обслуживанию. Работники просто брали накопители (жесткие диски) первого уровня Hitachi и EMC для всего почти по двойной цене за Тбайт в сравнении с накопителями-дисками второго и третьего уровня», — вспоминает Гаррисон. В целом ему удалось снизить затраты на хранение на 40% на сами диски и на управленческий аппарат. При этом не понадобилось значительно увеличивать штат, несмотря на возрастающие потребности хранения.
Сейчас Гаррисон исследует новый способ контролировать затраты, включая виртуализацию хранения и единичное хранение. «Пришло время перейти к следующему этапу», — говорит он.
По мнению аналитиков, нужно перейти к упрощенной архитектуре хранилища, чтобы сократить общие затраты на владение таковым. «Даже когда затраты на новые средства хранения сокращаются ежегодно на 34%, затраты на возрастающие емкости и требования к уровню обслуживания могут превысить 60%, — говорит Стюарт Бьюкенен, директор по исследованиям из Gartner. — Предприятиям нужно повышать производственную дисциплину управления ИТ-активами при хранении».
Заложить прочный фундамент
Хорошая новость: у ИТ-руководителей сейчас больше выбор способов хранения, чем всего несколько лет назад. «Некоторые способы, бывшие новаторскими и неопробованными, например, многоуровневое хранение данных и связанный с ним архивный способ иерархического управления запоминающими устройствами, теперь проверены», — говорит Ник Симпсон, аналитик в сфере хранения из консалтинговой фирмы Burton Group. Это также касается и использования SAN.
«Одним из распространенных способов хранения стала замена резервного копирования данных на магнитную ленту резервированием на дисках (также называемое виртуальной ленточной библиотекой), — рассказывает Дэйв Диллехант, ИТ-директор из объединенной сети доставки FirstHealth в Каролине. — Емкости ленты было недостаточно для больничного хранилища — размером около 185 Тбайт в FirstHealth, — да и физически управлять лентами стало обременительно». Предостережение: дисковое резервирование опасно тем, что возникает искушение хранить данные в режиме реального времени (что может перегрузить сети с системой хранения, так как люди будут использовать данные ввиду их доступности). Поэтому Диллехант держит резервные копии на дисках отсоединенными от остальной сети.
«Если потребности вашего хранилища невелики, лента имеет смысл, поскольку затраты в этом случае гораздо ниже», — замечает Рич О’Нил, старший вице-президент по операциям на сайте отслеживания поощрений Upromise. Это как раз случай с его четырьмя Тбайтами данных. По словам Бьюкенена из Gartner, из всех существующих вариантов многоуровневое хранение в итоге приносит значительную выгоду. Это не только позволяет увеличить объем дешевого хранения, но и вынуждает вас осознать уровни сервиса всех ваших данных. И вы можете сократить затраты, удалив или — по меньшей мере — не делая резервного копирования ненужных данных. Можно переместить редко используемые данные в офф-лайн-хранилище для поддержания контроля над сетевым трафиком. И можно управлять спросом пользователей, продемонстрировав им затраты полного жизненного цикла данных по запрашиваемым программам. «Многоуровневое хранение позволяет установить итоговый размер затрат на хранилище», — говорит он.
«Храните 30% ваших данных в хранилище на накопителе первого уровня, а остальные — на накопителях более низкого уровня, — советует Симпсон из Burton Group, — хотя точное соотношение зависит от эффективности функционирования и степени востребованности ваших данных». Вот цель, к которой нужно стремиться.
ИТ-руководителю важно сделать так, чтобы предприятие брало на себя ответственность за запросы данных. «Определение потребности в данных не входит в обязанности специалистов хранилища — это дело менеджмента предприятия», — говорит Бьюкенен. Но ИТ-директору нужно заложить основу, эффективно управляя активами.
Удешевление сетей с системой хранения при помощи протокола iSCSI
Среди новейших технологий, способных снизить стоимость хранения, в последние годы особенно выделяется iSCSI (Internet Small Computer System Interface) — тип хранилища, соединяющего накопители друг с другом и с серверами, использующими несложный в управлении протокол, что позволяет организациям любого масштаба развернуть SAN. До iSCSI основной опцией SAN была оптоволоконная линия связи, но она подходит только крупным компаниям из-за своей сложности и высоких затрат в управлении, замечает Симпсон.
Простота и пригодность iSCSI для широкого диапазона организаций сделали его самой быстрорастущей межсистемной технологией хранилищ, по сведениям IDC. Прогнозируется, что 25% проданных внешних запоминающих устройств (хранилищ) в 2011 году будут на базе iSCSI.
Региональная бухгалтерская фирма Schenck Business Solutions отказалась от дискового массива EMC, подключенного по оптоволоконным линиям связи, три года назад из-за его сложности и поменяла его на SAN на основе EqualLogic iSCSI. «Мы повоевали с конфигурацией и повседневным использованием ресурса», — вспоминает Джим Тарала, ИТ-директор в Schenck Business Solutions.
С тех пор емкость хранилища компании возросла c 330 гигабайт до 20 Тбайт. Но он сумел взять под контроль общие затраты. «Примерно 120% того, что мы сделали, мы затратили на EMC (330 гигабайт), чтобы получить EqualLogic (20 Тбайт), а наши административные издержки составляют максимум 60—65% от прежнего объема», — говорит Тарала. Он рассчитывает в скором времени модернизировать хранилище до 30 Тбайт.
Подобный опыт был и у банка Associated Bank, обслуживающего несколько штатов на Среднем Западе. В 2005 году ему пришлось пересмотреть стратегию хранения, чтобы подготовиться к грядущему росту объема данных в виде изображений, таких как электронные изображения чеков и данные о клиентах, как только банк стал реализовывать программу, позволяющую клиентам сделать обращение в одном отделении, а закончить все в другом. Когда в 2005 году стартовала инициатива с хранением, у банка было 20 Тбайт данных; а теперь — 300 Тбайт.
«Банк создал свою сеть хранения, используя массивы iSCSI, так как желал получить сеть на базе IP с целью воспользоваться сетевыми навыками своего персонала», — вспоминает Престон Питерсон, заместитель вице-президента по проектированию инфраструктуры. До сих пор оптоволоконные линии были полезными как запасной вариант, а банк проследил, чтобы массивы его хранилища Compellent поддерживали и оптоволоконную линию, и iSCSI.
«Переход к iSCSI вызвал вопросы», — отмечает Кори Китовский, банковский вице-президент по ИТ. Например, инженеры из Microsoft и другие поставщики не были знакомы с iSCSI, поэтому исследовали неизвестный сервер и настройки SAN, когда выявляли неисправности или устанавливали свои собственные продукты. И несмотря на наличие знающего IP ИТ-штата, банку все еще приходилось переучивать администраторов хранения. «Мы прошли через великое преобразование системы», — говорит Китовский.
«Но в результате удалось добиться 30-процентной общей экономии по сравнению с тем, что ожидалось затратить при использовании традиционных сетей хранения данных», — говорит Питерсон.
«Даже в крупных компаниях больше нет необходимости рассчитывать исключительно на оптоволоконную линию связи», — говорит Гаррисон из ChoicePoint, который пользуется iSCSI или оптоволоконной линией в зависимости от требующейся доступности хранилища.
Готовность к следующей волне
Когда предприятие проводит такие структурные изменения, Симпсон и Бьюкенен советуют на будущее ИТ-руководителям приглядываться к двум новейшим технологиям: виртуализации сетевых средств хранения и единичному хранению. Виртуализация средств хранения данных уводит управление от дисковых массивов и реализует его как часть операционной среды SAN. Это позволяет ИТ работать со всеми дисками как с виртуальной совокупностью ресурсов.
Единичное хранение экономно, поскольку сохраняется только один экземпляр данных в вашей основной системе (например, серверах приложений), замещая указателями на источник все его копии, а связанная с этим технология дедупликации сохраняет только один экземпляр файла или блока данных во время резервного копирования или архивирования и заменяет указателями все обнаруженные позднейшие копии. Как отмечает Симпсон из Burton Group, долгое время доступное на серверах электронной почты единичное хранение становится доступным при резервном хранении и в архивных системах, и в основных системах хранения.
«Но ряд факторов ограничивает внедрение этих технологий», — отмечает Гари Фокс, руководитель государственного направления в консалтинговой компании Dimension Data.
Фокс заявляет, что виртуализация сетевых средств хранения сложна в управлении, хотя поставщики и характеризуют ее как технологию plug-and-play (автоматическая настройка конфигурации, без установки параметров пользователем).
«Что касается технологии единичного хранения, то такой способ вызывает опасения потери данных; большинство компаний испытывают его в пилотном режиме», — говорит Фокс. Хотя эти технологии поставляются в основном вновь созданными компаниями, Фокс ожидает, что ситуация изменится. «Мы наблюдаем большой интерес клиентов, — говорит он. — Все-таки они тоже предвидят безудержный рост объемов хранения».
Galen Gruman. Rethink the storage infrastructure. CIO Magazine. 08/01/2007
Краткий обзор поставщиков крупных хранилищ
Многие технологии, поддерживающие эффективное хранение, широко доступны, например, SAN, резервное копирование (также называемое виртуальной ленточной библиотекой, Virtual Tape Librariy) и многоуровневое хранение. «За ними можно обратиться к уже существующим поставщикам, если нет желания работать с начинающими, недавно созданными компаниями-поставщиками», — говорит Ник Симпсон, аналитик по системам хранения из Burton Group.
Поставщики оптоволокна (Fibre Channel) и продуктов iSCSI — это 3Par, Compellent, EMC, Hewlett-Packard, Hitachi Data Systems, IBM, Network Appliance (NetApp) and Sun Microsystems. LeftHand Networks и Symantec предлагают программное обеспечение для таких сетей, а Sanrad предлагает оборудование, объединяющее эти две технологии., Только iSCSI используют следующие поставщики SAN: EqualLogic, Isilon Systems и Pillar Data Systems.
В новой сфере виртуализации сетевых средств хранения основными поставщиками являются EMC, HP, Hitachi, IBM, LSI, NetApp and Sun. «NetApp и Hitachi возглавляют мой список, а IBM идет третьим», — говорит Симпсон. Поставщиками исключительно программного обеспечения являются DataCore Software, FalconStor Software, Incipient и Symantec.
Ведущие игроки в новой сфере одноэкэемплярного хранения и технологий дедупликации: Data Domain, Diligent Technologies, EMC, ExaGrid, FalconStor, NetApp, Quantum и Sepaton.