В России пока еще не все организации серьезно относятся к резервному копированию данных, и часто вместо промышленных процедур для этого используются архаичные способы, устаревшие носители и форматы — и все это при отсутствии единой системы учета. Компании редко формулируют четкие требования к системе резервного копирования, не знают допустимого времени простоя и восстановления, а в результате оказывается, что восстановить данные либо невозможно, либо этот процесс занимает слишком много времени. Причем даже те, кто понимают важность сохранности данных и принимают для этого меры, часто допускают ошибки, способные привести к недоступности ИТ-сервисов, частичной или полной потере данных. Правильно построенная система включает в себя должным образом настроенное ПО резервного копирования и архивирования, а также различные аппаратные компоненты, в том числе дисковые библиотеки с дедупликацией данных, ленточные библиотеки и файловые библиотеки большой емкости.

Бывают случаи, когда из виду упускают важность архивирования или не понимают разницы между резервным копированием и архивированием. Между тем примерно 90% хранимых компаниями данных вообще не используются или используются очень редко, однако при этом они регулярно копируются, занимая рабочие системы хранения и серверы, — если вынести такие данные в архив, то все операции значительно ускорятся.

Самое важное — понимать необходимость и важность резервного копирования, поэтому неслучайно в ряде крупных компаний за резервное копирование и восстановление отвечает отдельное подразделение. Между тем проекты резервного копирования достаточно сложны, и, чтобы процесс копирования проходил в штатном режиме, а его результаты гарантировали восстановление, требуется учитывать множество факторов. Поскольку самостоятельно разработать и реализовать грамотную концепцию резервного копирования непросто, лучше обратиться к внешним консультантам — системным интеграторам или поставщикам. Интеграция разрозненных решений может вести к урезанию функций и сложностям эксплуатации, а изменения в системе резервного копирования или в инфраструктуре ИТ предприятия способны вызвать проблемы с резервированием. В отличие от стандартных серверных комплексов, в системе резервного копирования обычно собраны программные и аппаратные компоненты от разных производителей, которые достаточно трудно интегририровать и обновлять. Выход — использовать готовые интегрированные портфели решений для резервного копирования и архивирования.

В 2014 году в компании HP было создано подразделение, занимающееся резервным копированием и архивированием, — BURA (BackUp, Recovery and Archiving), предоставляющее решение из полностью совместимых программно-аппаратных компонентов. Решение BURA включает в себя HP Data Protector для резервного копирования, HP Consolidated Archive для архивирования и HP Connected Backup для резервирования данных рабочих станций и ноутбуков (см. рисунок). Все компоненты системы резервного копирования и архивирования тесно интегрированы и создаются одной командой разработчиков.

Хранение без потерь
HP Data Protector и StoreOnce

 

Система Data Protector обеспечивает автоматизированное резервное копирование тысяч серверов, поддерживает резервное копирование виртуальных и физических сред, интегрируясь с технологиями мгновенных снимков и клонов на дисковых массивах. Кроме того, интеграция с дедуплицированным хранением на дисковых библиотеках HP StoreOnce позволяет реализовать гибкие схемы защиты данных в территориально распределенных организациях.

В 2014 году в Data Protector был реализован новый, адаптивный подход — HP Adaptive Backup and Recovery, повышающий эффективность использования ИТ-ресурсов за счет выявления взаимосвязей между различными данными и приложениями. Специальные средства аналитики позволяют определить, как, где и когда должны быть защищены и доступны данные, соответствующим образом адаптируя и подстраивая политики резервного копирования. Кроме того, система может формировать рекомендации по снижению риска потери данных, что существенно упрощает сложный и затратный процесс разработки стратегии защиты и настройки процессов копирования данных.

Система Connected Backup выполняет копирование в фоновом режиме без прерывания работы пользователей. Данные с клиентских систем можно отправлять в корпоративный ЦОД или в облако, при этом по сети передаются только изменения.

Система Consolidated Archive позволяет переносить редко используемые данные в единый архив — пользователи могут оперативно восстанавливать объекты из архива по ссылкам, например в почтовом клиенте или на файловом сервере.

Аппаратные компоненты BURA включают в себя дисковые библиотеки с дедупликацией, ленточные библиотеки LTO и дисковые массивы NAS. Быстрый рост объемов данных и числа используемых компаниями приложений стимулирует спрос на дисковые системы резервного копирования с высокой пропускной способностью, однако такие системы достаточно дороги. Еще одна проблема — хранение снимков данных и резервных копий, объемы которых зачастую в десятки раз превосходят исходные данные. Решить эту проблему помогает дедупликация, которая примерно в 20 раз уменьшает требования к емкости. Технологии дедупликации на дисковых массивах реализованы в HP StoreOnce, который, по оценкам аналитиков IDC, позволяет на 20–40% сократить затраты на инфраструктуру, обеспечивая соответствующее увеличение производительности труда сотрудников отдела ИТ и пользователей.

До недавнего времени дедупликация осуществлялась на самой библиотеке, а после появления решения StoreOnce Catalyst эта процедура была реализована на источнике — сервере резервного копирования, что в полтора-два раза ускорило операцию резервного копирования. Таким образом, процесс резервирования в филиалах компаний существенно упростился, снизились требования к полосе пропускания сети при передаче резервных копий в ЦОД — теперь в филиале достаточно установить агенты StoreOnce Catalyst и DataProtector. Программный агент Catalyst, устанавливаемый на медиасервер и дисковые библиотеки, осуществляет дедупликацию на источнике, контролирует процессы копирования в организации и дает возможность перемещать дедуплицированные данные без регидрации (восстановления) между различными филиалами организации, в том числе по территориально расспределенной сети. Иначе говоря, данные все время находятся в дедуплицированном виде, что позволяет существенно экономить ресурсы и не тратить время на многократные операции дедупликации. HP Catalyst интегрируется с DataProtector, Symantec OST (NetBackup и Backup Exec), Oracle RMAN и MS SQL.

В конце 2014 года появилась функция прямого резервного копирования с массива, например 3PAR, на StoreOnce, что ускорило процесс резервирования, причем без какого-либо ПО резервного копирования. Мало того, теперь можно, не останавливая виртуальную машину, копировать ее снимки данных.

Благодаря дедупликации дисковые библиотеки оказываются эффективнее обычных дисковых массивов, однако еще дешевле и проще в администрировании виртуальные библиотеки (Virtual Storage Appliance, VSA), которые относятся к классу программно-конфигурируемых систем хранения (Software Defined Storage, SDS). Продукт StoreOnce VSA превращает сервер стандартной архитектуры в дисковую библиотеку с дедупликацией данных, что может быть привлекательным для заказчиков с ограниченным ИТ-бюджетом, позволяя им задействовать уже имеющиеся серверы. Провайдеры могут использовать StoreOnce VSA для развертывания облачных сервисов резервного копирования (Backup as a Service, BaaS).

Дисковые библиотеки HP StoreAll емкостью до 16 Пбайт предназначены для хранения архивных данных, к которым необходим быстрый доступ, а для других архивов используются библиотеки HP StoreEver с ленточными картриджами. Политики автоматического архивирования и резервного копирования задает администратор.

***

Для резервного копирования следует использовать отдельные дисковые массивы и специальные библиотеки, а поскольку данные иногда теряются из-за сбоев в системе хранения, то для повышения надежности и масштабируемости желательно применять многоконтроллерные массивы. В ходе резервного копирования рекомендуется создавать снимки данных, применяя как диски (для наиболее критичных данных), так и ленты для полных резервных копий или проведения тестового восстановления. Главное — при покупке новых серверов и систем хранения следует планировать и заранее учитывать в бюджете решения по резервированию. После любых изменений в инфраструктуре ИТ рекомендуется тестировать процедуры восстановления.

Алексей Поляков (Aleksey.Polyakov@hp.com) — менеджер департамента систем хранения данных, компания HP (Москва).