Недостаточная функциональность, излишняя сложность и высокая стоимость инструментов резервного копирования создают проблемы для организаций, препятствуют защите наиболее важных серверов. Между тем виртуальная среда позволяет эффективно организовать процессы резервного копирования и восстановления.
Виртуальная среда стала важной частью ИТ-инфраструктуры. По мере внедрения виртуализации и роста популярности облачной модели развиваются и соответствующие средства резервного копирования. Новые возможности продуктов резервного копирования помогают надежнее и быстрее восстанавливать виртуальные машины, приложения и данные в случае отказа, найти необходимый баланс между допустимым временем восстановления информации (Recovery Time Objective, RTO), допустимой потерей информации (Recovery Point Objective, RPO) и стоимостью решения. Но какова реальная ситуация?
По данным прошлогоднего опроса «InformationWeek», у 70% компаний ежегодный рост объема корпоративных данных составляет 10-49%. Причем, по прогнозу IDC, к 2020 году 40% всех цифровых данных потребуется защищать теми или иными методами. Сейчас около половины таких данных никак не защищается. С 2012 по 2020 годы объем информации в корпоративных ЦОД вырастет в 14 раз, а количество северов (виртуальных и физических) – в 10 раз.
По мере роста объема данных и увеличения количества серверов эффективность инструментов резервного копирования и восстановления снижается. Это подтверждают около 70% организаций. Кроме того, в настоящее время количество виртуализованных серверов в организациях в среднем по миру составляет более 50% (в России – порядка 20%), и в течение следующих двух лет это значение превысит 63%. Однако, как показывают зарубежные опросы, большинство организаций до сих пор не выполняют резервного копирования всех своих виртуальных серверов.
ПРОБЛЕМЫ РЕЗЕРВНОГО КОПИРОВАНИЯ ВИРТУАЛЬНЫХ СРЕД
Трудности защиты виртуальных сред в основном связаны с растущими объемами данных предприятий, возросшими требованиями бизнеса к доступности производственных сервисов, высокой плотностью хранения информации. В отличие от физических серверов, ресурсы которых чаще всего используются не полностью, в случае виртуализации мы имеем более плотную среду с ограниченными ресурсами, подчеркивает Дмитрий Лицов, старший системный инженер направления систем резервного копирования и восстановления данных компании ЕМС в России и СНГ.
Важнейшей проблемой остается сложность процесса резервного копирования и восстановления виртуальной среды. Частично решить ее помогают интегрированные программно-аппаратные решения (см. врезку «Специализированные устройства резервного копирования»). В числе других проблем – трудности управления, конфигурирования, слишком большое количество защищаемых виртуальных серверов. И этим список далеко не исчерпывается.
Специализированные устройства резервного копирования
Недостаточная функциональность, излишняя сложность и высокая стоимость инструментов защиты данных создают проблемы для организаций, препятствуют эффективной защите наиболее важных серверов. Одна из тенденций рынка систем резервного копирования – растущая популярность интегрированных устройств, объединяющих дисковый массив и программное обеспечение (backup appliance). Долгое время в этой области доминировали дисковые библиотеки, обычно включающие в себя ПО дедупликации. Часто они продвигались как специализированные решения, но требовали отдельных серверов резервного копирования. Теперь привлекательной альтернативой традиционным дисковым виртуальным ленточным библиотекам (VTL) и сетевым дисковым массивам (NAS) становятся специальные устройства с ПО резервного копирования.
Многие специализированные устройства резервного копирования поставляются с программным обеспечением резервного копирования и дедупликации. Аппаратная часть платформы объединяет сервер резервного копирования и систему хранения резервных копий.
По оценкам IDC, пару лет назад мировой рынок таких продуктов составлял 2,8 млрд долларов, а к 2015 году его оборот может вырасти до 5,3 млрд долларов. С большим отрывом доминирует на нем EMC Data Domain, но ежегодно появляются все новые решения. Например, Symantec в 2011 году интегрировала ПО NetBackup и Backup Exec с северами хранения, уже через полгода завоевав 2,3% мирового рынка. Quantum в том же году представила устройство vmPro 4000 с резервированием виртуальных машин, дедупликацией и репликацией.
В числе конкурентных продуктов – Arkeia Backup Appliance, Dell DR4000 (с программным обеспечением Symantec Backup Exec, NetBackup или CommVault Simpana), StorServer Backup Appliance (с IBM Tivoli Storage Manager), Tandberg Data AccuVault и Revinetix Sentio, а также EMC Avamar Datastore с функциями дедупликации и резервирования приложений.
Сейчас доля EMC на рынке PBBA приближается к 59%, у Symantec и IBM она составляет чуть более 15% и 7% соответственно. В первом квартале текущего года объем мирового рынка специализированных устройств резервного копирования (Purpose-Built Backup Appliance, PBBA) вырос на 16,5% относительно того же периода прошлого года – до 679 млн долларов. Их общая емкость составила 361,3 Терабайта – на 45,1% больше, чем в 2012 году. Согласно долгосрочному прогнозу, рынок PBBA будет опережать по темпам роста рынка программных и аппаратных сред резервного копирования.
Такие устройства помогают заказчикам сделать типичные проблемы резервного копирования менее острыми. Растущая популярность устройств резервного копирования объясняется привлекательной ценой и удобством — простотой покупки, развертывания и использования. Управлять ими проще, чем отдельными продуктами — дисковыми системами, программами и серверами резервного копирования. Сначала такие решения пользовались популярностью в SMB, но затем стали интересовать и крупных заказчиков.
Аппаратное обеспечение данных систем оптимизировано для резервного копирования и интегрировано с программным обеспечением. Однако специализированные устройства резервного копирования подходят не всем. Считается, что их основное ограничение – в масштабируемости. Между тем, NetBackup, например, масштабируется до 32 Тбайт. Пул таких устройств позволяет получить емкость в 200 Тбайт.
Новые возможности продуктов резервного копирования помогают более надежно и быстро восстановить виртуальные машины, объекты приложений и данные, найти баланс между параметрами RTO, RPO и стоимостью решения.
Например, в начале октября корпорация Oracle анонсировала Oracle Database Backup Logging Recovery Appliance – оптимизированный программно-аппаратный комплекс, обеспечивающий почти нулевую вероятность потерь при защите важнейших бизнес-данных. В отличие от существующих решений, которые требуют периодического резервного копирования всего содержимого баз данных, новая система Oracle обрабатывает и сохраняет только изменившиеся данные, что значительно сокращает влияние операций резервного копирования на производительность серверов и сетей, а также сокращает затраты на хранение.
Новый комплекс Oracle Database Backup Logging Recovery Appliance обладает высокой масштабируемостью, позволяющей использовать одно устройство для управления резервным копированием тысяч баз данных в центре обработки данных или в регионе. Он рассматривается как ценное дополнение к корпоративному решению резервного копирования. Комплекс позволяет упростить процесс резервного копирования баз данных и существенно сократить его продолжительность.
Новый облачный сервис Oracle Database Backup Cloud Service предоставляет возможность выполнять резервное копирование баз данных Oracle, размещенных в корпоративных центрах обработки данных, в облачную среду Oracle Cloud, или проводить репликацию своего устройства Oracle Database Backup Logging Recovery Appliance в среду Oracle Cloud для дополнительной защиты.
Концепция резервного копирования с помощью передачи только небольших изменений, полная проверка резервного копирования и дедупликация – все это приводит к значительному упрощению использования и повышению целостности резервирования и эффективности хранения.
Среди трудностей, возникающих в процессе защиты данных в виртуальной среде, Иван Шумовский, руководитель направления инфраструктурных решений компании «Крок», выделяет скорость копирования и восстановления. С каждым годом требования ко времени восстановления ужесточаются, при этом объемы данных постоянно растут. Для оптимизации процесса копирования применяются различные решения, в том числе сжатие и дедупликация данных, технологии постоянно-инкрементного копирования и синтетические резервные копии, интеграция программных средств резервного копирования и функций аппаратных систем. Кроме того, необходимо выделять для систем резервного копирования адекватные вычислительные ресурсы и каналы передачи данных с достаточной пропускной способностью.
Одна из проблем виртуальных сред – увеличение количества виртуальных машин (ВМ), потребляющих дорогостоящие вычислительные ресурсы и ресурсы хранения. Некоторые системные администраторы забывают удалять ВМ по завершении жизненного цикла или оставляют их «на всякий случай». По данным исследований, 30-40% созданных в организациях виртуальных машин не используется. Чтобы освободить ценные ресурсы, имеет смысл выявлять и архивировать такие ВМ.
По данным отчета о защите виртуальных сред за 2013 год, подготовленного по заказу компании Veeam Software, далеко не все используют возможности грамотной организации процессов резервного копирования и восстановления в виртуальной среде: восстановление виртуальных серверов занимает в среднем около 5 часов, что сопоставимо с соответствующим показателем для физических серверов, составляющим 6 часов, причем с каждым годом ситуация усугубляется.
Восстановление файла или объекта приложения виртуального сервера занимает в среднем 3 часа, а для некоторых объектов приложений (например, отдельных сообщений электронной почты) оно может растянуться до 14 часов, что объясняется недостаточными техническими возможностями для выборочного восстановления объектов. Их не хватает их для проверки резервных копий: в среднем удается проверить немногим более 7%. Для 26% респондентов восстановление отдельных файлов и объектов приложений является крайне трудоемким процессом.
88% ИТ-директоров испытывают трудности из-за отсутствия технических возможностей для надлежащей защиты данных, 84% отмечают вопросы, связанные со сложностью в эксплуатации этих решений, и для 87% проблемой является высокая цена. 58% ИТ-директоров в ближайшие два года планируют перейти на другой сервис для резервного копирования виртуальной среды.
Согласно другому исследованию, выполненному ESG, около 30% компаний считают, что их показатели RTO и RPO нуждаются в улучшении. Это означает, что перед ними стоит задача внедрений более современных технологий и процедур защиты данных. По информации Veeam, 45% респондентов отмечают большие временные затраты на резервное копирование, а по мнению 38% проблема заключается в слишком продолжительном процессе восстановления.
Несмотря на возможность более эффективного и быстрого процесса защиты данных, которую предоставляет виртуализация, и преимуществ современных инструментов время восстановления увеличилось по сравнению с показателями предыдущих лет.
По мнению Виталия Савченко, руководителя группы системных инженеров Veeam Software в России и СНГ, это происходит по двум причинам. Во-первых, виртуальная инфраструктура постоянно расширяется. Во-вторых, организации не обновляют свои системы защиты данных до необходимого уровня. Например, большинство предприятий по-прежнему используют специальных программных агентов для резервного копирования и восстановления. «Такое решение подходит для физической среды, но не является необходимым и обоснованным для виртуальной инфраструктуры. До тех пор, пока организации будут смотреть на виртуализацию, ориентируясь исключительно на физическую среду, они не смогут использовать весь ее потенциал».
Как отмечает Иван Шумовский, технология виртуализации позволяет копировать виртуальную машину целиком, рассматривая ее как набор файлов. При этом никаких агентов в операционной системе виртуальных машин устанавливать не нужно. Основным недостатком при таком подходе является отсутствие тесной интеграции ПО резервного копирования с приложениями, функционирующими «внутри» виртуальной машины, – теряется возможность гранулярного восстановления отдельных объектов из резервной копии. Восстановление виртуальной машины целиком с последующим извлечением нужного объекта занимает слишком много времени и ресурсов. Однако, существуют технологии, которые позволяют восстанавливать отдельные файлы и другие объекты непосредственно из резервных копий виртуальных машин, не выполняя полного восстановления. Например, «Крок» предлагает своим заказчикам решение Veeam Backup & Replication.
Между тем, по мнению Ивана Шумовского, не всегда можно копировать информацию ВМ без помощи агентов, например, когда ВМ использует прямой доступ к дисковому тому в обход гипервизора. Кроме того, существуют специальные требования заказчика по быстрому гранулярному восстановлению данных – через агента оно выполняется гораздо быстрее. В таких случаях приходится использовать агентов. Посредством традиционного способа (с помощью агентов) можно решить любую задачу резервного копирования, но данный подход менее удобный и более затратный – необходимо устанавливать агентов и управлять ими в каждой ВМ, что вызывает больше сложностей.
По данным опроса Veeam, более 75% респондентов применяют технологии резервного копирования с установкой агентов внутри виртуальных серверов, однако около 80% из них испытывают трудности, связанные с их использованием. Среди наиболее распространенных проблем – управление агентами, в том числе их установка, обновление и разрешение конфликтов, неудачи при выполнении резервного копирования или восстановления (см. Рисунок 1). Отмечается также высокая стоимость технологических решений и снижение производительности за счет дополнительной нагрузки при использовании агентов.
Рисунок 1. Проблемы, связанные с решениями для резервного копирования на основе агентов. |
О высокой стоимости резервного копирования и восстановления виртуальных серверов в целом, особенно в сочетании с финансовыми потерями из-за простоев, говорят почти 90% ИТ-директоров. Половина опрошенных отмечает затраты на управление, дорогие модели лицензирования и использование большого объема ресурсов при выполнении резервного копирования или хранении резервных копий.
Судя по данным опросов, высокая стоимость используемых инструментов (ПО и оборудования), сложность в эксплуатации и слабая функциональность, большие совокупные затраты на использование сервиса, в том числе расходы на управление и обслуживание, являются основными причинами для замены текущего решения защиты данных.
Высокая стоимость средств резервного копирования и их сложность затрудняют внедрение адекватной стратегии защиты. Даже усовершенствованные модели инструментов, предназначенных для физической среды, не способны обеспечить надлежащую защиту виртуальных данных, уверены в компании Veeam, и в ближайшие два года существенная доля организаций будет использовать новые решения резервного копирования и восстановления, что поможет справиться с существующими проблемами.
В CommVault подчеркивают, что традиционные подходы к резервному копированию и восстановлению данных не отвечают современным и тем более будущим требованиям. Нужна новая стратегия. Аналитики Gartner считают, что организации нуждаются в простых, быстрых и экономичных методах защиты данных.
«Основной фактор, определяющий стратегию защиты данных предприятия, – это эффективность, – говорит Дмитрий Лицов. – Когда ИТ-директору с каждым годом становится все труднее получать прежний бюджет на закупку или модернизацию ленточных систем хранения, которые при этом еще и не гарантируют безопасность данных на предприятиях, простой расчет экономической эффективности может повлиять на принятие решения о смене стратегии и склонить руководство к выбору новых средств защиты с технологией дедупликации и развитым функционалом, позволяющим рациональнее использовать существующие ресурсы. Такую стратегию защиты данных гораздо легче обосновать с точки зрения финансовых затрат на несколько лет вперед».
По мнению Андрея Новикова, ведущего системного консультанта компании HDS, стратегия резервирования виртуальной инфраструктуры зависит от масштаба виртуальной среды, типов и количества системных приложений, которые размещаются внутри виртуальных машин, и важности обрабатываемых данных.
ПРОЩЕ, ЧЕМ КАЖЕТСЯ
В действительности виртуальная среда является более простой платформой для резервного копирования и восстановления, чем физическая: организации могут защитить более существенную часть инфраструктуры, чем это было возможно ранее, причем с меньшими ресурсами и, что существенно, по более низкой цене. Виртуализация упрощает процесс резервного копирования: виртуальный сервер – это один большой файл. Его копирование создает резервную копию виртуального сервера.
Как поясняет Владимир Ткачев, технический директор VMware в России и СНГ, в отличие от физического, с виртуальным сервером можно, по сути, выполнять те же операции, что с обычным файлом: копировать, дублировать, записать на флэш-накопитель, положить в карман, а потом запустить в ЦОД другого города. Но в этом есть и определенный недостаток – без должного контроля скопировать и запустить сервер может и злоумышленник.
Кроме того, большинство гипервизоров поддерживают «снимки данных», которые можно отправлять на альтернативный сервер, не оказывая существенного влияния на ресурсы и производительность хост-системы. Если сначала ПО резервного копирования имело ограниченные возможности взаимодействия с гипервизорами для создания резервных копий, то теперь разработчики гипервизоров предлагают для этой цели специальные API. Например, в VMware это vStorage API for Data Protection (VADP).
Резервное копирование виртуальной среды дает намного больше возможностей по сравнению с резервным копированием физической среды, уверен Илья Сотников, инженер Центра разработок ПК «Аквариус». «Одной из наиболее важных функций является резервное копирование выключенной виртуальной машины. Виртуальная инфраструктура имеет гибкую систему распределения вычислительных ресурсов, позволяя в определенный момент времени предоставить больше ресурсов для выполнения резервного копирования наиболее важной информации. Конечно, и к самой системе резервного копирования предъявляются серьезные требования по доступности и сохранности данных».
Резервное копирование – это, прежде всего, стратегия защиты и восстановлению информации. Поэтому не важно, в какой среде это происходит, главное – выполнять поставленные цели и задачи. Стратегия защиты данных должна учитывать все преимущества и недостатки, свойственные виртуальной среде. В области резервного копирования виртуализация предоставляет основной плюс ¬– возможность работать с инфраструктурой в целом через свои интерфейсы, а не с каждым сервером по отдельности.
«Это упрощает администрирование, делает более гибким процесс резервного копирования и внедрения ПО для резервного копирования, рассказывает Виталий Савченко. – Но данные преимущества не все учитывают, предлагая тот же подход, какой был физическом мире. Как результат – потеря гибкости и возможности ставить агрессивные метрики по копированию и восстановлению, а также невозможность в полной мере использовать технологии защиты данных, созданные специально для виртуальной среды».
В Veeam подчеркивают, что при правильном использовании технологии виртуализации демонстрируют более высокий уровень надежности, чем традиционные способы управления физической средой: грамотный выбор инструментов позволяет всего за несколько минут восстановить виртуальный сервер, его отдельные файлы или объекты приложений, что дает возможность быстро вернуться к работе после незначительных инцидентов и крупных аварий. Применение таких технологий в сочетании с механизмами тестирования восстановлению резервных копий улучшает показатели RPO и RTO, позволяет соблюдать соглашение об уровне обслуживания (SLA), принятое в конкретной организации.
В виртуальной среде легче реализовать восстановление информационных систем с нуля («на голое железо») – на платформу виртуализации восстанавливается комплект виртуальных машин, реализующих систему, и через короткое время она готова к работе, поясняет Иван Шумовский. Кроме того, копирование ВМ часто выполняется посредством выделенного прокси-сервера, исключающего повышенные нагрузки на рабочие серверы во время операции резервного копирования.
Виртуализация удобна и подчас оказывается выгодной с точки зрения лицензирования. Например, возможно приобрести лицензию на один сервер, на котором размещено 20-30 виртуальных серверов. В традиционной среде пришлось бы приобретать 20 лицензий на агентов резервного копирования для 20 серверов.
Такие средства как отслеживание блоков виртуальных дисков (*.vmdk) виртуальных машин, изменившихся с определенного момента времени (Changed Block Tracking, CBT), восстановление из облака и восстановление на том же диске (in-place recovery) потребовали изменений в архитектуре дисковых массивов. В настоящее время резервное копирование нередко осуществляется небольшими блоками в течение дня. CBT позволяет программе резервного копирования определить, какие фрагменты файла образа ВМ изменились со времени создания последней резервной копии. Это дает возможность чаще создавать резервную копию, поскольку передается минимальный объем данных. В результате уменьшаются потери данных.
Процесс восстановления в виртуальной среде также имеет свою специфику. Вместо восстановления всего образа ВМ большинство продуктов резервного копирования позволяют восстановить один файл или группу файлов ВМ. Некоторые вендоры используют механизм CBT для восстановления только измененных блоков. Например, в случае порчи БД это дает возможность восстановить части базы данных, измененные со времени последнего резервного копирования.
В продуктах резервного копирования, не использующих агентов, при гранулярном восстановлении данных приложений резервный образ ВМ нужно монтировать как отдельную виртуальную машину и копировать с нее данные. Некоторые разработчики таких продуктов создают вспомогательные приложения, обеспечивающие сканирование, поиск и извлечение гранулярных компонентов данных распространенных приложений (например, Microsoft Exchange, SQL Server или Oracle) без монтирования образа ВМ.
Отдельные продукты позволяют запускать ВМ непосредственно с устройства восстановления. При таком сценарии данные по сети не передаются, а ВМ возвращается в рабочее состояние за считанные минуты. Во многих организациях эта возможность используется в сочетании с почасовым копированием CBT для обеспечения непрерывности бизнес-процессов.
Восстановление CBT влечет за собой определенное время простоя, но позволяет избежать более длительного простоя, который потребуется при перемещении всей ВМ на рабочее устройство хранения. В идеале продукт резервного копирования должен предусматривать разные процедуры копирования и восстановления. Определенные требования предъявляются и к хранилищу резервных копий (см. врезку «Хранилище резервных копий: каким оно должно быть?»). Для долговременного хранения ВМ оптимальным вариантом считается магнитная лента.
Хранилище резервных копий: каким оно должно быть?
По словам Владимира Ткачева, поскольку все больше функционала реализовано в самом ПО, основное требование к хранилищу резервных копий – минимальная стоимость за гигабайт хранения. Одна из наиболее интересных функций СХД – возможность запуска виртуальных машин прямо из резервной копии. Это может значительно ускорить процесс восстановления.
«Требования к хранилищу для резервных копий достаточно тривиальны – емкость и обеспечение требуемой скорости восстановления данных, – считает Иван Шумовский. – Кроме того, важно иметь несколько уровней хранения. Например, первый уровень – первичная копия, которая хранится рядом, и ее можно быстро восстановить в случае сбоя системы. Второй уровень – вторичная копия, которая хранится в другом месте на случай катастрофы».
Немаловажным критерием при построении системы резервного копирования является доступная емкость, соглашается Илья Сотников. Ошибка в планировании хранилища может привести к серьезным последствиям. Крайне важно иметь хранилище, емкость которого намного больше предполагаемой емкости хранящихся резервных копий. Этот запас предполагается использовать на внештатное увеличение объема хранящихся данных. Другим критерием является скорость чтения/записи хранилища. Высокая скорость позволит оперативно произвести резервное копирование и восстановление большого объема данных, тем самым повысив уровень их доступности. Наконец, хранилище должно иметь хорошую отказоустойчивость на случай любой внештатной ситуации.
«Основное требование к хранилищу резервных копий – низкая стоимость, – подчеркивает Эмиль Манукян. – Чем мы готовы пожертвовать ради этой низкой стоимости? Определенно не надежностью. Данные не должны теряться, но если они будут доступны не сразу и не всегда, с этим зачастую можно мириться, хотя в некоторых случаях RTO может быть критичным. С учетом непредсказуемого роста данных особую важность приобретает также эластичность. Отсюда – популярность масштабируемых (scale-out) хранилищ. Кроме того, заманчивая характеристика – гибкость виртуального хранилища для продуктов резервного копирования. Виртуальные мгновенные снимки (snapshot) оказываются слишком дорогими в плане ресурсоемкости, так что хочется иметь альтернативные механизмы «замораживания» виртуальных дисков. Некоторые смотрят в сторону аппаратной поддержки, другие склоняются к тому, чтобы не использовать снимки вообще».
Хранилище резервных копий должно обеспечивать высокий уровень производительности для обеспечения требуемого времени копирования и восстановления. Многие средства резервного копирования могут с определенной периодичностью проверять резервные копии. Дисковые массивы в этом случае предпочтительнее ленточных библиотек.
Распространенной ошибкой системных инженеров является предположение о возможности использования в качестве хранилища резервных копий дешевого или устаревшего, списанного с выполнения основной задачи оборудования. Подобное оборудование не способно обеспечить требуемый уровень RTO, масштабируемость под растущий объем данных и, главное, гарантированную сохранность резервных копий.
Сергей Платонов среди основных требований к хранилищам резервных копий выделяет высокую производительность передачи данных (до нескольких терабайт и даже десятков терабайт в час), отсутствие деградации производительности в случае отказа компонентов (например, СХД на платформе RAIDIX гарантирует постоянную производительность независимо от выхода из строя до трех дисков (RAID 7.3) и перестроения массива, обеспечивая требуемые параметры RTO). Кроме того, СХД, предназначенное для хранения резервных копий, должны обеспечивать отказоустойчивость при выходе большого количества устройств. Массивы, основанные на технологиях зеркалирования, несмотря на высокую стоимость, допускают отказ только одного накопителя.
Для обнаружения и исправления скрытых повреждений данных система хранения может использовать собственные механизмы или технологию T10-PI. Так режим Silent Data Corruption Protection компании RAIDIX позволяет выполнять сканирование и корректировку ошибок на дисках SATA и NL-SAS. Поддержка технологий устранения избыточности данных, таких как дедупликация и сжатие данных, позволяет сэкономить до 85% емкости. Возможно сжатие на источнике данных и на СХД. Рекомендуется использовать средства устранения избыточности на источнике, т.к. это позволит существенно сэкономить на инфраструктуре передачи данных.
Хранилище резервных копий требует пристального внимания к своему состоянию, поэтому не лишним будет возможность детального мониторинга и оповещения о событиях. Программно-определяемые хранилища виртуализируют стандартные физические компоненты, превращая их в сервис хранения. Поддержка репликации данных на удаленную площадку дает возможность выполнять аварийное восстановление.
Основные требования, предъявляемые к хранилищу резервных копий – надежность хранения записанной информации, наличие зрелых систем сквозной проверки данных, гарантирующих их консистентность и обеспечивающих возможность восстановления, уверен Дмитрий Лицов. Еще одним важнейшим параметром является скорость копирования и восстановления данных, а также способы достижения такой скорости. Этот параметр позволяет ИТ-службам гарантировать определенный уровень SLA при восстановлении данных. Кроме этого, немаловажным являются показатели эффективности хранения информации, то есть оценка возможностей применяемых в хранилищах технологий в сдерживании роста физических объемов резервных копий.
Требования к хранилищу резервных копий целиком зависят от поставленных задач, заключает Виталий Савченко. Технически таким хранилищем может быть что угодно: ленты, медленные диски или облако провайдера. Но чем медленнее хранилище для резервных копий, и чем дальше эти копии лежат, тем дольше идет процесс восстановление данных. Поэтому универсальных требований нет, все определяется ценностью информации и сервисов.
По словам Андрея Новикова, средства хранения резервных копий прошли достаточно долгий эволюционный путь от медленных ленточных накопителей малой емкости до современных ленточных и дисковых хранилищ с высокой надежностью и производительностью. Виртуальные ленточные библиотеки сочетают в себе эффективность использования емкости дисковых массивов с надежностью и отлаженным механизмом управления ленточных накопителей. Эти современные платформы могут характеризоваться также возможностью унифицированного доступа к системе по блочным (FC/iSCSI) и файловым протоколам (CIFS/NFS), интегрированными средствами обеспечения катастрофоустойчивости за счет использования репликации, высокой степенью доступности и масштабируемости с помощью технологий кластеризации и, конечно, производительностью, которая достигается как за счет возможности наращивания емкостей хранения, так и за счет увеличения вычислительных мощностей узлов виртуальной библиотеки.
Резервная копия может храниться и в облаке, в удаленном ЦОД. Такой способ становится все более популярным. В этом случае данные обычно копируются локально, а затем реплицируются в облако (cloud backup). Резервирование в облаке не решает все проблемы локальной защиты и обеспечения высокой готовности, но защищает от аварий (DR).
Как подчеркивает Эмиль Манукян, главный архитектор Acronis, зрелые гипервизоры – такие как VMware и Hyper-V – предоставляют дополнительные механизмы для доступа к данным с хоста, что позволяет «отвязать» рабочие системы от инфраструктуры резервного копирования. «На мой взгляд, это одно из основных преимуществ виртуализации в плане резервного копирования. Таким образом, администрирование рабочих серверов и защита от сбоев становятся двумя разными задачами, их можно назначать разным лицам, что наглядно демонстрируют облачные сервисы: арендатор управляет своей гостевой системой, а провайдер отвечает за резервные копии и высокую доступность данных».
Между тем, Кирилл Терешенко, руководитель группы технических экспертов IBM PureSystems в России и СНГ, считает тезис о преимуществах виртуальных сред для резервного копирования весьма спорным. «Виртуальная среда с точки зрения резервного копирования может ничем не отличаться от стандартной среды, а может превратиться существенную проблему. Необходимо учитывать то, что количество ОС систем и приложений в виртуальной среде очень велико. Если использовать традиционные подходы для создания резервных копий, то не исключена ситуация, когда вся пропускная способность сети будет задействована процессом резервного копирования. Однако при корректно подобранном оборудовании и ПО появляется возможность использования для сознания резервных копий таких механизмов как Server-less и Network-less Backup, что существенно снижает нагрузку на всю инфраструктуру ИТ».
ЧТО ВЫБРАТЬ?
Какую технологию или продукт резервного копирования ВМ, какой подход лучше всего использовать в конкретных обстоятельствах? На что следует обращать внимание заказчикам в первую очередь? На этот вопрос нет однозначного ответа – все зависит от политик, процедур и требований бизнеса, размера компании и других факторов.
Безусловно, немаловажный фактор – известность компании и ее продукта на рынке резервного копирования. Также нужно обращать внимание на положительные отзывы клиентов о внедрении продукта, международные награды, публикации в рейтингах и на различных форумах, понимать фокус продукта, подчеркивает Виталий Савченко. Например, неправильно думать, что лучший продукт по копированию БД Oracle будет столь же эффективно работать и с виртуализацией.
В большинстве случаев, особенно при создании системы резервного копирования в большой компании, необходимо понять ее потребности. Заказчикам следует, в первую очередь, обращать внимание на возможности ПО резервного копирования, и на его соответствие корпоративным политикам и требованиям регулятора, считает Кирилл Терешенко.
«Чтобы выбрать лучшую стратегию резервного копирования, нужно задать вопрос: какой объем данных вы готовы потерять? Следует понимать, что ответ «никакой» подразумевает самое дорогое решение, а ответ «все» – решение нулевой стоимости. Ваш ответ, скорее всего, будет где-то посередине, – говорит Эмиль Манукян. – Чаще всего потеря данных за один день сопоставима по стоимости с реализацией решения по обеспечению их защиты. Это удачно совпадает с тем, что в ночные часы открывается окно на профилактические работы. Виртуализация со своим доступом к виртуальному диску извне гостевой системы оказывается очень кстати. Сделайте «мгновенный снимок», скопируйте куда-нибудь образ – и ваши данные в безопасности. Но это всего лишь среднестатистический сценарий: в зависимости от специфики бизнеса потеря даже одной транзакции может быть катастрофичной. Поэтому некоторые компании просто вынуждены обеспечивать более гранулированную защиту данных, а тут уж без агентов не обойтись – надо общаться с самим приложением посредством его API, обеспечивая постоянную защиту данных (Continuous Data Protection, CDP)».
«Если интерес представляет, в первую очередь, восстановление после сбоев, стоит обратить внимание на продукты, которые делают это качественно и быстро. Далее следует определиться с размером инфраструктуры. Чем больше инфраструктура, тем сложнее продукт, – продолжает Эмиль Манукян. – Если размер инфраструктуры позволяет (30 серверов и меньше), лучше выбирать продукты попроще, такие как Acronis vmProtect, Veeam Backup & Replication или Dell AppAssure. В случае крупной инфраструктуры с физическими серверами надо рассматривать более полные решения, такие как Acronis Backup & Recovery, а если сложность – не проблема, то и Symantec Backup Exec или даже CommVault Simpana. Если основной сценарий – не восстановление после сбоев, а гранулярная защита данных, то нужна полноценная поддержка требуемых приложений с установкой агента внутрь системы. Это решение имеет косвенное отношение к виртуализации, так что можно рассмотреть любой продукт резервного копирования, подходящий по цене, простоте и функциональности».
«Все зависит от ценности информации. В качестве оптимальной стратегии сохранности данных Veeam придерживается подхода «3-2-1». Т.е. нужно не меньше трех копий данных, на двух разных носителях, одна из копий – на удаленной площадке или в облаке. Но это общий подход, для отдельных сервисов он может быть изменен. Если же говорить о стратегии в целом, то она зависит от многих факторов. В первую очередь, от параметров RTO и RPO, поясняет Виталий Савченко.
Иван Шумовский считает, что современные решения защиты данных в виртуальной среде должны поддерживать несколько гипервизоров, а также различные варианты для хранения резервных копий – диски, облако, магнитную ленту. При современном подходе резервное копирование все чаще осуществляется только на диски, однако некоторые организации до сих пор используют ленту, поскольку это позволяет сохранить инвестиции, так как у компаний уже приобретены дорогостоящие ленточные библиотеки, и покупка новых дисков в такой ситуации менее выгодна. Также ленты удобнее перемещать и хранить между несколькими площадками.
По мнению Сергея Платонова, руководителя отдела исследований и разработок компании RAIDIX, современные средства резервного копирования должны соответствовать концепции программно-определяемого ЦОД, обеспечивать требуемые уровни защиты виртуальных машин в соответствии с политиками и заданные уровни обслуживания. В числе обязательных функций средств резервного копирования виртуальной среды – поддержка «безагентного» сервиса (управление агентами в сотнях ВМ требует значительных затрат и может привести к ошибке), технологии CBT и восстановления отдельных файлов или даже части данных в случае порчи файла, независимость от типа хранилища резервных копий (возможность интеграции с дисковыми, ленточными накопителями и сервисами облачного хранения), изоляция данных, не нуждающихся в резервном копировании.
Продукты, созданные для резервного копирования виртуальных сред, должны интегрироваться с гипервизорами и оркестраторами ЦОД. Политики резервного копирования – полностью соответствовать политикам обеспечения сервиса виртуальных машин и гарантировать требуемые уровни RTO/RPO.
Сегодня нередко можно встретить файлы, размер которых не позволяет сделать копию за заданное время. Для резервирования подобных файлов применяются снимки данных в сочетании с репликацией (см. врезку «Репликация и снимки данных»). Задачей становится обслуживание этих процессов, которые могут выполняться средствами дисковых массивов, ПО резервного копирования или гипервизора.
Репликация и снимки данных
Важная дополнительная функция современных решений защиты данных – репликация, обеспечивающая копирование информации по каналу связи в другой центр обработки данных, подчеркивает Иван Шумовский.
Поскольку в виртуальной среде приложения и данные находятся в аппаратно-независимых виртуальных машинах, упрощается задача обеспечения катастрофоустойчивости (DR), аварийного восстановления. Можно отслеживать изменения блоков файлов ВМ и реплицировать их на другую площадку.
Репликация является современным и надежным решением для обеспечения высокой доступности данных, в том числе в виртуальной среде, рассказывает Андрей Новиков. Современные механизмы репликации реализуются на программном уровне средствами гипервизора или на аппаратном уровне средствами дисковых массивов. Однако репликация и резервное копирование призваны решать различные задачи. С помощью репликации можно избежать простоев в результате сбоев каких-либо ключевых элементов в виртуальной инфраструктуре, вплоть до выхода из строя целого ЦОД, тогда как используемые комплексы резервного копирования надежно защищают от сбоев операционных систем, системных приложений, например, баз данных и почтовых систем, и от потери данных этих приложений. Поэтому предпочтительным вариантом является комплексная защита инфраструктуры, подразумевающая совместное использование технологий репликации и средств резервного копирования данных.
«Несомненно, репликация является хорошим инструментом, обеспечивающим сохранность данных, но простая репликация зачастую не отвечает политикам хранения информации в организации, – говорит Кирилл Терешенко. – В любом случае репликация не заменяет средств резервного копирования. Скорее можно говорить о некоем симбиозе этих механизмов».
«У репликации, как и у любой другой технологии, есть свои плюсы и минусы. К плюсам можно отнести высокую скорость доступа к данным при выходе из строя главного сервера. К минусам – человеческий или программный фактор. Ошибка в данных главного сервера будет синхронизирована на запасной сервер. В этом случае правильным решением будет дополнить резервное копирование репликацией», – считает Илья Сотников.
Репликация – важная технология, но при этом она не заменяет резервное копирование, а только дополняет его, подчеркивает Виталий Савченко. Это позволяет реализовать наиболее полноценную стратегию по защите данных в виртуальной среде. Виртуализация только упростила подход к репликации, сделав его более доступным, и позволяет получить решение аварийного восстановления виртуальной платформы целиком или отдельных сервисов в частности.
Мировой опыт и практики доказывают, что система резервного копирования должна быть совершенно самостоятельной и независимой от рабочих систем хранения данных, даже если рабочие системы хранения реплицируют данные резервных копий на несколько систем, поясняет Дмитрий Лицов. Существуют реальные примеры, когда даже при наличии двух систем хранения данных с настроенной репликацией, возможность для восстановления данных отсутствовала, так как обе системы оказывались недоступны из-за ошибок единого ПО репликации данных. Системы хранения данных EMC имеют развитый функционал репликации данных и управления созданием снимков данных, но эта возможность не позволяет заменить полноценную систему резервного копирования и восстановления. Используя такой подход, также невозможно защитить все сервисы и гарантировать целостность приложений.
Подход EMC заключается в построении полностью независимой системы резервного копирования с возможностью интеграции с рабочими, продуктивными системами хранения данных для организации более быстрого интеллектуального копирования с использованием технологий репликации дискового массива или протокола NDMP.
По мнению Андрея Новикова, стоит разделять защиту инфраструктуры с помощью механизмов кластеризации/репликации (как средствами гипервизоров, так и на уровне дисковых массивов) и защиту данных путем создания резервных копий. Эти технологии должны создавая комплексную среду защиты данных. Механизмы создания мгновенных копий, реализованные как на уровне гипервизоров, так и на уровне дисковых массивов, позволяют получать мгновенные снимки логических разделов, на которых располагаются данные виртуальных машин. Хорошим примером могут служить средства создания снимков в системах файлового доступа Hitachi NAS с удобной системой управления Virtual Infrastructure Integrator, которая глубоко интегрируется в среду гипервизора (например, VMware) и позволяет создавать мгновенные копии виртуальных машин, обеспечивая при этом целостность данных приложений внутри ВМ. Однако, следует помнить, что мгновенные копии являются идеальным вариантом кратковременной защиты виртуальной инфраструктуры, но не отменяют необходимости долговременного хранения резервных копий.
В любом случае репликация зачастую подразумевает наличие второй площадки, которая не у всех есть. Не менее важно и наличие хорошего канала связи между этими площадками. Эти факторы зачастую являются основными помехами к широкому распространению данной технологии.
Широкому распространению репликации мешает состояние каналов связи у конкретного заказчика, отмечает Иван Шумовский. Как правило, каналы связи имеют ограничения по полосе пропускания, из-за этой причины для восстановления данных требуется много времени. К тому же, каналы могут быть недостаточно надежными. Репликация не может заменить резервное копирование, так как в случае человеческой ошибки негативные изменения распространятся на резервную площадку. Следовательно, репликацию лучше использовать как дополнительное средство защиты. Существуют разные схемы реализации сочетания резервного копирования и репликации. Можно сделать резервную копию в локальном филиале, а затем скопировать в другой центр обработки данных так, чтобы она хранилась сразу в двух местах. Также можно реплицировать виртуальные машины в дополнительный ЦОД, которые будут запускаться при недоступности основного дата-центра.
Репликация в сочетании с решением для автоматизированного восстановления обеспечивает защиту приложений от катастроф. С увеличением зависимости бизнеса от ИТ расширяется и применение решений для катастрофоустойчивости. Когда крупные компании начинают считать, сколько стоит простой основных ИТ-сервисов, нередко внедряется репликация. Резервное копирование и катастрофоустойчивость – две неотъемлемые части стратегии обеспечения непрерывности бизнеса. «Мы в VMware понимаем важность этого процесса, поэтому предлагаем своим клиентам бесплатное решение vSphere Replication и решение для автоматизированного восстановления – vCenter Site Recovery Manager», – поясняет Владимир Ткачев.
Для создания резервной копии ВМ копируется ее образ или изменяющиеся с момента создания начальной копии блоки. VMware vSphere (версия Essentials Plus и выше) включает в себя средства vSphere Data Protection (VDP) с функциями CBT (Change Block Tracking). vSphere Data Protection (см. Рисунок а) развертывается как виртуальное устройство (Virtual Appliance, VA) и поддерживает резервирование до 100 ВМ (в версии vSphere Data Protection Advanced – до 400). vCenter Server может обслуживать до 10 VA.
Рисунок а. Компоненты vSphere Data Protection. |
Для аварийного восстановления изменяемые блоки можно реплицировать средствами гипервизора на удаленную площадку. VMware vSphere предусматривает такую возможность в версиях Standard, Enterprise и Enterprise Plus. Microsoft Hyper-V 2012 предлагает функции Replica для асинхронной репликации отдельных ВМ на другую хост-систему Hyper-V на удаленной площадке. Таким образом, виртуализация может сделать процесс аварийного восстановления менее сложным и дорогим, чем в случае физической инфраструктуры.
Гипервизоры способны также делать снимки состояния ВМ и восстанавливать виртуальные машины из этих снимков. Такие возможности имеются, например, в Microsoft Hyper-V и Citrix XenServer. Гипервизоры также позволяют создавать конфигурации высокой доступности (HA), когда ВМ отказавшей хост-системы перезапускается автоматически за время, требуемое для запуска операционной системы виртуальной машины. Примеры – vSphere High Availability и Hyper-V Failover Clustering. Наконец, отказоустойчивые конфигурации (Fault Tolerance), когда виртуальная память ВМ реплицируется на другую систему. В этом случае время простоя сводится к нулю.
ПО аварийного восстановления позволяет планировать, какие именно ВМ должны реплицироваться и в каком порядке они будут восстанавливаться, а также тестировать аварийное восстановление.
Кроме встроенных средств есть технологии независимых производителей. Например, ПО Veeam Backup and Replication, как и следует из названия, осуществляет резервное копирование и репликацию. Продукт поддерживает облачное хранение. В продуктах Ctera Networks и TwinStrata виртуальные машины сохраняются на виртуальных устройствах и реплицируются средствами Virtual SAN. Технология Virtual SAN, поддерживаемая также VMware, считается очень перспективной.
Андрей Новиков отмечает все более глубокую интеграцию программных компонентов и аппаратных средств, например, создание и управление мгновенными копиями, которые создаются средствами дисковых массивов напрямую через среду резервного копирования. Это позволяет организовать не только очень надежную схему резервирования, но и уменьшить нагрузку на рабочую инфраструктуру при создании резервных копий, например, создать для резервного копирования отдельный контур коммутации LAN или SAN.
Снижение стоимости таких процессов как репликация позволит предприятиям защищать гораздо больше своих жизненно важных объектов инфраструктуры от простоя серверов, что, в конечном счете, поможет сэкономить миллионы долларов, заключает Виталий Савченко.
При резервном копировании виртуальной среды можно использовать встроенные инструменты приложения или операционной системы, развертывать единое решение для резервного копирования физической и виртуальной среды (от стороннего поставщика) или применять специально разработанные средства.
Преимущество первого, наименее популярного варианта – отсутствие дополнительных затрат на лицензирование, но возможностей защиты данных у него меньше по сравнению с решениями, разработанными специально для виртуальной среды. Второй подход, применяемый, по данным опросов, более чем в половине компаний, позволяет не отказываться от привычных для организации процедур, но уровень производительности не всегда достаточен. То есть организации предпочитают использовать для защиты виртуальной среды традиционные инструменты. Третий способ (по опросам, его выбирает чуть более трети заказчиков) обычно позволяет реализовать потенциальные возможности виртуализации, обеспечить высокую производительность и функциональность.
«Встроенные инструменты резервного копирования бесплатны, производители устанавливают их по умолчанию. Однако, поскольку они не специализируются на резервном копировании, функциональность встроенных систем довольно низкая. Кроме того, они разрозненны, отсутствует контроль, централизованное видение того, что происходит при операциях с данными. Если средство резервного копирования неверно настроено на одном-двух серверах, то администратору будет это сложнее обнаружить и устранить, – рассказывает Иван Шумовский. – Системы, разработанные для резервного копирования виртуальной среды, больше подходят заказчикам, у которых инфраструктура преимущественно уже виртуализирована. При наличии физических серверов нужно иметь дополнительное решение для копирования в этой среде».
Оптимальный вариант для крупных инфраструктур – комплексное решение, которое позволяет обеспечить защиту и контроль как в виртуальной, так и в физической среде. «Крок» предпочитает применять именно комплексные решения, так как ИТ-инфраструктура у большинства заказчиков гетерогенная и достаточно сложная.
«Основное преимущество встроенных инструментов в том, что они бесплатны и стандартны, можно быть уверенным в поддержке производителя в случае проблем. При применении нестандартных средств производитель решения резервного копирования может заявить, что проблемы – в самой системе. На стыке двух сложных технологий всегда сложно разобраться в причине, и чаще всего страдает пользователь. Наиболее очевидный недостаток стандартных средств – их неполноценность, – считает Эмиль Манукян. – С созданием резервной копии ее жизненный цикл только начинается. Резервное копирование – процесс постоянный, а у постоянных процессов есть своя, присущая им, сложность. Как понять, что процесс идет по плану? Как долго хранить резервные копии? Как обеспечивать этапы хранения резервных копий (продвижение по разным хранилищам в зависимости от «срока жизни»)? Как удостовериться в актуальности старых резервных копий? Как хранить копии на разнородных носителях типа кассет, сетевых папок, внешних дисков и распределенных хранилищ? Как обеспечить дедупликацию резервных копий? На эти вопросы, отвечает зрелое решение резервного копирования (см. Рисунок 2), но не отвечают встроенные средства, всего лишь предоставляющие возможность скопировать данные приложения».
Рисунок 2. Полное решение обслуживает весь жизненный цикл резервной копии. |
Наиболее правильной стратегией является совмещение штатных средств резервного копирования, заложенных в приложениях, с резервным копированием при помощи компонентов виртуальной инфраструктуры. Зачастую агент системы виртуализации не всегда может корректно сохранить данные очень важных приложений таких как, например сервер баз данных SQL. Правильным решением в данной ситуации будет использование штатных механизмов сервера баз данных SQL для создания резервной копии.
Зачастую штатные механизмы резервного копирования в приложениях обладают небольшим или ограниченным функционалом, подтверждает Илья Сотников. Для устранения этих недостатков имеется большое количество сторонних систем резервного копирования, позволяющие расширить функциональные возможности резервного копирования. Большинство сторонних разработчиков систем резервного копирования предлагают специальные компоненты для работы с системами виртуализации.
«Штатные» базовые средства резервного копирования и восстановления имеют многие приложения или платформы виртуализации, но в большинстве своем они не могут быть интегрированы в единую систему резервного копирования и восстановления, с помощью которой можно единообразно защитить все приложения и ИТ-инфраструктуру предприятия, отмечает Дмитрий Лицов. «Рано или поздно предприятия, особенно крупные, сталкиваются с вопросом управляемости и контроля такой системы, поэтому базовые средства вполне приемлемы для защиты небольших ИТ-инфраструктур. Системы резервного копирования и восстановления (например, на базе EMC Avamar и Networker) чаще всего расширяют возможности базовых продуктов защиты и позволяют создать единую унифицированною систему защиты приложений всего предприятия».
По мнению Кирилла Терешенко, основным недостатком встроенных инструментов резервного копирования является отсутствие возможности задания гибких политик для создания архивов и резервных копий. Если необходимо гибко управлять количеством резервных копий, временем их жизни и типом резервирования, то использование встроенных инструментов становится невозможным. При этом необходимо учитывать, что, зачастую, все вышеуказанные параметры должны независимо применяться как к данным отдельных приложений, так и к данным определенных пользователей. Кроме того, большинство встроенных средств резервного копирования не разделяет такие операции как «архивирование» и «резервирование» (создание резервных копий). Между тем, с точки зрения политик хранения и использования, это абсолютно разные типы хранения информации.
Как отмечает ведущий системный консультант HDS Андрей Новиков, средства резервного копирования, встроенные в операционную систему, имеют существенный недостаток – ограничивают резервируемую среду рамками самой ОС, при этом отсутствуют средства централизованного управления процессами резервного копирования, системами и хранилищами резервных копий. С этой точки зрения создание и эксплуатация централизованной системы резервного копирования выглядит предпочтительным вариантом. Например, платформа архивирования и резервного копирования Hitachi Data Protection Suite позволяет защищать не только все распространенные виртуальные среды, но и все повсеместно используемые операционные системы и приложения.
Многие новые продукты резервного копирования поддерживают только копирование виртуальных, но не физических серверов. Однако ни в одном ЦОД серверы не виртуализированы на 100%. Поэтому нередко применяют два разных продукта – для защиты виртуальных и физических сред. Хотя целый ряд унаследованных решений предусматривают оба вида защиты, но не всегда такие продукты поспевают за новыми разработками в области резервного копирования ВМ. Требовательным заказчикам приходится выбирать между единым решением и «лучшими в своем классе» отдельными продуктами. В общем случае выбор зависит от того, какой объем критически важных данных хранится на физических системах, а также от потребности в создании катастрофоустойчивой конфигурации.
Как подчеркивает Андрей Новиков, современные решения защиты данных в виртуальных и в физических средах являются гибкими и масштабируемыми платформами и обладают богатым функционалом. В частности, решение Hitachi Data Protection Suite позволяет не только организовать резервное копирование виртуальных и физических сред и приложений, но и создавать активные архивы для хранения наименее востребованных данных, извлекая информацию из приложений (например, почтовых систем) и обычных файловых хранилищ.
Выбор того или иного решения или технологии в первую очередь зависит от спектра задач, которые будут решаться виртуальной инфраструктурой. В общем случае для защиты данных лучше использовать целый комплекс мер, включая организацию кластерных систем высокой доступности (эти технологии поддерживаются на данный момент всеми гипервизорами), и применение традиционных систем резервного копирования с защитой данных и приложений внутри ВМ. Если одной из ключевых задач является создание катастрофоустойчивого решения, то следует оценить возможность использования механизмов репликации данных между ЦОД. При выборе того или иного поставщика оборудования, программного обеспечения и услуг следует учитывать степень интеграции решений друг с другом и с целевой инфраструктурой, чтобы получить полностью функциональную среду.
«При выборе технологии резервного копирования заказчикам нужно обращать внимание на свою инфраструктуру и требования. Необходимо определить, какие информационные системы необходимо защищать, какие операционные системы, СУБД и гипервизоры используются, наличие физических серверов, – говорит Иван Шумовский. – Таким образом, решения всегда подбираются, исходя из технологического оснащения и требований заказчика».
При переходе от унаследованных решений резервного копирования лучшей стратегией является использование интегрированной платформы с поддержкой гетерогенных окружений (например, Acronis Backup & Recovery), считает Эмиль Манукян. Миграция в виртуальное окружение происходит не сразу. В инфраструктуре длительно время присутствуют как виртуальные, так и физические машины, и на этот период гетерогенное решение резервного копирования и будет идеальным проводником.
Для перехода от унаследованных систем резервного копирования к современным продуктам в ряде продуктов подчас достаточно обновить версию, отмечает Иван Шумовский. Все основные поставщики средств резервного копирования поддерживают виртуальные среды. Однако новая версия может быть от производителя, основной деятельностью которого не является резервное копирование, поэтому некоторые полезные функции могут отсутствовать. Если не устраивает функционал защиты виртуальной среды, то можно поменять производителя. С одной стороны, это достаточно затратно, но с другой, многие производители готовы предоставить дополнительные скидки за переход на их продукцию с конкурирующих решений. При переходе может возникнуть необходимость миграции данных из формата старой системы в формат новой, поэтому подобный вариант используется нечасто, так как это достаточно трудо- и ресурсоемкий процесс.
По мнению Дмитрия Лицова, в каждом конкретном случае оптимальный путь всегда свой, однако можно соблюдать определенную последовательность действий при переходе с унаследованных систем резервного копирования на современные. «Начать можно с унификации хранения резервных копий, применяя современные системы, например, такие как EMC Data Domain. Таким образом, без внесения серьезных изменений можно кардинально повысить скорость и надежность операций резервного копирования. Далее следует рассмотреть вариант перехода на современное и эффективное ПО резервного копирования, а также организовать полноценный мониторинг системы резервного копирования и восстановления».
Андрей Новиков напоминает, что переход на новое решение должен предусматривать сохранение инвестиций и уменьшение капитальных и эксплуатационных затрат на инфраструктуру, в том числе резервного копирования. При этом нужно учесть, что очень многие организации используют устаревшие системы только потому, что не видят возможных путей миграции с сохранением существующих резервных копий, опасаются сбоев в процессе развертывания новых систем и простоев рабочих систем в случае развертывания нового комплекса резервного копирования. Однако современные инструменты позволяют в достаточной степени минимизировать эти риски, например, решения на базе виртуальных ленточных библиотек Hitachi дают возможность интегрировать в контур резервного копирования новую систему и перенести резервные копии с устаревшего оборудования в реальном времени, не нарушая при этом расписания резервного копирования. Это решение позволяет, в том числе, консолидировать в рамках единой платформы ранее разрозненные мощности, например, на базе устаревших ленточных библиотек, обеспечив создание единого хранилища резервных данных с централизованным управлением.
В настоящее время большинством продуктов резервного копирования функции поддерживаются дедупликации данных. Они широко используются в корпоративной среде. Дедупликация позволяет значительно уменьшить объем резервных копий, однако в случае больших наборов данных может не решить проблему окна резервного копирования. Так, например, при работе с БД OLTP или OLAP данные быстро меняются, и создать резервную копию в отведенные временные рамки достаточно сложно. В общем случае дедупликация решает задачу более эффективного использования емкости хранения, а не уменьшения окна резервного копирования.
Как отмечает Андрей Новиков, повышение эффективности хранения резервных копий с помощью средств компрессии и дедупликации данных – одна из современных тенденций. «Широкий спектр как программных решений, например, Hitachi Data Protection Suite, так и аппаратных средств, например, виртуальные ленточные библиотеки (VTL) Hitachi с поддержкой дедупликации, позволяет эффективно оперировать емкостями хранилищ и хранить резервные копии».
При резервном копировании осуществляется программная дедупликация (см. Рисунок 3) на источнике, сервере резервного копирования или на целевой системе хранения. Например, в системах EMC Data Domain используется ПО дедупликации на источнике (DDBoost). В большинстве продуктов резервного копирования комбинируется дедупликация на источнике и на сервере резервного копирования.
Применение современных интеллектуальных методов резервного копирования и восстановления, таких как методы дедупликации на машине, подлежащей резервному копированию, позволяет копировать огромные объемы данных виртуальной инфраструктуры за короткий промежуток времени и при этом гарантировать возможность восстановления, поясняет Дмитрий Лицов.
Распространенной практикой становится резервное копирование в облаке (cloud backup), а ряд облачных провайдеров предлагает сервисы аварийного восстановления (Disaster Recovery as a Service, DRaaS) для виртуальных инфраструктур клиентов (см. Рисунок 4). В таком случае специальное приложение обычно передает в ЦОД провайдера изменяемые блоки ВМ, либо это делается средствами гипервизора. Портал провайдера DRaaS может предусматривать возможности восстановления файлов и «виртуальную лабораторию» для тестирования восстановления.
Рисунок 4. Вариант реализации DRaaS с использованием средств VMware Site Recovery Manager (SRM). |
Однако при этом критична полоса пропускания сети – от нее зависит время перемещения данных в облако и их восстановления. Поэтому важно, чтобы ПО или устройство резервного копирования поддерживали создание инкрементных копий на уровне блоков или файлов, отправляя в облако только изменения. С технологической точки зрения облачное резервное копирование сложности не представляет, но следует принимать во внимание риски – надежность и безопасность хранения данных у провайдера.
В CommVault считают, что современная платформа резервного копирования должна быть интегрирована со средой виртуализации, использовать аппаратные снимки данных, индексирование, дедупликацию, репликацию и функции поиска для эффективного восстановления данных с любого уровня хранения.
Как подчеркивают в CommVault, унаследованные методы с копированием данных непосредственно из рабочей среды создают чрезмерную нагрузку на ИТ-среду. С ростом объемов данных увеличивается окно резервного копирования, усложняются операции копирования и восстановления. Избыточные данные – это нагрузка на сеть и системы хранения. Отсутствие интеграции с генерирующими данные приложениями ограничивает возможности гранулярного восстановления.
В Veeam уверены, что попытки защитить виртуальную среду с помощью инструментов и технологий, предназначенных для физической среды, не позволяют в полной мере использовать потенциал виртуализации. Вместе с тем, новейшие инструменты защиты данных, предназначенные для управления, конфигурирования и планирования процессов, способны помочь в решении наиболее острых проблем.
Установки агентов внутри виртуальных машин требует их дальнейшего мониторинга и обновления. В Veeam считают, что это усложняет процесс защиты данных, и в виртуальной среде вполне можно обойтись без них. Это позволяет исключить необходимость в дополнительном управлении, а, значить, ускорить и упростить весь процесс. Однако: каждый метод имеет свои преимущества и недостатки. Кроме того, возможна комбинация подходов: использование агентов только для специализированных наборов данных (agentless+agent) или применение «облегченных» агентов (agent-assisted backup).
«Оптимальной стратегией резервного копирования виртуальных сред является использование механизмов защиты на уровне образов. Следовательно, удается задействовать современные методы копирования виртуальных машин, такие как VMware CBT, с помощью которых можно на порядок ускорить процесс копирования и восстановления, – рассказывает Дмитрий Лицов. – Однако такой подход не идеален, так как не всегда обеспечивает полную защиту некоторых приложений. Для приложений, защита которых не гарантирована методом копирования на уровне образов, таких как Microsoft SQL и Exchange, Oracle, мы рекомендуем использовать специальных агентов, установленных внутри гостевой ВМ. Решения резервного копирования и восстановления, построенные на продуктах EMC Avamar или Networker, в отличие от решений других производителей, поддерживают возможности копирования и быстрого восстановления с помощью CBT, а также имеют весь спектр агентов для защиты большинства современных приложений».
По словам Владимира Ткачева, оптимальная стратегия резервного копирования и восстановления ВМ зависит от требований к допустимой потере данных, приемлемому времени восстановления и специфики работы приложения. Например, БД процессинга банковских карт, очевидно, необходимо копировать специально предназначенными для нее средствами, поскольку нужно обеспечить консистентность и не допустить потерю данных. Если речь идет о файловом сервере, то можно обойтись и копированием на уровне ВМ, тем более, что современные средства резервного копирования во многих случаях обеспечивают консистентность данных и в этом случае. Лучший вариант – использовать комбинацию двух методов. Вначале восстановить ВМ целиком, а затем «накатить» специфичные данные приложения.
По мнению Ивана Шумовского, лучшая стратегия заключается в комбинированном подходе с уклоном в решения для виртуализации. Виртуализация удобна и выгодна, поэтому, где это возможно, лучше использовать копирование на уровне ВМ. Если полностью обеспечить резервное копирование только «виртуальными» методами не удается (а так бывает в большинстве крупных ИТ-инфраструктур), то данную задачу удобнее решать посредством комплексных систем резервного копированию. Например, CommVault Simpana, позволяет применять безагентный метод для виртуальной среды и с использованием агентов – для физической инфраструктуры и некоторых виртуальных машин. В целом, выбор той или иной стратегии зависит от требований заказчика и технических ограничений.
Иван Шумовский в числе факторов, определяющих стратегию защиты данных, называет рост объемов данных, требуемую скорость восстановления, наличие у заказчика распределенной архитектуры – филиальной сети. Также имеет определенное влияние набирающая обороты «мобилизация» бизнеса.
Ряд производителей традиционных решений резервного копирования успешно выступают в роли поставщиков средств защиты виртуальных сред, совершенствуют свои продукты в соответствии с новыми требованиями. В «магическом квадранте» Gartner («Magic Quadrant for Enterprise Disk-Based Backup/Recovery», июнь 2013 года) аналитики отнесли к лидерам рынка продуктов резервного копирования и восстановления на базе дисковых систем компании CommVault, Symantec, IBM и EMC, «провидцами» названы NetApp, Veeam и Actifio, а «претендентом» стала HP.
Главными преимуществами широко известных продуктов резервного копирования являются универсальность и «отточенный» функционал, считает Владимир Ткачев. Естественный недостаток решений, производимых крупными вендорами, – это медленная реакция на технологические изменения и запросы рынка. Однако, если используемое в настоящее время ПО не поддерживает технологии, упрощающие резервное копирование ВМ, в нем нет дедупликации, а интерфейс устарел, то необходимо постепенно его заменять. Важный фактор – дружественный к пользователю интерфейс, а для небольших компаний еще лучше интеграция с интерфейсом ПО виртуализации. Некоторые решения резервного копирования все еще поражают интерфейсами в стиле 90-х.
Специализированные решения часто являются более инновационными. Недостаток резервного копирования от производителя ОС или приложения – это «заточенность» под определенные задачи, такое ПО редко удается сделать универсальным. Однако подобные решения часто значительно дешевле универсальных. Выбор «золотой середины» зависит от задач. Для резервного копирования небольшой виртуализованной среды Владимир Ткачев рекомендует решение VMware Data Protection.
Платформа виртуализации, например VMware vSphere, предлагает несколько встроенных механизмов, позволяющих ускорить копирование и восстановление, уменьшить объем передаваемых по сети и содержащихся в системе хранения данных. Решение резервного копирования должно уметь использовать эти механизмы. Оно должно уметь работать не только на уровне виртуальных машин, но и располагать агентами для корпоративных приложений, поддерживающими, например, гранулярное восстановление и непрерывное резервирование (continuous backup). Поскольку в виртуальной среде особенно велик процент идентичных данных, то для экономии занимаемого на системе хранения места ПО резервного копирования или сама СХД должны поддерживать дедупликацию.
Одна из основных характеристик – насколько полноценно решение по защите данных интегрируется в виртуальную инфраструктуру и использует все возможности виртуализации. То есть современные решения должны быть разработаны на основе передовых технологий защиты данных специально для виртуальной среды и облачных структур, считает Виталий Савченко.
По мнению Дмитрия Лицова, продукты для защиты виртуальной инфраструктуры должны давать возможность решать актуальные проблемы предприятия – устранение конфликтов при обращении к ресурсам, сдерживание роста хранимых резервных копий, более эффективное аварийное восстановление. Также они должны представлять ценность для бизнеса в таких аспектах как снижение издержек на инфраструктуру резервного копирования и рисков, связанных с потерей бизнес информации. Наконец, необходима тесная интеграция с виртуальной инфраструктурой, например, поддержка VMware vStorage API для защиты данных и VMware vCenter Server. Собственно, более тесная интеграция и является очевидной тенденцией, которой придерживаются многие производители решений по защите данных. Например, с помощью специального модуля для клиента VSphere Avamar или Networker, становится возможным управлять процедурами резервного копирования и восстановлением прямо из консоли VSphere.
При выборе продукта резервного копирования следует, в первую очередь, обратить внимание на то, насколько тесно он интегрируется с виртуальной средой, соглашается Дмитрий Лицов. Эта возможность позволит существенно упростить задачи и предоставить администраторам простой и удобный интерфейс управления резервным копированием и восстановлением прямо из консоли виртуальной среды. Также стоит обратить внимание на предлагаемые возможности восстановления и оценить, насколько быстро ВМ может быть возвращена в рабочее состояние. Например, продукт EMC Avamar поддерживает возможность запуска ВМ прямо из резервной копии, обладает механизмом быстрого восстановления c помощью CBT, а также осуществляет восстановление ВМ различными способами, в том числе используя функцию гранулярного восстановления файлов.
НОВЫЕ СРЕДСТВА – НОВЫЕ ВОЗМОЖНОСТИ
В заключение расскажем о некоторых известных продуктах резервного копирования виртуальных сред и их новых версиях, выпущенных накануне нынешней осени.
ПО резервного копирования CommVault Simpana 10 обеспечивает масштабируемое резервное копирование физических и виртуальных сред. Simpana использует возможности приложений (application-aware) для более быстрого и гранулярного копирование/восстановление, а также функции аппаратных снимков данных СХД разных вендоров (IntelliSnap), что сокращает окно резервного копирования и освобождает ресурсы ИТ для рабочих процессов. CommVault Simpana реализует гранулярное восстановление файлов, электронных писем и документов, а также позволяет восстановить приложение целиком.
Восстанавливать ВМ из архива можно с помощью специальной вкладки в VMware vCenter. Для резервного копирования и восстановления ВМ в Simpana применяются программные агенты – Virtual Server Agent (VSA). VSA может управлять снимками данных дисковых массивов основных производителей.
Резервные копии можно хранить на разных уровнях СХД, обеспечивая надлежащую защиту данных, например, старые копии перемещать на недорогие носители. Встроенные функции дедупликации и репликации позволяют создавать дополнительные копии на удаленных площадках для аварийного восстановления (DR). Дедупликация сокращает объем данных до 90%, снижая нагрузку на сеть, и на 50% уменьшает время восстановления.
Для хранения дедуплицированных архивных и резервных копий Simpana предусматривает единый репозиторий ContentStore с функциями поиска. Он может находиться на дисковом массиве или даже в облаке. Для снижения расходов на резервное копирование и перемещение данных по уровням применяется автоматизация на основе заданных правил (настраиваемые политики). Для безопасности используется ролевой доступ к данным.
В августе компания CommVault представила новые средства архивирования. ПО Simpana 10 идентифицирует неактивные в течение какого-то времени виртуальные машины и автоматически удаляет их, а функция VM Archiving осуществляет интеллектуальное архивирование ВМ в среде VMware vSphere.
В соответствии с настраиваемыми политиками ВМ автоматически идентифицируются, останавливаются, перемещаются, копируются, архивируются или восстанавливаются. Миграцию ВМ можно осуществлять на магнитную ленту или в облако. Таким образом, один продукт теперь объединяет функции резервного копирования и архивирования ВМ. В правилах политик можно задавать различные параметры для автоматического управления виртуальными ресурсами: срок жизни ВМ, использование процессорной мощности, сетевых ресурсов и ресурсов хранения. После настройки конфигурации архивирование становится частью процесса резервного копирования.
Компания Acronis также выпустила в августе новинку – девятую версию vmProtect. Это ПО предназначено для защиты сред VMware в малых и средних организациях. Оно поддерживает Microsoft SQL Server, Microsoft SharePoint и Microsoft Active Directory, обеспечивает восстановление данных на уровне гипервизора, виртуальной машины и приложения. Например, еще в предыдущей версии продукт обеспечивал восстановление объектов Microsoft Exchange.
Пользователи Acronis vmProtect отмечают простоту его развертывания и применения. Web-интерфейс vmProtect оптимизирован для небольших сред vSphere с десятками ВМ, но может поддерживать и сотни ВМ. Однако, в отличие от комплексных продуктов со средствами, предназначенными для крупных инсталляций, ПО Acronis vmProtect разработан как экономичный и простой продукт для SMB и удаленных офисов, использующих VMware.
Acronis vmProtect 9 обеспечивает быстрое восстановление ВМ из инкрементной копии (vmFlashBack), позволяет запускать виртуальные машины прямо из сжатого и дедуплицированного файла, может сохранять резервную копию в нескольких местах, в том числе в облаке. Операциями резервного копирования, восстановления и репликации можно управлять непосредственно из VMware vCenter.
Еще одна новинка августа – Acronis Backup & Recovery for vCloud. Это ПО позволяет компаниям и провайдерам дополнить VMware vCloud Director средствами резервного копирования и восстановления с функциями самообслуживания пользователей: «арендаторы» и администраторы могут использовать для защиты своих ВМ частные, публичные и гибридные облака. Для управления процессом копирования и восстановления продукт предусматривает Web-консоль, а интеграция с VMware vCloud Director упрощает процесс копирования и восстановления всей ВМ, включая конфигурацию vCloud и другие метаданные. Здесь применяется та же не требующая агентов технология резервного копирования виртуальных машин, что и в продуктах Acronis vmProtect и Acronis Backup & Recovery, однако обеспечивается эффективная миграция резервного копирования в облако и аварийное восстановление из облачной среды. Как подчеркивают разработчики, это решение создано специально для VMware vCloud. Оно использует vCloud Director API и упрощает перенос приложений в облако.
Компания Veeam Software недавно объявила о начале продаж новой версии своего продукта – Veeam Backup & Replication v7. Среди наиболее интересных функций седьмой версии в редакции Enterprise Plus – встроенное ускорение WAN и резервное копирование из аппаратных снимков. Судя по сообщениям пользователей о существенном ускорении удаленного резервного копирования, улучшении показателей RPO и преимуществах других технических усовершенствований новая версия встретила положительную реакцию рынка, однако она пока что не поддерживает VMware vSphere 5.5 и Microsoft Windows Server 2012 R2. Эти возможности Veeam Software планирует добавить в IV квартале.
По информации разработчиков, встроенное ускорение WAN в Veeam Backup & Replication v7 позволяет удаленно копировать данные в 50 раз быстрее, чем обычная процедура файлового копирования. Нет необходимости в приобретении универсальных устройств («ускорителей трафика») и расширении пропускной способности сети.
Разработанная совместно с HP функция резервного копирования из аппаратных снимков существенно улучшает показатели целевых точек восстановления и значительно снижает нагрузку на виртуальную инфраструктуру. Она совместима с программными продуктами HP StoreVirtual VSA, программно-определяемыми СХД HP StoreVirtual (LeftHand, P4000) и системами хранения HP StoreServ (3PAR). Veeam Backup & Replication v7 содержит более 75 других улучшений, в том числе Veeam Explorer для Microsoft SharePoint, интеграцию с VMware vCloud Director, восстановление ВМ и файлов гостевых ОС в режиме самообслуживания и поддержку резервного копирования на магнитную ленту.
Компонент VeeamZIP (см. Рисунок 5) позволяет создать резервную копию работающей ВМ без ее отключения, например, чтобы перенести ее на другую систему. В версии 7 VeeamZIP работает значительно быстрее за счет параллельной обработки нескольких виртуальных дисков внутри одной ВМ, игнорирования пустых блоков ВМ, и т.д.
Восстановить можно всю ВМ, файлы гостевой ОС или отдельные объекты приложений. Функция Quick Migration для VMware позволяет мигрировать работающую ВМ между хостами и/или хранилищами с минимальным временем простоя без использования кластеров и общих хранилищ даже при отсутствии VMware vMotion и vStorage Motion. Версия Veeam Backup Free также предлагает несколько способов восстановления данных из резервной копии, начиная от восстановления отдельного файла и заканчивая восстановлением всей ВМ.
ЗАКЛЮЧЕНИЕ
Новые возможности продуктов резервного копирования помогают надежнее и быстрее восстановить виртуальные машины, объекты приложений и данные, найти баланс между параметрами RTO, RPO и стоимостью решения.
«Технологические новшества, используемые в виртуализации, открывают путь для новых инновационных решений, предлагающих более быстрое или экономичное резервное копирование, – говорит Владимир Ткачев. – У клиента появляется выбор. Процент виртуализации растет с каждым годом. Если текущее решение не адаптировано для этого, рано или поздно придется его заменить». «Умение решения резервного копирования справляться с экспоненциальным ростом данных является основным определяющим фактором при его выборе», – считает Эмиль Манукян.
По мнению Виталия Савченко, можно выделить два фактора, которые будут оказывать решающие влияние на определение стратегии защиты данных на ближайшие два года – требования бизнеса и требования ИТ. С одной стороны, нужна высокая скорость восстановления, гарантия восстановления, минимальные потери данных. «В конечном итоге бизнесу не важно, делаем ли мы резервные копии или нет, главное – конечный результат, а для его обеспечения требуется очень сильный функционал от продукта резервного копирования. С другой – существуют требования ИТ, связанные со стоимостью и простотой эксплуатации продукта. Важна автоматизация сложных задач и полная интеграция с виртуальной платформой».
Сегодня технология виртуализация достигает поворотной точки. Организации осознали преимущества, которые она может принести. Теперь они начинают понимать, на что действительно способна технология, если ей грамотно управлять. Современные инструменты защиты данных, созданные специально для виртуализации, могут раскрыть этот потенциал, а также устранить многие проблемы, сложности и затраты, с которыми сталкиваются ИТ-подразделения. Виртуализация приведет к тому, что предприятия смогут тестировать больше резервных копий, тогда как сегодня проверяется только 7%, а использование соответствующих инструментов для работы поможет ИТ-директорам восстановить отдельный файл или весь сервер менее чем за пять часов, поясняет Виталий Савченко.
По словам Андрея Новикова, в ближайшие годы большое значение будут иметь факторы интеграции систем резервного копирования с существующим информационным ландшафтом. Так как меняется сама инфраструктура, то соответствующим образом должны изменяться и инструменты обеспечения ее доступности и непрерывной работоспособности. Глубокая интеграция с приложениями, взаимодействие с аппаратными ресурсами, например, дисковыми массивами, современные методы организации отказоустойчивости, в частности, репликация резервных копий, и современные методы эффективного хранения данных, например, дедупликация, – вот признаки современной среды резервного копирования. В будущем можно ожидать некоторого смещения интересов в область облачных технологий и создания основных и резервных площадок в частных облаках или на базе надежных облачных провайдеров, что потребует определенной трансформации инструментов резервного копирования для интеграции в облачную среду. Однако, ведущие производители отрасли уже готовы к такому развитию событий, и имеют в своем портфолио решения для этих задач.
Сергей Орлов — ведущий редактор «Журнала сетевых решений/LAN». С ним можно связаться по адресу: sorlov@lanmag.ru.