Классическое сохранение данных на ленту пока еще не отслужило свое. Как и прежде, многие предприятия сохраняют деловую информацию на ленточные накопители, автозагрузчики и ленточные библиотеки. В большинстве случаев для этого используется клиент-серверное программное обеспечение, которое поддерживает несколько методов, к примеру, полное сохранение, инкрементальное и дифференциальное резервное копирование. Однако традиционное сохранение на ленту достигло пределов своих возможностей, поскольку временного окна, выделяемого для резервного копирования, часто оказывается недостаточно для сохранения всей информации. Это объясняется постоянным ростом объемов данных, которые необходимо перенести на устройства хранения в течение одной ночи. Технический прогресс в области ленточных накопителей несколько улучшает ситуацию — каждое новое поколение этого оборудования предлагает заметное увеличение скорости передачи данных по сравнению с предыдущим. Недавно появившиеся на рынке ленточные накопители LTO-4 сохраняют данные со скоростью до 120 Мбайт/с, в то время как в версии LTO-3 указанная величина не превышала 80 Мбайт/с (в обоих случаях — для несжатых данных).
Однако реальные показатели зависят и от других факторов: при сохранении большого количества не слишком объемных файлов скорость передачи существенно падает. Если данные поступают со всех серверов одновременно, узким местом может оказаться сеть, а при обращении множества клиентов резервного копирования к одному серверу в «бутылочное горлышко» может превратиться он. Когда выделенного для резервного копирования окна станет недостаточно, для ежедневного полного сохранения деловых данных придется воспользоваться новыми технологиями (см. Рисунок 1). В частности, большинство решений резервного копирования уже поддерживают так называемую технологию резервного копирования без обращения к локальной сети (LAN-free Backup). В таком случае все сохраняемые данные направляются с клиента резервного копирования на системы хранения по выделенной сети, к примеру, сети хранения данных. Еще более широкими возможностями обладают так называемые системы резервного копирования без привлечения сервера (Serverless Backup): они передают данные непосредственно с жесткого диска клиента резервного копирования в систему резервного копирования без обращения к серверу резервного копирования. В области сетевых систем хранения (Network Attached Storagе, NAS) похожие функции предлагает протокол управления сетевыми данными (Network Data Management Protocol, NDMP).
Значительно сократить время сохранения и восстановления данных можно и при помощи решений для резервного копирования на диск (Backup to Disk, B2D). Производители классического программного обеспечения для резервного копирования обычно поддерживают копирование на диск: администратору в качестве цели копирования надо лишь вместо ленточного накопителя выбрать каталог на локальном или сетевом жестком диске. Еще более высокую производительность предлагают виртуальные ленточные библиотеки (Virtual Tape Library, VTL). Речь в этом случае идет о специализированных дисковых решениях, которые посредством программного обеспечения эмулируют ленточные библиотеки. Они легко интегрируются в имеющиеся инфраструктуры резервного копирования. Благодаря сохранению данных на высокопроизводительную дисковую систему можно добиться гораздо большей скорости передачи, чем при сохранении на ленту или на локальные или сетевые диски. То же справедливо и в отношении восстановления информации — при условии, что соответствующие данные все еще находятся на дисковой системе. Если они уже были перемещены на ленту, метод восстановления — непосредственно с ленты или при посредничестве виртуальной ленточной библиотеки — зависит от соответствующего продукта VTL.
УСТРАНЕНИЕ ДУБЛИРОВАНИЯ
Все большее количество производителей виртуальных ленточных библиотек расширяют свои решения, добавляя в них функцию дедупликации (см. Рисунок 2). Основной задачей этой технологии является значительное сокращение объемов резервных копий данных.
В простейшем случае специальные механизмы однократного сохранения (Single Instancing) следят за тем, чтобы хранилась лишь одна версия файла, даже когда в действительности их несколько. Некоторые, более развитые, решения сравнивают шаблоны файлов на байтовом уровне, и тогда система сохраняет не весь файл, а только измененные байты, к примеру, когда в презентации PowerPoint меняется только заголовок в первом кадре. Производители подобных решений обещают, что объем данных, хранящихся на системах резервного копирования, может сократиться в 50 раз. Однако более реально достижение 10-20-кратного сокращения, причем возможная экономия зависит от типа данных.
НЕПРЕРЫВНАЯ ЗАЩИТА ДАННЫХ И ТИРАЖИРОВАНИЕ ПО IP
Выход из сложившейся ситуации, когда временное окно становиться все хуже, предлагают и решения резервного копирования для непрерывного сохранения деловых данных (Continuous Data Protection, CDP). Список производителей, добавляющих в свое программное обеспечение подобные функции, становится все более обширным. В этой связи можно упомянуть, к примеру, Symantec, Atempo и CommVault. В большей части продуктов используется технология создания моментальных снимков, с помощью которых через определенные промежутки времени производится согласованное сохранение текущего состояния рабочих данных, а полученные моментальные копии без спешки сохраняются в системе резервного копирования.
Для компаний, нуждающихся в сохранении данных своих филиалов, некоторые производители предлагают продукты резервного копирования, объединенные с решениями для тиражирования данных по IP. Так, компания СА некоторое время назад приобрела XОsoft и интегрировала его программное обеспечение WANSync в BrightStor ARCserve r11.5. Вместо локального сохранения данных на ленту, выполняемого непосредственно в филиалах, предприятия могут регулярно или в определенный момент времени создавать копии данных путем тиражирования по IP и потом сохранять их при помощи соответствующего инструмента резервного копирования. Компания EVault, дочернее предприятие Seagate, тоже предлагает решение InfoStage для централизованного сохранения данных различных филиалов. Так называемые ускорители глобальных сетей предлагают еще одну возможность для такого сохранения. Эти решения предназначены для улучшения обмена данными посредством сжатия, оптимизации протоколов и механизмов кэширования (кэширование файлов и распознавание шаблона файла).
ВОССТАНОВЛЕНИЕ ДАННЫХ И СИСТЕМ
Даже от самой хорошей системы резервного копирования будет мало толку без нормально функционирующего восстановления. Наиболее частой причиной ошибок является повреждение ленты с резервными данными: ее нельзя прочитать частично, а в худшем случае и полностью. Справиться с этим смогут только специалисты по восстановлению данных, к примеру Kroll Ontrack. Сохранение же на дисковой системе, как правило, обеспечивает читаемость данных.
Ситуацию осложняет полный отказ сервера, когда восстанавливать приходится не только данные, но и операционную систему со всеми работающими на ней приложениями. В такой ситуации можно воспользоваться несколькими методами. Классический заключается в том, чтобы на файловом уровне извлечь из резервной копии все файлы и всю системную информацию, к примеру, настройки системного реестра. Более быстрое восстановление обеспечивают специальные решения для восстановления «с нуля» (Bare Metal Recovery). Многие производители предлагают их в качестве дополнения к продуктам резервного копирования. Для этой цели в IBM TSM, CA ArcServe и Symantec Backup Exec интегрированы технологии создания моментального снимка. Простой, но очень эффективный инструмент для восстановления серверов Windows после катастроф предлагает Drive Snapshot производства Tom Ehlert. Речь идет о небольшом файле формата .exe, который можно запускать и через командную строку.
Решения тиражирования на базе IP позволяют быстро восстанавливать данные и приложения отказавшего сервера и предоставить их с запасной системы. Среди прочих следует назвать Double Take, EMC RepliStor (см. Рисунок 3) и CA WANSync. Но и поставщики решений для виртуализации хранилищ, в частности, DataCore с его SANsymphony и SANmelody или компания FalconStor предлагают решения для тиражирования на базе IP и CDP для быстрого переключения на запасную систему. Наряду с серверами данных при помощи множества инструментов можно защищать почтовые серверы и серверы баз данных, к примеру Exchange или SQL.
РЕЗЕРВНОЕ КОПИРОВАНИЕ И АРХИВИРОВАНИЕ
Долгое время многие предприятия рассматривали архивирование как часть резервного копирования, единственное отличие которого от «нормального» резервного копирования заключалось в том, что файлы должны были храниться длительное время. Особую роль играли долгосрочные архивы, откуда регулярно требовалось извлекать отдельные файлы, и поэтому они должны были обеспечивать короткое время доступа. Для таких приложений использовались оптические решения резервного копирования, такие как библиотеки CD/DVD-ROM или магнитно-оптические библиотеки.
Между тем выдвигаются новые требования к хранению электронных данных, которым часто отвечают только специализированные решения архивирования. Согласно многочисленным правовым нормам предприятия должны хранить часть своих данных очень долгое время, а подразделения ИТ обеспечивать государственным органам доступ к необходимым им данным. Один из опросов, проведенных Ассоциацией производителей систем сетевого хранения данных (Storage Networking Industry Association, SNIA) показал, что 80% предприятий распологают информацией, которая не подлежит утрате более 50 лет. Около 70% компаний обязаны хранить данные отдельных типов даже до 100 лет. По этой причине решение архивирования должно поддерживать максимально возможное число стандартных форматов данных и без проблем перемещать их в случае перехода на новые платформы хранения данных.
Восстановление старых данных, к примеру, электронного письма трехлетней давности, может занять длительное время и потребовать значительных издержек и затрат. Предприятиям все чаще приходится сталкиваться с подобными проблемами в ходе судебных разбирательств. Чтобы соответствовать подобным требованиям, помимо системы резервного копирования они стараются поддерживать и систему архивирования. Исследование «Управление жизненным циклом информации 2007», которое провела компания Luenendonk, показало, что в Германии предприятия считают «управление контентом, архивирование и управление данными» третьей по важности темой для крупнейших ИТ-проектов на ближайшие два года.
Если для резервного копирования и архивирования предприятие использует отдельные системы, их взаимодействие ограничивается, как правило, тем, что по окончании определенного срока старые данные автоматически переписываются из системы резервного копирования в долгосрочный архив. Автоматическое перемещение файлов с первичного через вторичный на третичный уровень хранения данных называется иерархическим управлением хранением (Hierarchic Storage Management, HSM). Независимое архивирование файлов разгружает системы резервного копирования, поскольку им требуется не так много места для хранения данных, а во время резервного копирования меньшее количество данных приходится проверять, определяя необходимость их сохранения.
УПРАВЛЕНИЕ ЖИЗНЕННЫМ ЦИКЛОМ ИНФОРМАЦИИ
Производители рекламируют решения на основе правил для управления файлами на протяжении всего периода их существования под названием систем управления жизненным циклом информации (Information Lifecycle Management, ILM). В этом случае архивирование составляет предпоследнюю стадию жизненного цикла файла до того, как он будет окончательно удален из системы.
К наиболее важным компонентам высокопроизводительного решения архивирования относятся:
-
гибкие инструменты классификации данных для автоматического архивирования на базе правил и на основе таких критериев, как возраст, тип данных, размер или частота обращения;
-
высокопроизводительные функции поиска по всем типам данных и системам архивирования;
-
механизмы для обеспечения аутентичности и целостности архивированных данных (защита доступа, цифровые подписи и т. д.);
-
поддержка требований законодательства в отношении архивирования данных (и среди прочего носителей с однократной записью/многократным чтением, WORM);
-
правила сохранения данных для автоматического удаления данных из системы после определенного срока;
-
функции многоуровневого хранилища для автоматического перемещения данных на более дешевые носители;
-
возможность архивирования данных из нескольких исходных систем и централизованного управления ими.
Лидером на рынке решений архивирования является специализирующаяся в области хранения данных компания ЕМС. Еще несколько лет назад она представила на рынке дисковую систему хранения Centera, позволяющую архивировать постоянный контент, т. е. данные, которые, в соответствии с действующим законодательством, больше не подлежат изменению. На предприятиях такие данные часто составляют от 80 до 90% от общего объема информации. В последние годы ЕМС расширила свой бизнес в области управления данными — в первую очередь благодаря покупке других компаний. Для поддержки архивирования электронной почты она приобрела компанию Legato, разработавшую продукты Email Xtender и Disk Xtender, а для предложения решений в области управления документами — компанию Documentum с одноименной платформой управления контентом.
Конкуренты тоже не сидят сложа руки и предлагают интеллектуальные решения архивирования. Из крупных производителей на этом рынке присутствуют HP, IBM, Network Appliance и Sun. Network Appliance разработала платформу для архивирования в виде семейства дисковых систем для «почти оперативного хранения» (nearline), которая поддерживает все правовые требования, предъявляемые к архивированию данных. Поскольку все функции реализованы на базе принадлежащей этому поставщику операционной системы Ontap, у предприятий появляется возможность использовать для архивирования первичную систему хранения данных FAS, что может быть полезно для небольших филиалов. Hitachi Data Systems предлагает комплексное решение Content Archive Platform, включающее систему хранения данных, серверы и программное обеспечение для архивирования и поддерживающее все важнейшие функции архивирования в соответствии с законодательными требованиями, включая архивирование электронной почты. То же самое справедливо и в отношении компании Hewlett-Packard с ее RISS (Reference Information Storage System), IBM с системой System Storage DR550 (Data Retention) и Sun StorageТek SAM (Storage Archive Manager).
В сегменте малых предприятий это направление развивают такие производители, как gingcom, которые пытаются удовлетворить всем требованиям, предъявляемым к резервному копированию и архивированию, при помощи одного решения. Специализированное устройство gingcom сохраняет данные посредством CDP, причем оно поддерживает и ноутбуки. Решение предлагает архивирование файлов и электронной почты c механизмами однократного сохранения и дедупликации, функциями поиска и иерархическим управлением хранением. Кроме того, на случай проведения проверки имеется возможность хранить данные с фиксацией состояния. Программные решения для архивирования выпускает и множество других компаний.
ТЕНДЕНЦИЯ АРХИВИРОВАНИЯ ЭЛЕКТРОННОЙ ПОЧТЫ
К наиболее популярным решениям архивирования относятся специальные решения для систем обработки электронной почты. Причина очевидна: трафик электронной почты давно стал неотъемлемой частью деловой коммуникации. Во многих случаях электронные письма представляют собой документы, которые в качестве составной части контрактов рассматриваются как юридически значимые. Поэтому предприятия должны заботиться о том, чтобы все важные для них электронные письма хранились в соответствии с правовыми предписаниями в течение длительного времени и оставались доступными. Благодаря высокопроизводительным функциям индексации и поиска системы архивирования электронной почты необходимые данные можно быстро найти и предоставить по требованию. Механизм однократного сохранения следит за тем, чтобы вложения в электронные письма сохранялись лишь один раз, даже если они направлялись большому количеству сотрудников. Еще больше места экономят решения, поддерживающие дедупликацию на байтовом уровне.
Между тем большинство производителей уже реализовали правила хранения, которые, к примеру, позволяют автоматически переписывать электронные письма и вложения на более дешевые носители и полностью удалять их из системы на основе таких критериев, как возраст, размер или тип файла.
WORM ДЛЯ ХРАНЕНИЯ В НЕИЗМЕННОМ ВИДЕ
Для обеспечения выполнения законодательных требований к хранению электронных деловых данных особое значение приобретает поддержка формата однократной записи и многократного чтения (Write Once Read Many, WORM), поскольку технологии хранения данных должны обеспечивать защиту однажды сохраненных данных от случайного изменения. Это воспринималось как нечто само собой разумеющееся вследствие особенностей формата компакт-дисков и DVD, предназначенных для однократной записи, однако хранение данных на лентах или жестких дисках, напротив, требует специальных решений. В зависимости от выбора производителя могут использоваться аппаратные или программные решения, которые следят за тем, чтобы однажды сохраненные данные оставались без изменений.
Ленточные накопители стандарта LTO поддерживают сохранение в формате WORM начиная с третьей версии. Компании Quantum, IBM или Sun/StorageТek тоже предлагают аналогичные устройства с поддержкой WORM. Дисковые системы с функциональностью WORM, которые производят HDS, HP или Network Appliance, могут хранить данные в течение заданного времени, после чего подлежащая уничтожению информация автоматически удаляется из системы — окончательно и без возможности последующего восстановления.
ПЕРСПЕКТИВЫ
Нет ни одного продукта, который отвечал бы всем требованиям к резервному копированию, восстановлению и архивированию данных. Если предприятие планирует построить высокопроизводительное решение сохранения, восстановления и архивирования данных, в первую очередь необходимо определить, какие технологии ему понадобятся для выполнения собственных задач. Когда времени, выделенного для резервного копирования, недостаточно, адекватным решением для длительного хранения данных могут стать виртуальные ленточные библиотеки или программное обеспечение CDP. Для быстрого восстановления при отказе серверов можно воспользоваться продуктами восстановления «с нуля» или тиражированием высокой готовности по IP. Для соблюдения законодательных требований к хранению электронных деловых данных системы архивирования электронной почты вскоре станут обязательными. И тогда следующим шагом будут всеобъемлющие решения архивирования, способные хранить все важные для проверки документы, включая системы управления документами и рабочими
потоками.
Кристоф Ланге — независимый журналист и консультант по ИТ.
© AWi Verlag