Тот, кто с истовым упорством создает резервные копии, еще не может быть уверен в безопасности своих данных.


ГНИЛАЯ ЛЕНТА
ОБОРУДОВАНИЕ СЮДА, ОБОРУДОВАНИЕ ТУДА
ЖИВОЙ ИЛИ МЕРТВЫЙ?
ПРОГРАММОЙ БОЛЬШЕ, ПРОГРАММОЙ МЕНЬШЕ
ВОССТАНОВЛЕНИЕ ПОСЛЕ АВАРИЙ
НА ЧТО ЕЩЕ НАДО ОБРАТИТЬ ВНИМАНИЕ
ПОДВОДНАЯ ЧАСТЬ АЙСБЕРГА

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ RAID К РЕЗЕРВНОМУ КОПИРОВАНИЮ НА МАГНИТНУЮ ЛЕНТУ
Это RAID!

КАК ВАЖНО ДЕРЖАТЬ ЛЕНТОЧНЫЙ АРХИВ В ПОРЯДКЕ
Учет и контроль


По нашему глубокому убеждению, только безумный администратор не установит в своей системе устройство резервного копирования. Никому из нас и в голову не придет эксплуатировать производственную сеть, не разработав хотя бы стратегии резервного копирования файлов. Однако суровая правда жизни состоит в том, что даже регулярное изготовление резервных копий отнюдь не означает, что информацию при необходимости удастся восстановить.

Почему системы резервного копирования подчас не оправдывают возложенных на них надежд и как добиться того, чтобы эта система честно отрабатывала потраченные на нее деньги и время? Чтобы ответить на эти вопросы, необходимо ознакомиться с различными способами организации резервного копирования и выяснить, какие технологии позволяют повысить шансы на успешное восстановление данных. Этому-то и посвящена наша статья. Интересовать нас будут и другие проблемы, связанные с резервным копированием, - дефекты и срок службы носителя, резервное копирование и восстановление данных в реальном времени и т. д.

ГНИЛАЯ ЛЕНТА

В стародавние времена на всех файловых серверах использовались носители на магнитной ленте одного и того же стандартного размера. Сегодня мы имеем четырех- и восьмимиллиметровые кассеты формата DAT Travan, а также кассеты формата DLT (Digital Linear Tape) и недавно появившегося формата AIT (Advanced Intelligent Tape). Нет недостатка и в форматах дисков: оптические, магнитооптические, Compact Disc Recordable, Compact Disc Rewritable, DVD (Digital Versatile Disc). Все эти носители различаются между собой по емкости, скорости записи, возможности случайной выборки данных (некоторые допускают только последовательный доступ) и, что наиболее важно, по надежности и сроку службы. Даже самый емкий и быстрый носитель абсолютно бесполезен, если он не работает должным образом.

Выбирая носитель для системы резервного копирования, администратору следует принимать во внимание целый ряд факторов, в частности срок службы, надежность и взаимозаменяемость. К счастью, все современные носители и оборудование имеют очень высокие показатели по перечисленным нами параметрам, и именно поэтому системы резервного копирования пользуются такой популярностью. Но, как известно, нет в мире совершенства: носитель имеет свойство в конце концов изнашиваться, а взаимозаменяемость не всегда оказывается идеальной особенно в том, что касается совместимости с предыдущими версиями.

В линейных ленточных носителях, таких как DLT или Travan, магнитная лента протягивается вдоль магнитной головки один раз. Такие ленты обычно выдерживают 10 000 протяжек от одного конца до другого, что соответствует от 100 до 300 операций резервного копирования. Объем данных, копируемых за один раз, большого значения не имеет, поскольку лента всегда начинает протягиваться с начала, поэтому в результате 300-кратного считывания небольшого файла лента изнашивается ровно так же, как и после 300 операций полного восстановления данных. Ленточные носители с винтовой разверткой (например, лентопротяжные устройства на базе четырехмиллиметровых кассет стандарта DAT) дают еще больший износ, поскольку здесь лента протягивается вдоль головки несколько раз. Конечно, одну и ту же ленту можно использовать не каждый день, но даже в случае нескольких лент опасность чрезмерного износа сохраняется (см. Рисунок 1).

Picture_1

Рисунок 1.
В лентопротяжных устройствах с линейной и винтовой разверткой используются различные методы записи данных на физический носитель. В некоторых системах имеется еще и серводорожка, которая облегчает позиционирование головок чтения/записи, снижая тем самым механический износ и компенсируя небольшие отличия, существующие между разными устройствами записи.

Как еще снизить вероятность потери данных из-за износа ленты? Например, вы можете применить какой-либо алгоритм ротации кассет, автоматически переводящий старые ленты на долгосрочное хранение или отказывающийся вообще от их применения. Кроме того, такое программное обеспечение резервного копирования, как продукт ARCserve компании Cheyenne (подразделения Computer Associates), позволяет осуществлять контроль использования лент. В ARCserve каждой кассете присваивается порядковый номер, а контроль осуществляется с помощью базы данных. (Более подробно об ARCserve можно прочитать во врезке "Это RAID!".) Когда срок эксплуатации кассеты достигнет предопределенного предела, задаваемого при форматировании ленты, система выдает предупреждение. По умолчанию срок службы ленты составляет один год, однако этот параметр можно изменить при форматировании ленты в соответствии с конкретными характеристиками носителя и лентопротяжного устройства.

При выборе носителя не следует забывать и о возможных ошибках оператора и проблемах хранения. Даже самый надежный носитель не застрахован от того, что кто-то случайно сотрет все данные или просто положит кассету на магнит! Современные кассеты обеспечивают защиту от пыли и грязи, но никто ведь не собирается хранить носители в пыльном чулане или жарким летним днем возить их в багажнике машины. При выборе носителя здравый смысл сослужит вам хорошую службу.

ОБОРУДОВАНИЕ СЮДА, ОБОРУДОВАНИЕ ТУДА

Проблемы с резервным копированием на ленту и восстановлением данных могут возникнуть и из-за различий в оборудовании. В теории (а обычно и на практике) кассеты с лентой и съемные диски должны работать на любом совместимом (или том же самом) оборудовании в течение одного-трех лет. Тем не менее лучше всего проверять совместимость непосредственно, а не принимать технические описания на веру.

Благодаря удачным инженерным решениям, некоторые технологии резервного копирования оказываются более надежными в смысле совместимости, чем другие. Одним из часто применяемых способов здесь является повышение прочности носителей и самой ленты. Что касается DAT, то тут критическим компонентом является накопитель. В линейных системах (например, Travan) кассеты делаются более прочными, а нижняя платформа более жесткой. Это позволяет улучшить протяжку и снизить допуск на дорожку.

Другой способ повышения воспроизводимости - использование сервотехнологии, позволяющей хранить всю информацию, необходимую для правильного позиционирования головок чтения/записи непосредственно на ленте. Эта информация часто записывается при производстве кассеты и помещается, как правило, между дорожками, но бывает, что под нее отводятся определенные участки в начале и конце ленты. Такой подход применяется и для лент, и для съемных дисков.

Несколько особняком стоит случай перехода на новую технологию записи с повышенной плотностью. Производители утверждают, что новые накопители способны работать с носителями, записанными на старых устройствах. Но помните, какие проблемы возникали со чтением старых пятидюймовых дискет на 360 Кбайт в новых дисководах на 1,2 Мбайт? Совместимость старого носителя с новым устройством необходимо проверить при первой же возможности, а после модернизации старое устройство следует держать на всякий случай под руками. Из этого даже можно извлечь дополнительную выгоду: почему бы, например, не подключить к серверу резервного копирования оба устройства?

ЖИВОЙ ИЛИ МЕРТВЫЙ?

Иметь надежные устройства и носители - еще не значит избавиться от проблем. Давайте обсудим, как данные с источника (жесткого диска сервера или клиентской станции) попадают туда, куда надо (устройство хранения на магнитной ленте). Во-первых, для некоторых приложений (например, баз данных) резервное копирование и восстановление данных надо проводить в реальном времени. Даже восстановление файлов может оказаться непростой задачей, если аппаратная платформа источника данных отличается от целевой платформы. Другая проблема - найти резервную копию нужной версии восстанавливаемого файла; когда резервное копирование производится по частям, решение этой задачи может оказаться непростым делом (см. врезку "Учет и контроль").

Базы данных и подобные им приложения работают в непрерывном режиме. Резервное копирование файлов данных часто можно производить без остановки приложения, а вот восстанавливать данные в таком режиме возможно далеко не всегда. Связано это с тем, что восстановление файлов с последующим перезапуском приложения, как правило, не приводит к ожидаемому результату, а если файлы подверглись модификации в процессе резервного копирования, копия не будет соответствовать желаемому состоянию файлов.

Так что же делать? Приложение можно закрыть, и только после этого выполнить резервное копирование; кроме того, вы можете также воспользоваться интегрируемым с приложением продуктом для резервного копирования. Последний способ редко применим к заказным приложениям, однако большинство популярных баз данных и многие почтовые программы в настоящее время поддерживаются всеми основными производителями программного обеспечения резервного копирования. Например, все большее число производителей включают поддержку Microsoft Exchange Server и Lotus Notes.

В подобных ситуациях выборочное восстановление как нельзя кстати, поскольку при восстановлении после аварий перестройку (rebuild) и запуск базы данных необходимо осуществить как можно скорее. Полное восстановление привело бы к изменению конфигурации. Если данные пришлось восстанавливать из-за ошибки в программном обеспечении, то вместе с данными можно воспроизвести и саму проблему. В качестве примера пакета для резервного копирования, способного к работе с базами данных, можно привести NetWorker BusinessSuite от Legato Systems, в котором имеются модули для Informix, Microsoft, Oracle и SAP.

Тому, кто пользуется таким программным обеспечением, мы можем посоветовать перед тем, как восстанавливать данные, сбрасывать на ленту текущее состояние базы данных. Вероятность порчи базы крайне мала, однако восстановление данных - операция весьма серьезная; последние введенные данные при этом могут быть стерты. Как всегда, квалификация приходит с практикой, поэтому имеет смысл опробовать разные сценарии восстановления данных (использовав, например, тестовый сервер), чтобы посмотреть, как каждый из них будет влиять на работу приложения и содержимое базы данных.

Схожая проблема возникает при резервном копировании данных работающих приложений. Хорошая программа повторит попытку скопировать файл, если с первого захода сделать этого не удалось из-за того, что файл был занят другой программой. Повторная попытка обычно осуществляется по окончании резервного копирования; иногда программа может отложить операцию на еще более позднее время и будет пытаться осуществить ее до тех пор, пока не исчерпается допустимое число попыток или попытка не будет успешной. Первый вариант предпочтительнее, поскольку ожидание успешной попытки, особенно при возникновении большого числа конфликтов, может сильно затянуться.

Не стоит забывать и о различиях между платформами. Представим себе, что данные изначально копировались с файловых серверов на платформах Macintosh, Windows NT или OS/2, а восстановить их надо на файловый сервер под управлением NetWare. При работе с некоторыми программами резервного копирования требуется, чтобы источник данных и место их назначения работали на одной и той же платформе, и здесь надо обязательно следить за тем, чтобы в организации имелась хотя бы одна машина для каждой из платформ, данные с которой записаны на магнитные ленты. Это может оказаться не так-то просто: представим себе, что данные копировались с компьютера под NetWare 3.11 или Windows NT 3.1, а потом компания решила отказаться от использования этих платформ.

Некоторые продукты допускают копирование с одной платформы на другую, однако при этом часть данных из-за принятых ограничений на платформе, куда осуществляется копирование, иногда теряется: имя файла может оказаться обрезанным или часть файловых атрибутов может пропасть и т. д. Например, в системах для Macintosh имена файлов состоят из двух частей - ветви ресурсов и ветви данных; обе эти части не всегда корректно транслируются в унитарный формат, используемый на большинстве ПК под DOS. Проблемы межплатформенного обмена могут возникнуть даже при переходе с одной операционной системы на другую (например, с NetWare на Windows NT Server), а также в гетерогенных сетях, где резервное копирование данных приходится выполнять с разнородных рабочих станций.

ПРОГРАММОЙ БОЛЬШЕ, ПРОГРАММОЙ МЕНЬШЕ

Хорошая новость: большинство сетевых программ резервного копирования поддерживают копирование и восстановление информации системных баз данных, таких как Registry в Windows 95 или Windows NT, а также Novell Directory Services. Например, продукт NovaNet-NLM for NetWare компании Nova-Stor может работать с NDS. Обычно главное требование при этом - поддержка выборочного восстановления, поскольку полное восстановление приводит к потере текущей конфигурации. Это, а также неправильное восстановление данных могут привести к серьезным проблемам в области защиты данных и функционирования сети. В самом деле вряд ли кому-либо захочется восстанавливать удаленных ранее пользователей, в то время как требовалось всего лишь восстановить несколько потерянных файлов! К сожалению, как выясняется при попытках выборочного восстановления информации из системных баз данных, большинство приложений и сетевых операционных систем не поддерживают журнал таких изменений.

Задача восстановления системных баз данных возникает также при необходимости дистанционного восстановления рабочих станций и серверов. Проблемы тут точно такие же, поэтому следует убедиться, что селективное восстановление данных возможно. Советуем также попытаться проверить его на практике: нет ничего хуже, чем повторно установить рабочую станцию и восстановить остальные данные, а потом обнаружить, что системная база данных содержит искаженную информацию.

Хорошо это или плохо, но непосредственно с системными базами данных работают (и понимают их) далеко не все пользователи и даже не все администраторы. Например, нахождение содержащейся в Registry информации о рабочих станциях под Windows 95 и определение подлежащих восстановлению фрагментов - задача, как минимум, непростая.

Одним из интересных применений выборочного восстановления данных - в особенности, когда установлена поддержка резервного копирования серверов и рабочих станций, - является распространение прикладного программного обеспечения. В этом случае установка приложения сводится к конфигурации одной рабочей станции, резервному копированию информации, а затем ее восстановлению на все прочие рабочие станции.

ВОССТАНОВЛЕНИЕ ПОСЛЕ АВАРИЙ

Чем сложнее конфигурация сервера, тем необходимее восстановление после аварий. Полное восстановление сервера может занять очень много времени, а время - деньги. Если для того, чтобы просто взглянуть на резервные копии на ленте, необходимо повторно установить операционную систему и ленточный накопитель, то вся работа по восстановлению системы вполне может растянуться на целый день, а то и больше.

Продукты поддержки восстановления после аварий, например Storage Manager for Windows NT and NetWare компании Seagate Software и Replica (для тех же платформ) от Stac, состоят из одного или более загрузочных дисков, содержащих необходимую информацию для начальной конфигурации программного обеспечения восстановления после аварий. На магнитных лентах находится резервная копия восстанавливаемой системы, а также поддержка установки сетевой операционной системы и программное обеспечение резервного копирования на ленту (две последние программы обычно записываются на входящий в комплект поставки

CD-ROM). В процессе восстановления данных с гибких дисков считывается конфигурационная и управляющая информация, необходимая для восстановления данных. Лента содержит основную часть информации о конфигурации системы, а также обычные файлы. В теории процедура восстановления после аварии должна занимать столько же времени, сколько и простая установка сервера и полное восстановление данных с магнитной ленты.

Процедура восстановления после аварии обычно предусматривает установку сервера в минимальной конфигурации с последующим использованием специальной дискеты для восстановления после аварии. В результате поддержка восстановления с магнитной ленты и основные функции операционной системы оказываются возобновлены. Следующий этап - восстановление данных с магнитной ленты. Если для восстановления используется система с той же конфигурацией, что и у системы, с которой изначально изготавливались резервные копии (или просто та же система), то нормальную работу можно начинать, как правило, тут же. В противном случае вполне вероятно, что некоторые параметры конфигурации системы понадобится настроить. Например, если сетевые адаптеры другие, то надо будет удалить старые и поставить новые драйверы. В больших организациях восстановление после аварий необходимо порою осуществлять через сеть. Эта процедура напоминает описанную, с той только разницей, что магнитная лента находится на сетевом сервере резервного копирования.

Восстановить после аварии файловый сервер или сервер печати не так сложно. Другое дело - серверы приложений, например системы старшего класса для обработки транзакций и баз данных. Впрочем, это относится к любым процедурам, связанным с восстановлением данных в таком окружении. Информация о транзакциях должна быть восстановлена как можно быстрее, для того чтобы сервер мог вернуться к работе в нормальном режиме.

Компании, у которой в данный момент нет программного обеспечения поддержки восстановления после аварии, стоит задуматься о поиске такого решения. Вообще, принятые процедуры восстановления после аварии следует периодически подвергать переоценке, а соответствующие системы поддержки, если таковые имеются, тестировать (делать это надо не реже раза в год). При чтении материалов, предоставленных производителем, может сложиться впечатление, что восстановить данные после аварии легко и просто. Тем не менее всегда могут возникнуть какие-то неожиданности, и в таких ситуациях администратору сети крайне неприятно будет ощущать на своем затылке тяжелое дыхание генерального директора, с нетерпением ожидающего запуска сети. Поэтому всякий раз при установке нового сервера имеет смысл испытать на нем аварийные дискеты и ленты от другого сервера. Эксперимент может получиться захватывающий!

НА ЧТО ЕЩЕ НАДО ОБРАТИТЬ ВНИМАНИЕ

Еще две проблемы в области использования резервных копий на магнитных лентах: защита от диверсионных программ и развертывание очень крупных централизованных решений. Администраторы сетей должны уделять больше внимания информационной безопасности и защите от вирусов; наличие интегрированных антивирусных программ должно стать одним из основных требований при выборе программного решения для резервного копирования (антивирусную базу данных следует регулярно обновлять). При этом часто забывают, что магнитные ленты с резервными копиями точно так же уязвимы для вирусов, как жесткие диски, дискеты и файлы, загружаемые через Internet. Проверка на наличие вирусов при копировании и восстановлении данных имеет огромное значение, поскольку восстановление данных происходит зачастую намного позже самого копирования. Новая версия антивирусной программы может обнаружить вирус, пропущенный при резервном копировании. Если вы полагаете, что однократной проверки достаточно, то ее надо делать при восстановлении данных.

Тому, кто работает в крупной компании, не надо объяснять, что управление стратегическим резервным копированием на нескольких серверных платформах может превратиться в настоящий кошмар. К счастью, системы централизованного управления резервным копированием позволяют значительно упростить задачу. При подборе решения следует помнить, что немалое значение имеет интеграция с другими средствами управления сетью. Например, прерывания SNMP можно использовать для выявления проблем с оборудованием и отказов носителя.

ПОДВОДНАЯ ЧАСТЬ АЙСБЕРГА

Совершенно неправильно считать, что резервное копирование в сети сводится к подключению устройства хранения данных на магнитной ленте к серверу и установке простой программы, которая каждую ночь сбрасывает все данные с сервера на ленту. Практически для любого окружения можно найти несколько вариантов систем резервного копирования - были бы деньги. Зачастую главной задачей оказывается поиск оптимального сочетания цены, производительности, надежности и гибкости.

Резервное копирование выполняется ежедневно или еженедельно, но восстанавливать данные приходится редко. Проверка процедур восстановления данных и системы после аварии может оказаться скучным занятием, но обойтись без этого нельзя. Иначе придется объяснять багровым от злости начальникам и пользователям, почему их данные пропали.

Системы поддержки резервного копирования становятся все мощнее и гибче. Стоит позаботиться о том, чтобы вся их мощь была направлена во благо, а не во зло, особенно в тот момент, когда на карту поставлено благополучие компании.


Уильям Вонг - консультант и журналист по компьютерной тематике. С ним можно связаться через Internet по адресу: bwong@voicenet.com.

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ RAID К РЕЗЕРВНОМУ КОПИРОВАНИЮ НА МАГНИТНУЮ ЛЕНТУ

Это RAID!

Не вызывает сомнений, что при резервном копировании на жесткие диски массивы RAID оказываются надежнее автономных дисков, поскольку в массивах RAID вся записываемая информация дублируется. При выборе конфигурации системы RAID следует учитывать ее размеры, а также производительность при чтении и записи. А знаете ли вы, что технология RAID применима и к системам на магнитных лентах? Поддержку резервного копирования на ленту по технологии RAID (при наличии нескольких накопителей, объединенных в группу) обеспечивают несколько продуктов, в частности ARCserve компании CA-Cheyenne.

Системы RAID на магнитных лентах могут продолжать резервное копирование даже при отказе одной ленты или одного накопителя. То же самое справедливо и при восстановлении. Если в наличии имеются все ленты и накопители, и в процессе восстановления данных происходит отказ одной ленты или одного накопителя, то все равно эту операцию возможно довести до конца. Кроме того, как и в дисковых массивах RAID, любую недостающую ленту можно записать заново по остальным лентам, хранящимся в архиве.

Для работы с системами RAID придется установить несколько накопителей и вести запись одновременно на несколько лент - обычно не менее трех - однако помимо повышения надежности такие системы характеризуются также большей емкостью и производительностью. В системах RAID на магнитных лентах обычно реализуются методы RAID-1 (простое зеркальное копирование), RAID-3 (чередование битов) и RAID-5 (чередование блоков). Они дают те же преимущества, что и аналогичные уровни RAID для дисковых систем.

Обслуживание RAID. Как показывает опыт ARCserve, технологию RAID можно применять не только для дисков: она хорошо подходит и для магнитных лент.


КАК ВАЖНО ДЕРЖАТЬ ЛЕНТОЧНЫЙ АРХИВ В ПОРЯДКЕ

Учет и контроль

Восстановить нужный файл зачастую не очень-то просто, особенно если число лент, с которыми приходится работать, больше единицы. Такая ситуация часто возникает при дифференциальном или инкрементном резервном копировании. В большинстве продуктов резервного копирования описанная проблема решается посредством организации базы данных лент и их содержимого. Это позволяет находить нужный файл, не заботясь о том, на какой ленте он записан. На самом деле при восстановлении последних версий всех файлов одного каталога может потребоваться даже несколько лент: старые файлы восстанавливаются с лент полного копирования, а недавно изменявшиеся - с лент дифференциального или инкрементного копирования.

При работе с инкрементным копированием необходимо организовать правильную маркировку и хранение лент. Боязнь работы с большим числом лент - одна из причин, по которой многие администраторы сетей предпочитают выполнять полное, а не дифференциальное или инкрементное копирование. К сожалению, изготовление полных копий занимает, как правило, очень много времени, что далеко не всегда приемлемо.