Все чаще ленточные накопители при резервном копировании данных играют второстепенную роль. С появлением недорогих жестких дисков АТА и новых специализированных устройств возрастает интерес к технологиям сохранения данных на дисках. Причем выигрыш в скорости и безопасности можно получить, только когда аппаратное и программное обеспечение образует согласованную систему.
Cистема резервного копирования, будучи интегральной составной частью архитектуры хранения данных, должна удовлетворять двум условиям: гибко реагировать на запросы администраторов и пользователей, а также вписываться в схему централизованного управления. При таком подходе очень кстати, если информация копируется не на ленточные накопители, в соответствии с неписаным законом, а на более гибкие и быстрые носители. Последней тенденцией в области резервного хранения, которая активно обсуждется аналитиками, производителями и пользователями, является сохранение данных на дисках.
ПЕРВАЯ СТУПЕНЬ В ПИРАМИДЕ РЕЗЕРВНОГО КОПИРОВАНИЯ
На первый взгляд резервное копирование на диски представляется новым вариантом управления иерархической структурой хранения информации (Hierarchical Storage Management, HSM). Последняя предполагает многоуровневую структуру, когда данные, в зависимости от их актуальности и частоты использования, перемещаются на все более удобные носители. До сих пор сложность реализации и высокая стоимость препятствовали широкому признанию этой технологии и выходу ее на рынок. Сегодня ситуация резко изменилась. Во-первых, цены на высокопроизводительные дисковые системы заметно упали. Во-вторых, производительность подобных систем на порядок больше, чем раньше. И неважно, о чем идет речь — о применении в качестве целевых накопителей дисков Serial ATA или систем хранения данных старшего класса, — пропускная способность и отказоустойчивость достигли таких величин, которые еще несколько лет назад встречались исключительно в области мэйнфреймов, где дисковые системы резервного копирования — вовсе не новинка. Например, Storagetek с 1998 г. продала почти 2000 экземпляров своего Virtual Storage Manager для использования в средах с мэйнфреймами. Однако открытые системы находятся в лучшем положении, чтобы без проблем наверстать упущенное.
Обычно предприятия обращаются к резервному копированию данных на диски не для снижения затрат, а для ускорения процесса сохранения и, прежде всего, восстановления актуальных данных. И прессой, и производителями (в первую очередь, систем хранения) ставится вопрос о конкуренции с предшествующими ленточными носителями, однако пользователи рассматривают проблему с другой точки зрения. Никто не хочет полагаться на одни только жесткие диски, и резервное копирование данных на диски гораздо чаще расценивается как полезное дополнение для корпоративных сетей, но ни в коем случае не как безальтернативная замена.
СРЕДА ДЛЯ РЕЗЕРВНОГО КОПИРОВАНИЯ
Системы резервного копирования данных на диски — уже давно горячая тема для производителей. В начале прошлого года некоторые из них объединились и создали Расширенную инициативу решений резервного копирования данных (Enhanced Backup Solution Initiative). Ее членами стали, например, Atto, Avamar, Legato, Network Appliance и Quantum. Помимо поддержки продуктов партнеров в рамках виртуальной ленточной среды, цель создания этой организации заключается в том, чтобы донести до пользователя возможность применения дисков как среды резервного копирования. Тем самым на всеобщее обсуждение выносится уже решенный для многих вопрос. С технической точки зрения преимущества употребления дисков в качестве целевых носителей для резервного копирования данных очевидны. В зависимости от разновидности системы хранения время резервного копирования сокращается радикально, и его можно использовать гораздо эффективнее. Как следствие, сохраняемые данные оказываются актуальнее, поскольку копируются чаще; ресурсы же серверов приложений и резервного копирования освобождаются для решения других задач, а их загрузка снижается.
Для многих компаний перечисленных доводов уже достаточно для того, чтобы задуматься о дополнении системы резервного копирования решением для хранения данных на дисках. Но достоинства накопителя с произвольным доступом (Random Access) еще более заметны, когда речь заходит о восстановлении данных. Задержки на установку лент, поиск необходимой позиции, а также процесс перемотки — временные затраты практически на все эти действия сводятся к нулю. Как показали результаты тестов, проведенных специалистами в области программного обеспечения для резервного хранения данных, копирование данных на диск стало в семь раз быстрее, а восстановление — в 20 раз (по сравнению с лентопротяжными механизмами IBM LTO; сведения взяты из исследования Legato и EMC, которое можно найти по адресу: http://portal1.legato.com/partners/strategic/emc/ clariion_nwdbo.pdf). Естественно, используемое аппаратное обеспечение играет при этом большую роль, но компании, нуждающиеся в быстром восстановлении данных, обладают, как правило, высокопроизводительными системами хранения данных (см. Рисунок 1).
ВАВИЛОНСКОЕ МНОГООБРАЗИЕ ПОНЯТИЙ
Рисунок 1. Полное решение хранения помещается в шкаф. |
Абсолютно ясно, что теме резервного копирования данных на диски уделяется сегодня очень много внимания. Есть, однако, некоторые проблемы с интерпретацией. Как недавно было с понятием «виртуализация», так и сейчас, говоря о «резервном копировании данных на диски», производители и пользователи часто имеют в виду разные вещи. В первом приближении технологию можно разделить на три области. Первой является тот вариант копирования данных на диски, которым любое программное обеспечение для резервного копирования владеет в совершенстве. Большинство программ для копирования данных уже давно может обращаться не только к ленточным накопителям, но и к жестким дискам. Тем самым достигается целостная интеграция в существующую систему резервного хранения. Профессиональные решения обрабатывают сохраненные данные на дисках точно так же, как и на лентах. Сохранение, восстановление, поиск — все осуществляется программным путем. Применение этого метода дает огромный рост производительности, поскольку на диск можно записывать несколько сохраняемых множеств данных одновременно. Кроме того, администратор способен запустить процесс восстановления данных сразу же после завершения сохранения их копии, даже если сохранение других копий на диск еще не завершено. Под диском понимаются как встроенные в сервер или подключенные через интерфейс SCSI жесткие диски, так и сетевые накопители. С одним лишь различием: на локальных носителях данных поддерживаются все файловые системы, обычно — файловая система новой технологии (New Technology File System, NTFS) в Windows или ext3 в серверах Linux, а вот программы для резервного копирования на сетевые носители гораздо привередливее. Для поддержки конечного носителя часто должна использоваться сетевая файловая система (Network File System, NFS).
Если сначала данные записываются на быстрый носитель, то дальнейшая их обработка может производиться в соответствии с двумя подходами. При конвейеризации программное обеспечение для резервного копирования как можно быстрее переписывает сохраняемую совокупность данных на ленту. По завершении процесса и получении подтверждения о резервном копировании данные удаляются с жесткого диска. При клонировании информация остается на диске и доступна для быстрого восстановления, но занимает место на носителе. В обоих случаях к надежности дисковой системы предъявляются высокие требования. Поэтому пользователи обращаются к высокопроизводительным и избыточным массивам. Некоторые решения, к примеру от LSI, разрабатывались на базе массивов Fibre Channel с возможностью использования Serial ATA специально для резервного копирования на диски. Meta Group видит самые широкие перспективы развития для этого варианта резервного хранения и считает, что в 2004-2005 гг. на рынке появится масса программных пакетов для сохранения данных с более сильной интеграцией резервного копирования на диски, поскольку пока не все программы одинаково хорошо подходят для копирования данных на диски.
Эту проблему обходит второй вариант, где предусматриваются так называемые специализированные устройства резервного копирования данных на диски, или виртуальные ленточные библиотеки (Virtual Tape Library, VTL). Для программы резервного копирования они выглядят как ленточный накопитель или библиотека. Под эту категорию попадают DX30 и DX100 от Quantum, которые выгодно отличаются тем, что легко вводятся в действие и не требуют обязательной поддержки программного обеспечения для резервного копирования. Администратор определяет, в качестве какой библиотеки, с каким количеством слотов и какими ленточными накопителями должна заявить о себе VTL. Все остальное для приложений резервного копирования остается прозрачным, оно «не видит» различия от ленточных накопителей LTO и DLT. Специализированные устройства обладают избыточностью и функциями обеспечения высокой готовности, как контроллеры RAID, несколькими блоками питания и специально адаптированными стабильными операционными системами. В качестве интерфейса используется Fibre Channel, поэтому проблем с пропускной способностью не возникает. К той же группе, но уже к верхней части шкалы производительности, относятся Centricstor от Fujitsu Siemens, а также Virtual Storage Manager для мэйнфреймов и Echoview для открытых систем от Storagetek. Последний продукт работает со снимками, т. е. полными отображениями тома, который записывается и хранится на накопителе до тех пор, пока не пройдет установленный срок или на диске не закончится свободное место. Centricstor сертифицирован не только для сред Windows и Solaris, но и для крупных систем мэйнфреймов. Для программного обеспечения решение работает как внешний интерфейс к дискам резервного хранения данных и скрывает подключенные ленточные библиотеки. Поэтому доступ возможен с нескольких хостов одновременно, а данные параллельно сохраняются на нескольких носителях. Устройство прозрачно для всех функций управления носителями.
Резервное копирование данных на основе создания снимков лучше всего работает в комбинациях с первым либо вторым вариантом. В отличие от традиционного метода, когда все сохраняемые файлы переносятся на целевой носитель по очереди, снимок представляет собой виртуальную копию всего носителя (см. Рисунок 2) — блоки данных остаются незатронутыми, система резервного копирования лишь дублирует информацию об их положении из таблицы размещения файлов (File Allocation Table, FAT). Преимущества налицо: процесс, в зависимости от размера, длится от нескольких секунд до нескольких минут; дополнительного места на дисках не требуется, поскольку копирование ограничивается несколькими килобайтами данных о каталогах. Если пользователи изменяют блоки данных, система оставляет исходную копию снимка данных. Теперь необходимо дополнительное место на диске, как правило, порядка 10—20% общего объема на каждый снимок. Собственно с данными снимок никак не связан, поэтому он идеально подходит в качестве источника для резервного копирования. Открытые файлы больше не являются проблемой, таким образом можно сохранять даже активные базы данных.
Создание снимка в сети хранения данных возможно в трех местах. Во-первых, на стороне приложения, если программное обеспечение или операционная система поддерживает снимки. Во-вторых, в пределах сети хранения (Storage Area Network, SAN) как составная часть виртуализации. В-третьих, в наиболее распространенном решении снимок инициируется системой хранения данных. По данным компании IDC, более 75% реализаций снимков базируются на системе хранения. LSI Logic, к примеру, предлагает SAN Tricity Snapshot. Этот программный компонент систем хранения работает полностью автономно. Для быстрого восстановления при возвращении к прежней версии или тестировании нового программного обеспечения в качестве источника для резервного хранения используется виртуальный том, чтобы не ограничивать доступ к реальному тому данных. При сохранении активных баз данных система должна приостановить операции записи всего лишь на время создания снимка. В случае Powersnap от Legato или недавно объявленного Backup Exec от Veritas подобное действие производится SAN Tricity Snapshot автоматически. Для баз данных Oracle компания LSI Logic разработала отдельный модуль SAN Tricity, решающий такую же задачу. В остальных случаях для этого необходим вышеописанный процесс.
ВЫСОКОСКОРОСТНОЕ ВОССТАНОВЛЕНИЕ ДАННЫХ
Третий путь реализации систем резервного хранения данных на дисках делает их восстановление особенно простым. Система состоит из программной и аппаратной частей, задача которых — максимально быстро перенести данные с первоначальной системы на специализированное устройство. Это удается благодаря программному обеспечению и методам сжатия, однако формат файла информации на выходе сохраняется. Для восстановления пользователь может выбрать и перезаписать любой отдельный файл или каталог без привлечения программного обеспечения для резервного копирования данных. ATA-Boy или ATA-Beast от Nex-SAN вместе с программным обеспечением Infini-SAN-D2D попадают в эту категорию. В принципе, речь идет о разновидности метода конвейеризации, поскольку данные при помощи приложения для резервного копирования переписываются со специализированного на ленту. Вполне возможно инкрементальное копирование данных на диск и лишь раз в неделю — полное сохранение на ленту. Процессы резервного копирования и, прежде всего, восстановления данных проходят очень быстро, однако программное обеспечение на сервере пока не достаточно апробировано. Классическое программное обеспечение для резервного копирования данных присутствует на рынке гораздо дольше и заслужило доверие пользователей. Кроме того, нельзя забывать о пропускной способности соединения между оборудованием для резервного хранения и хостом, поскольку, как правило, оно устанавливается посредством сети Ethernet.
МИРНОЕ СОСУЩЕСТВОВАНИЕ
Резервное копирование данных на диск представляет собой, без сомнения, лишь дополнительную технологию. За немногими исключениями производители, пользователи и аналитики сходятся в том, что нельзя отказываться от еще одного уровня хранения, хотя бы потому, что ленты намного проще транспортировать. Даже если жесткие диски сделать механически заменимыми, при транспортировке они все равно гораздо более подвержены повреждениям, чем ленточные носители. Кроме того, стоимость хранения одного мегабайта или гигабайта на ленте намного меньше. В зависимости от способа расчета, за размещение одного мегабайта на ленте надо заплатить менее половины цента, в самой дешевой дисковой системе — не менее двух с половиной центов, а специальные ленточно-дисковые системы обходятся заметно дороже — 4—9 центов за один мегабайт. Заметим, что в 2002 г. соотношение цен между дисками и лентами было совсем другим. Если тенденция сохранится, то ленточно-дисковые решения скоро выйдут на один уровень с полностью ленточными носителями, так как ценовой фактор потеряет свое влияние. Все методы резервного копирования данных на диск снижают время восстановления данных — продуктивность работы пользователей повышается, а стоимость каждого отказа системы падает. Но даже когда экономический фактор не будет иметь решающего значения, привычное представление о том, что обычно данные сохраняются на ленточных носителях, еще надолго обеспечит сосуществование магнитных лент и дисков в системах резервного хранения данных.
Эльмар Терек — независимый автор. С ним можно связаться по адресу: redaktion@lanline.awi.de.
? AWi Verlag