Требования к системам долговременного хранения данных сильно отличаются от требований к системам хранения, обслуживающим приложения ERP, транзакционные базы данных или почтовые сервисы. Для корпоративных приложений нужна система хранения, обеспечивающая максимально быстрый доступ к данным и их постоянную доступность, а при долговременном хранении на первый план выходят сохранность данных в течение десятков лет и низкая удельная стоимость их хранения. В настоящее время для долговременного хранения используются три основных типа запоминающих устройств: магнитные ленты, оптические диски и жесткие диски. В этом обзоре мы рассмотрим преимущества и недостатки каждой из этих технологий.
Бесконечная масштабируемость лент
Магнитные ленты используются в ИТ-индустрии с 1952 года, относительно недавно они рассматривались как основное средство для записи данных. Однако с развитием компьютерных систем на базе жестких дисков, которые работают значительно быстрее ленточных библиотек, основным применением лент стало долговременное хранение данных.
Еще в прошлом десятилетии существовало несколько несовместимых между собой типов ленточных накопителей (в том числе Quantum SuperDLT, Sony AIT, Exabyte Mammoth), в настоящее время стандартом де-факто хранения на ленте стал открытый стандарт Linear Tape Open (LTO), актуальность которого совместно поддерживают HP, IBM и Quantum.
Последняя версия этого стандарта – LTO-6 – обеспечивает хранение на одном картридже 2,5 Тбайт данных, а при использовании аппаратного сжатия емкость картриджа можно увеличить до 6,25 Тбайт. В сентябре нынешнего года опубликована спецификация LTO-7, позволяющая хранить на одном картридже 5 Тбайт данных (при использовании сжатия – до 15 Тбайт). Консорциум LTO планирует выпустить с интервалом около трех лет еще как минимум четыре поколения устройств, при этом емкость картриджа с каждым новым поколением будет увеличиваться примерно вдвое. Прогнозируется, что один картридж LTO-10 будет вмещать 48 Тбайт данных (без сжатия). Важно отметить, что LTO не предусматривает полноценной преемственности поколений считывающих устройств. Нет никаких гарантий, что привод нового поколения сможет читать и записывать данные на картриджах предыдущих версий. Например, на приводе LTO-6 можно читать и записывать картриджи LTO-5, но записывать данные на картриджи LTO-4 нельзя – их можно только прочесть.
Производители систем хранения сейчас предлагают ленточные библиотеки разного класса – например, у компании HP библиотека StorEver MSL2024 в начальной конфигурации вмещает 24 картриджа и 2 привода LTO, а библиотека корпоративного класса StorEver ESL G3 расширяется от 100 до 12 тыс. картриджей и 192 приводов LTO, занимая в максимальной конфигурации 16 шкафов.
Хотя физическая емкость ленточной библиотеки определяется максимальным числом слотов (отсеков для картриджей), тем не менее по мере записи картриджей их можно извлекать из библиотеки для отправки в специальное хранилище и устанавливать вместо них новые, что означает практически неограниченное масштабирование полезной емкости ленточной библиотеки (разумеется, ленточные приводы имеют ограниченный срок службы, однако их тоже можно заменять по мере износа). А вот емкость дисковых систем жестко ограничена максимальным числом накопителей, и единственный способ увеличить этот показатель – провести замену жестких дисков на новые модели большей емкости, для чего потребуется выполнить сложную процедуру миграции данных. Высочайшая масштабируемость хранилища – одно из главных преимуществ магнитных лент.
У ленты также значительно ниже, чем у жестких дисков, удельная стоимость размещения данных на носителе. Так, стоимость 1 Гбайт полезной емкости на картридже LTO-6 составляет порядка 0,08 долл. Но и хранение записанных на ленте данных обходится существенно дешевле, чем на дисках. Это связано с тем, что кассеты с магнитной лентой, в отличие от винчестеров, установленных в работающем дисковом массиве, после записи на них данных не потребляют энергию и их можно переместить в специальное хранилище для экономии места в дата-центре.
Срок хранения данных на ленте составляет 20-30 лет |
Для долговременного хранения данных часто требуется гарантировать невозможность уничтожения или изменения информации (например, при хранении юридических документов) и шифрование для предотвращения доступа посторонних к конфиденциальным данным. Для удовлетворения этих требований выпускаются специальные картриджи LTO для однократной записи (WORM), а сами приводы LTO поддерживают аппаратное шифрование при записи данных на ленту.
Для ускорения поиска и считывания записанных на ленте данных в LTO применяется технология Linear Tape File System (LTFS), позволяющая организовать с помощью файловой системы содержимое ленты таким образом, что ее работа будет аналогична работе файловой системы на жестких дисках или флеш-накопителях. Например, можно будет выводить каталог записанных на картридже файлов или перетаскивать на него файлы мышью.
Как утверждают производители ленточных систем, срок хранения данных на ленте составляет 20-30 лет. Однако нужно учитывать, что по истечении этого срока приводы, на которых производилась запись, будут давно сняты с производства, а на современных приводах уже нельзя будет прочитать картриджи, записанные несколько десятилетий назад (напомним, что LTO обеспечивает совместимость по чтению только с двумя предыдущими поколениями, поэтому на современных приводах LTO-6 нельзя прочесть картриджи LTO-4, записанные десять лет назад).
Разумеется, вместе с архивом можно хранить законсервированный устаревший привод, однако даже если по прошествии двух десятков лет такой привод сохранит работоспособность, то при его использовании возникнут дополнительные проблемы – например, его нельзя будет подключить к компьютеру по современным интерфейсам либо будет трудно найти специалистов, умеющих обслуживать это устаревшее устройство. По этой причине рекомендуется при долговременном хранении примерно каждые десять лет проводить миграцию данных на новые картриджи. Поскольку емкость картриджей постоянно увеличивается, то при миграции архива будет уменьшаться число картриджей, а значит, упростятся их хранение и поиск нужных данных.
Скорость доступа к данным, хранящимся на ленте, сильно зависит от того, где физически находится картридж. Если он размещен в слоте ленточной библиотеки, то чтение данных займет не более нескольких минут – робот библиотеки извлечет картридж из слота, установит его в ленточный привод, который прочитает содержание ленты. Однако эта процедура займет намного больше времени, если нужный картридж хранится отдельно от библиотеки. Если хранилище локальное (в соседнем помещении или соседнем здании), то на поиск картриджа и его перемещение в библиотеку может уйти несколько часов, а если картридж находится в удаленном хранилище в другом городе, то тогда ждать считывания данных с ленты придется несколько дней.
Уязвимая органика оптических дисков
Первые компакт-диски появились в 1982 году, и этот тип носителей по-прежнему широко используется домашними пользователями ПК, несмотря на популярность флеш-накопителей и внешних жестких дисков. Чаще всего домашние пользователи хранят на компакт-дисках свои фото или библиотеку фильмов. Тем не менее обычные оптические диски CD и DVD плохо подходят для долговременного хранения данных из-за химических процессов, которые со временем приводят к постепенному разрушению изготовленного из органических материалов записывающего слоя диска, и записанная на диске информация теряется уже через 7-15 лет. Поэтому производители оптических дисков разработали специальные накопители для архивного хранения.
Компании Sony и Panasonic совместно разработали формат дисков Archival Disc, обеспечивающий сохранение информации в течение не менее 50 лет. Первое поколение Archival Disc, представленное нынешним летом, обеспечивает хранение на одном диске 300 Гбайт данных, а у второго и третьего поколений емкость диска увеличится до 500 Гбайт и 1 Тбайт соответственно. Как заявляют разработчики Archival Disc, все три поколения будут полностью совместимы между собой.
Новый формат оптических дисков обеспечивает сохранение информации в течение не менее 50 лет |
Компания Millenniata, основанная в 2007 году ученым-химиком Мэтью Линфордом, разработала оптические диски для архивного хранения M-Disc, в которых имеется специальный защитный слой из неорганического материала. По утверждению Millenniata, M-Disc способен сохранять записанную на диске информацию до 1 тыс. лет. Компания Verbatim в нынешнем году начала производить диски M-Disc и предлагает для решений корпоративного класса накопители емкостью 100 и 200 Гбайт. Для записи информации на диски M-Disc используется специальный привод M-Writer, но прочитать их можно на обычных приводах DVD и Blu-Ray.
Поскольку оптические диски являются съемными носителями, хранение на них архивов обеспечивает те же преимущества, что и лента: низкую стоимость хранения, нулевое энергопотребление и возможность перемещать носители из дата-центра в специальное хранилище. Кроме того, в отличие от ленты, оптические диски невосприимчивы к электромагнитному излучению, поэтому способны сохранить данные в случае магнитных бурь, а также лучше переносят высокую температуру. Кроме того, для оптических дисков реже, чем для ленты, требуется миграция данных на новые носители при долговременном хранении, поскольку их можно читать на обычных приводах DVD и Blu-Ray. Однако ленточные картриджи значительно опережают оптические диски по емкости, и для хранения большого архива на ленте нужно меньше носителей, что упрощает управление архивом и поиск в нем нужной информации. Также лента обеспечивает более надежный механизм защиты от ошибок при записи и более высокую скорость чтения и записи данных.
Быстрый доступ к массивам жестких дисков
Хранение архивов на жестких дисках обходится довольно дорого, тем не менее ряд производителей систем хранения предлагают дисковые системы, разработанные для обслуживания электронных архивов. Например, компания EMC уже почти десять лет выпускает систему Centera, а входящая в состав WD компания HGST предлагает систему Active Archive System, масштабируемую до 4,7 Пбайт. Производители жестких дисков выпускают специальные модели для архивных систем, отличающиеся пониженным энергопотреблением и высокой емкостью, – например, 8-терабайтные диски Seagate Archive HDD.
В конце прошлого десятилетия стоимость хранения архивов и других «холодных» данных на жестких дисках пытались снизить с помощью технологии MAID (massive of idle discs), позволяющей уменьшить энергопотребление дисковых систем за счет снижения скорости вращения тех накопителей, к которым за последнее время не было обращений. Но технология не получила широкого распространения. Некоторые вендоры пытались создать архивные системы на базе съемных жестких дисков, которые можно перемещать из системы в специальное хранилище так же, как ленточные картриджи и оптические диски, однако и эти проекты потерпели неудачу.
Существуют и другие «противопоказания» к хранению архивов на жестких дисках. Так, срок жизни жестких дисков составляет 5 лет, поэтому переносить данные на новые носители нужно чаще, чем при использовании ленты или оптических дисков. Существуют различные программные решения, предотвращающие изменение или стирание хранящихся на жестких дисках данных, однако ленты или оптические диски с однократной записью более надежно защищают от изменения архива. Наконец, архиву, хранящемуся на массиве жестких дисков, значительно сложнее обеспечить защиту от катастроф. Если ленту или оптические диски можно хранить в удаленном хранилище, то катастрофоустойчивость хранения для дисковых массивов можно обеспечить только с помощью синхронизации данных на другом массиве, установленном на удаленной площадке, что многократно повышает стоимость хранения.
Основным преимуществом хранения архивов на жестких дисках является скорость доступа к информации. Многим компаниям, чтобы выполнить требования законодательства, необходимо обеспечить не просто долговременное сохранение своих электронных архивов, но и быстрое предоставление информации из этих архивов по запросу регулирующих органов, и поэтому для них оптимальным вариантом будет хранение архивов на дисковых массивах, которые позволяют быстро найти нужный документ в архиве и извлечь его.
А как же флеш-память?
Последние несколько лет технологии твердотельной памяти сильно изменили индустрию систем хранения, и твердотельный накопитель сегодня является стандартным компонентом многих дисковых массивов. Однако твердотельная память пока не используется для архивного хранения из-за своей высокой цены – удельная стоимость хранения на флеш-памяти существенно выше, чем на «архивных» жестких дисках, не говоря уже о ленте и оптических дисках. Кроме того, нужно учитывать, что срок хранения данных на твердотельной памяти меньше 10 лет. Но ее главное преимущество, которое компенсирует высокую цену, – исключительно быстрый доступ к данным. Поэтому при построении архива флеш-диски тоже могут найти себе применение – например, как кэш для ускорения доступа к нужной информации в каталоге архива.