БОБИНЫ ПЕРВЫХ ленточных хранилищ вмещали лишь несколько сотен килобайтов данных |
В мае наступает 60-я годовщина со времени изобретения цифровой магнитной ленты корпорацией IBM. Некоторые считают, что лента уже отслужила свое, — об этом заявляли отраслевые эксперты, которые точно так же пророчили смерть мэйнфрейму.
Но похоже, что у ленты впереди еще долгая жизнь. Несмотря на почтенный возраст, во многих отношениях это только начало пути, так как, в отличие от мэйнфрейма, роль ленты на предприятии кардинальным образом меняется. Несколько лет назад в связи с появлением дешевых дисковых накопителей большой емкости многие наблюдатели решили, что удел ленты теперь — отправляться в пыльные хранилища для архивов старых данных. Ушли те дни, когда лента была основным носителем для резервного копирования и восстановления потокового мультимедиа.
Однако пропускная способность ленточных накопителей следующего поколения обещает достигнуть 525 Мбайт/с. При цене около 25 долл. за терабайт лента — слишком быстрый и недорогой носитель, чтобы сбрасывать ее со счетов. А новые открытые форматы файлов обеспечили возможность применения ленты на новых рынках.
Первый аппарат для записи данных на 7-дорожечную магнитную ленту, IBM 726, появился в 1952 году. Катушка с лентой была размером с пиццу. Скорость записи составляла около 7,5 Кбайт/с, на бобине умещалось 2,3 Мбайт — этого хватит, чтобы записать примерно полторы минуты одной из песен, хранимых на вашем смартфоне.
IBM начала продавать ленточные накопители через год после анонса первой магнитной ленты. Их стали использовать для хранения данных первого коммерческого компьютера — колоссального нагромождения оборудования под названием UNIVAC I, созданного компанией Eckert-Mauchly. На бобине умещалось всего 224 Кбайт.
Соблазнительная дешевизна
Сегодня картридж LTO-4 емкостью 800 Гбайт (или 1,6 Тбайт в режиме компрессии) продается всего за 22 долл. Для сравнения, самая низкая цена терабайтного 3,5-дюймового жесткого диска SATA на 7200 оборотов в минуту — около 100 долл., а самый дешевый 2,5-дюймовый «винчестер» той же емкости стоит 130 долл.
Если умножить пятикратную, по сравнению с жесткими дисками, экономию на тысячи лент и петабайты или экзабайты корпоративных данных, экономия расходов может достичь поистине монументальных масштабов.
При сравнении затрат также необходимо принять во внимание тот факт, что предприятию может понадобиться всего одна ленточная библиотека для резервных копий и архива, тогда как при использовании дисковых массивов нужно будет обслуживать множество стоек.
Планы развития спецификации Ultrium Linear Tape Open, которая применяется сегодня в подавляющем большинстве ленточных систем, обещают появление картриджей емкостью по 32 Тбайт и пропускную способность 1,2 Гбайт/с. «Мы продемонстрировали возможность записи с плотностью 29,5 Гбит на квадратный дюйм ленты, — заявляет Брайан Трусковски, генеральный менеджер IBM по системному хранению и сетям. — И это далеко не предел».
Для сравнения, недавно Seagate объявила о том, что достигнута плотность записи 1 Тбит на квадратный дюйм пластины жесткого диска. Благодаря этому прорыву в течение ближайших десяти лет появятся жесткие диски для ноутбуков емкостью 20 Тбайт.
LTFS и LTO-5
Сегодня две важнейшие разработки, LTO-5 и Linear Tape File System, открывают новые применения для ленты, такие как облачное хранение, Большие Данные и потоковое мультимедиа.
«Бытует высказывание, что слова ‘лента’ и ‘ультрасовременный’ — антонимы, однако благодаря LTFS это уже не так, — утверждает Трусковски. — Архивные данные сегодня стали более важны для заказчиков, как и возможность хранить их с возможностью полуоперативного (nearline) доступа».
Спецификация LTFS появилась в 2010 году. Ее поддерживают крупнейшие производители ленточных накопителей, в том числе компании IBM, HP и Quantum, а также ассоциация LTO Consortium. Oracle применяет LTFS в корпоративных ленточных системах T10KC.
Формат LTO-5 был представлен в прошлом году. Он позволяет сохранить 1,5 Тбайт несжатых данных (или 3 Тбайт с компрессией), а LTFS дает возможность получать файлы с ленты так же легко, как если бы они хранились на флэшке или внешнем жестком диске.
LTO-5, как и предыдущие поколения стандарта, обеспечивает вдвое большую емкость и скорость передачи данных, чем у предшественника. Накопители LTO-5 могут сохранять данные на скорости до 140 Мбайт/с без сжатия и до 280 Мбайт/с в режиме компрессии. А в этом году с появлением LTO-6 максимум скорости вырастет до 525 Мбайт/с, а емкости — до 8 Тбайт.
Как и в LTO-4, в LTO-5 предусмотрены аппаратные средства шифрования по алгоритму AES-256 и режим работы «только чтение». В отличие от предшественника, LTO-5 поддерживает возможность разбиения ленты на два раздела (Dual Partitioning), ускоряющую доступ к данным и упрощащую управление ими.
LTFS — это файловая система с интерфейсом POSIX, позволяющая работать с файлами из любого файлового менеджера. Поверх LTFS можно добавить стек NAS (например, NFS или CIFS), что позволит осуществлять доступ к файлам с любого настольного компьютера.
Поддержка LTFS опирается на функцию Dual Partitioning в LTO-5. На одном из разделов для быстрого доступа обычно хранится указатель файлов ленты, а на первом записано само содержимое.
Благодаря наличию двух разделов можно просматривать файловую структуру без считывания всей ленты. Как только нужный файл найден в индексе, с помощью простой команды копирования его можно перенести с ленты, например, на диск.
«В конечном счете преимущество в том, что, когда вы храните данные на ленточном картридже, вы можете извлекать их без какого-либо узкоспециального системного ПО или приложений на хост-системе», — утверждает Роберт Аматруда, аналитик IDC по рынку защиты и восстановления данных.
Облака и Большие Данные — новый фактор роста
Наряду с потоковым мультимедиа новые рынки для ленточного хранения открываются благодаря Большим Данным и облакам.
И частные, и общедоступные облачные инфраструктуры требуют доступности огромных объемов данных в режиме, близком к оперативному. В зависимости от соглашения об уровне обслуживания провайдеры облаков могут предоставить заказчику многоуровневую инфраструктуру хранения, в которой данные, к которым нужен быстрый и простой доступ, хранятся на твердотельных накопителях, а остальные содержатся на дисковых или ленточных. При этом последние будут самым экономным по цене вариантом, но обеспечивающим «достаточно хорошее» быстродействие для хранения файлов большого размера.
Кроме того, лента сама по себе обеспечивает более высокую защищенность в коммунальных облачных средах.
Когда для облачного хранения используются дисковые массивы, то для компрессии и снижения потребностей в емкости применяются технологии дедупликации и динамического выделения пространства (thin provisioning). Кроме того, используется технология RAID для дублирования и распределения данных на блочном уровне по дискам в целях повышения устойчивости к сбоям. Для поиска данных по обширным дисковым массивам в облачной среде применяются таблицы сопоставления метаданных. Кроме того, требуется вспомогательное ПО, обеспечивающее надежную изоляцию данных каждого клиента от информации других пользователей на тех же дисках или массивах.
В свою очередь в ленточных средах LTO каждый картридж представляет собой отдельный объект, и клиент или провайдер облака может контролировать его содержание. Ленточные библиотеки можно делить на виртуальные, предлагая их заказчику, при этом доступ к чужим данным исключен.
Считается также, что у ленты большие перспективы в мире Больших Данных.
Львиная доля Больших Данных хранится в неструктурированных форматах, таких как электронная почта, компьютерные протоколы, данные поисковых запросов, показания датчиков сейсмической активности, бизнес-документы, музыка, видео и фотографии.
Сейчас цифровая вселенная (все цифровые данные, хранимые во всем мире) насчитывает 1,8 трлн Гбайт и 500 квадриллионов файлов, утверждается в исследовании IDC Digital Universe Study 2011. По прогнозу, на протяжении предстоящих четырех лет объем файловых данных вырастет в восемь раз.
Чтобы иметь доступ к корпоративным архивам, приложениям на основе Map Reduce, таким как Apache Hadoop, необходим доступ к обширным хранилищам данных, и ленточные библиотеки емкостью в петабайты и даже экзабайты идеально подходят на эту роль, полагает Аматруда.
«Именно поэтому все больше инструментов аналитики будет рассчитано на работу с лентой, — утверждает он. — Новый виток системной интеграции и инвестиций будет направлен на получение возможности сортировать такие данные и эффективно их ‘добывать’».
По нраву телевидению и кино
Марк Леммонс, директор по технологиям компании Thought Equity Motion, полагает, что, когда вещательные корпорации и кинокомпании перешли на дисковое хранение, отказавшись от стандартной видеопленки, они лишились интероперабельности в международных масштабах, обеспечение которой не требовало никаких дополнительных расходов.
«Фильмы обычно создаются с участием нескольких десятков компаний, а телесеть распространяет свою программу между 40, 50, 400 или 500 телестанциями, — утверждает он. — Средства взаимодействия были буквально встроены в бизнес, а теперь их выбросили, будто мусор».
Thought Equity — оператор облачного сервиса хранения видео в оригинальном качестве. Компания хранит архивы Paramount Pictures, Sony Pictures Entertainment, National Geographic и New York TImes. Недавно она перешла на ленточную библиотеку LTO-5 с поддержкой LTFS, сохранив на нее более 10 Пбайт данных. В скором времени объем данных на ленте превысит 50 Пбайт, прогнозируют в компании.
Жесткие диски абсолютно не подходят индустрии кино и телевидения для хранения архивов дольше десяти лет, полагает Леммонс, так как они просто на это не рассчитаны. «За последние два года жесткие диски стали вместительнее, с терабайта их емкость выросла до трех, но при этом не стали быстрее, — полагает он. — Лента тем временем развивается в другом направлении, она становится быстрее».
Появление LTFS стало критически важным событием для Thought Equity, утверждает Леммонс, так как компании необходимо предоставлять своим клиентам доступ к файлам независимо от применяемой ими ИТ-инфраструктуры.
Лента LTO изначально не была рассчитана на поточное мультимедиа, полагает Леммонс, так как она создавалась для резервного копирования на случай катастрофических сбоев в крупных банках и корпорациях, а не для повсеместного доступа и хранения видео.
«Исторически ленточные системы было сложно даже просто подготовить к работе, а их программное обеспечение не предусматривало совместного доступа к данным, — утверждает он. — Допустим, клиент передает мне петабайт данных — они будут храниться в моей системе на моей ленте, и извлечь их можно будет лишь с помощью специального ПО, которое есть только у меня. Если бы я принес ленту с данными заказчику, она была бы абсолютно для него бесполезной, если бы у них не было точно такого же ПО, например IBM Tivoli, Oracle SAM-FS и т. д. Это весьма дорогостоящий, проприетарный программный слой, который не позволяет делиться данными на уровне ленты».
К данным, хранимым в LTFS, можно получить доступ из любой файловой системы, поэтому зависимости от применяемого ПО резервного копирования нет.
Можно записать видеофайл на ленту, после чего он становится доступным на любом компьютере — на Mac, Windows или Linux, как если бы это был том на жестком диске, утверждает Леммонс.
«Я могу перетащить файл мышкой и записать его на ленту практически на той же скорости, что и на SATA-диск, а затем перебрасывать его по всему миру, подобно картриджу Digibeta или HDcam, причем мне не понадобится тот же уровень инфраструктуры, который нужен для самой ленточной библиотеки. Мне нужна будет всего лишь небольшая программа с открытым кодом, и все это благодаря инициативе LTFS, выдвинутой IBM, HP, Oracle и другими».