Санкт-Петербургский государственный университет – старейший вуз России, он основан в 1724 году. За почти триста лет существования СПбГУ аккумулировал в архивных и библиотечных фондах огромное количество научных и исследовательских материалов, книг, периодики. Когда-то их просто складывали на полки. В нынешний век электронных медиа и информационных технологий задачи архивного хранения в университете усложняются – фонды пополняются терабайтами данных, полученных в ходе научных изысканий, цифровыми копиями с бумажных носителей и тысячами часов записей видеоконтента. Одним из вариантов повышения эффективности систем долговременного хранения в СПбГУ считают применение оптических технологий. Несколько месяцев назад ИТ-служба университета приступила к тестированию роботизированной библиотеки на дисках Blu-ray.
Список задач
Как пояснил исполняющий обязанности начальника Управления-службы информационных технологий СПбГУ Андрей Жамойдо, одна из наиболее актуальных задач, которую сейчас решают в университете, связана с долговременным хранением видео: «Существует ряд законодательных требований к продолжительности хранения некоторой видеоинформации, и мы должны соблюдать эти требования. В частности, мы обязаны сохранять все записи защит диссертаций (а за год это почти триста событий). Этот объем данных довольно большой. Кроме того, уже начиная с этого года по инициативе ректора СПбГУ мы будем публиковать в открытом доступе все дипломные работы наших студентов до даты защиты. Это большой и важный проект, он будет реализован в СПбГУ в рамках проекта “Открытое образование”».
Кроме того, СПбГУ реализует долгосрочный проект, в рамках которого будет записываться весь процесс обучения студентов с первого курса до завершения учебы. Разумеется, видеоконтент будет адаптирован и обработан, для того чтобы можно было воспользоваться этими записями и получить готовый образовательный продукт (в том числе для формирования курсов дистанционного обучения). Но университету придется хранить и сырые видеоданные. Это позволит при необходимости вернуться к исходным материалам и убедиться в том, что во время редактирования ничего не было потеряно.
Еще одно актуальное направление развития архива связано с формированием электронной библиотеки СПбГУ. Предполагается, что электронные версии книг (их рабочие копии) будут доступны читателям в оперативном режиме, поэтому к ним должен быть организован быстрый доступ. Одновременно в СПбГУ потребуется организовать и архивное хранение этих материалов – в специальном фонде сконцентририруют эталонные версии цифровых копий бумажных изданий. К таким копиям будут обращаться довольно редко, а круг пользователей этой части архива ограничат.
Почти все перечисленные задачи, связанные с использованием архивной информации, не требуют высокоскоростной записи данных в хранилище и последующего доступа к ним. Это не режим базы данных с сотнями и тысячами транзакций в секунду, а именно архивное хранение, подчеркивают в университете.
К выбору оптимального решения
До настоящего времени ядром архитектуры хранения данных в СПбГУ являются дисковая система и ленточная библиотека IBM. Этому комплексу, как замечают в университете, присущи функциональные ограничения. Во-первых, дисковая система хранения данных имеет довольно высокие показатели по энергопотреблению; во-вторых, ленточная библиотека действует по принципу последовательной записи и чтения, и поэтому требуется немалое время доступа к хранящейся на ленточных картриджах информации.
Летом 2014 года компания Panasonic предложила СПбГУ рассмотреть вариант внедрения системы долговременного хранения данных на основе роботизированной оптической библиотеки LB-DH8 на дисках Blu-ray.
Как утверждают в Panasonic, это решение было специально спроектировано для архивации больших объемов информации в университетах, банках, музеях и других организациях, оперирующих крупными архивами транзакций, исследовательских данных и медиафайлов.
Библиотека имеет модульную конструкцию, и ее емкость может быть легко увеличена. Данные хранятся в картриджах, каждый из которых содержит 12 оптических дисков и может хранить в совокупности до 1,2 Tбайт данных. В систему входят базовый модуль (устройство записи картриджей), модуль расширения и загрузчик картриджей. Максимальная загрузка каждого модуля – 76 картриджей. Таким образом, в одном модуле можно хранить до 91,2 Tбайт данных. В зависимости от требуемого объема хранения в 19-дюймовую стойку устанавливается нужное число дополнительных модулей расширения. В максимальной конфигурации с семью модулями в стойке емкость библиотеки увеличивается до 638,4 Tбайт.
В модулях чтения-записи установлены по 12 приводов, это позволяет системе одновременно работать с 12 оптическими дисками и очень быстро считывать и записывать данные (со скоростью до 216 Мбайт/с). Заявленный производителем ресурс хранения данных на дисках составляет не менее 50 лет.
Притягательная экономичность
Санкт-Петербургскому университету была поставлена система в конфигурации, обеспечивающей хранение 182 Тбайт сырой емкости (базовый модуль и модуль расширения).
Жамойдо указывает на преимущества этой системы долговременного хранения: «Прежде всего у нее очень низкие операционные расходы. В режиме Stand-by, когда система не производит операций чтения-записи, модуль потребляет всего 7 Вт. Для архивного хранения это как раз характерный режим использования. Ведь к части накопленных архивных видеоматериалов обращаются довольно редко – например, из видеозаписей защит диссертаций для просмотра запрашивается одна из сотни».
Когда система на дисках Blu-ray не производит операций чтения-записи, модуль хранения потребляет всего 7 Вт электроэнергии Источник: Panasonic |
Когда система осуществляет операции записи и чтения в наиболее напряженном режиме, шкаф библиотеки потребляет примерно 120 Вт электроэнергии. При такой экономичности в принципе можно отказаться от дорогостоящей инженерной подготовки архивного помещения. Для сравнения, только одна стойка действующей в университете дисковой системы хранения с данными видеоархива потребляет в сотни раз больше электроэнергии.
Также, по оценкам специалистов СПбГУ, библиотека Panasonic производит операции записи и чтения значительно быстрее, чем имеющаяся ленточная библиотека.
Производители оптических дисков гарантируют преемственность поколений для своих будущих устройств чтения-записи. Они также совершенствуют свои системы – расширяют их функциональные возможности и емкостные характеристики. Но может случиться так, что через какое-то время диски Blu-ray или их аналоги уступят место более прогрессивным решениям, например, основанным на твердотельных накопителях. Тогда данные архивов придется перезаписывать на них. Но в среднесрочной перспективе оптические диски еще послужат в системах долговременного хранения, уверены в университете.
Если результаты тестирования библиотеки Panasonic удовлетворят СПбГУ, на ней планируется разместить прежде всего видеоархив, затем архив служебных документов, возможно, мастер-копии сканов научной библиотеки им. М. Горького СПбГУ, результаты научных экспериментов – то есть все виды данных, которые генерируются в больших объемах, но востребованы бывают спорадически. Это позволит университету решить основные задачи длительного хранения, а заодно высвободить емкость более дорогой и более быстрой системы хранения данных IBM XIV, чтобы использовать ее для других приложений.
Жамойдо подчеркивает, что выбор технологии для системы долговременного хранения данных непосредственно определяется теми задачами, которые ставит перед собой организация. Этот выбор нужно осуществлять на этапе проектирования новой системы или расширения действующей. И в зависимости от того, какого типа данные нужно сохранить и в каком режиме потом их использовать, следует принимать решение, как оборудовать свой архив: библиотеками на оптических технологиях, ленточными системами, дисковыми массивами или использовать интегрированное решение.