Как найти среди 20 млн. изданий самое нужное, когда не знаешь точно, что ищешь и в каком направлении искать? Такую задачу постоянно решают посетители библиотеки Российской академии наук (БАН). Установка специального программного обеспечения и оборудования
Информационные технологии необходимы в библиотеке как ни в какой другой организации. Хранение, систематизация громадного объема информации и обеспечение доступа к ней большого количества посетителей являются основными функциями книгохранилища. Вся деятельность библиотеки связана только с информацией. Она в книгах, рукописях, журналах, газетах. Кроме того есть огромный массив сведений о публикациях в виде библиотечных каталогов. Например, каталог только одного подразделения БАН весит почти 5 тонн.
Обеспечивать эффективный доступ к фондам крупных библиотек возможно только при условии внедрения современных информационных технологий. В ведущих зарубежных библиотеках уже давно осознана эта простая истина. Первые форматы для обработки и хранения библиографической информации на компьютерах появились в Америке и Великобритании в 60-х годах прошлого века. Пионером в этой области стала Библиотека конгресса США.
Российские библиотеки приступили к внедрению компьютерных технологий значительно позже. Компьютеризацию они начали в 90-х годах, но процесс шел медленно, поскольку в те времена с деньгами у бюджетных организаций было туго. Серьезные проблемы с финансированием имеются и сейчас, но в последние годы все же реализовано несколько крупных проектов. Уровень автоматизации российских библиотек значительно различается. В бюджете некоторых из них вовсе не предусмотрены расходы на закупку компьютеров, программного обеспечения и поддержку информационных систем. Библиотеки сами ищут источники финансирования, чтобы хотя бы частично покрыть эти необходимые траты.
Одна из основных проблем книгохранилищ с длительной историей — хранение большей части информации на бумажных носителях. Перевод их в электронный вид — крайне трудоемкий процесс. Эту проблему библиотеки постепенно решают как автономно, так и совместно в рамках международных проектов (например, «Всемирная цифровая библиотека»). В электронный вид переводятся в первую очередь самые значимые публикации.
Особый поиск
Библиотеке академии наук в области применения компьютерных технологий предстоит решить еще много проблем. Некоторые книгохранилища Санкт-Петербурга по ряду направлений добились большего прогресса. Это в частности касается автоматизации учета читателей. Однако в рамках реализованного в 2008 году проекта в БАН создана уникальная система поиска, которой нет у других библиотек.
Потребность в такой системе обусловлена особенностью библиотеки. Она обслуживает ученых, чьи запросы, как правило, не формализуются, а область их поиска во многих случаях сложно определить.
Идея создания более эффективного поиска и доступа к информационным ресурсам родилась у инициативной группы, возглавляемой заместителем директора БАН по научной работе Наталией Колпаковой. В результате появился проект «Внедрение современных телекоммуникационных технологий в информационную инфраструктуру библиотеки Российской академии наук», который был выполнен при финансовой поддержке правительства России с привлечением гранта Международного банка реконструкции и развития.
Размер гранта составил 5,5 млн. руб. Обязательным условием для выделения денег на проект было частичное его финансирование из бюджета библиотеки, которая дополнительно выделила 1,3 млн. руб. На полученные деньги были приобретены десять компьютеров, восемь сенсорных киосков, книжный сканер, офисная мебель, системы кондиционирования и программное обеспечение.
По завершении проекта в БАН появилась сеть сенсорных информационных киосков для доступа читателей к базе данных библиотечных записей, создан новый информационный Internet-центр, посетители которого имеют возможность пользоваться мировыми информационными ресурсами, а также центр сканирования. Основной и самой сложной задачей данного проекта была установка и наладка специального программного обеспечения. Можно было выбрать более простой путь, например, отдать предпочтение отработанным «коробочным» технологиям, однако в этом случае многого из желаемого не удалось бы достичь.
Закрытость не приветствуется
Проприетарное программное обеспечение, согласно условиям тендера, вообще не имело шансов быть установленным в БАН. У библиотеки был негативный опыт внедрения решений на базе технологий компаний Apple и Oracle. Основная причина прежних неудач — нестабильное финансирование и, как следствие, приостановка проектов. Продолжить внедрение было невозможно из-за того, что, как считают руководители БАН, использовалось программное обеспечение с закрытым кодом. К тому же мировой опыт автоматизации университетов и библиотек говорит в пользу свободного ПО.
Участниками тендера могли быть не только российские, но и иностранные компании. По итогам экспертизы, проведенной в ноябре 2007 года независимыми экспертами, победителем конкурса стала компания «Линукс Инк», которая и получила право на поставку и внедрение ПО. В мае 2008 года специальный проект с участием этой компании формально был завершен. На самом деле создание эффективной системы доступа к информационным ресурсам будет продолжаться. За несколько месяцев такие глобальные задачи не решаются.
Фактически было создано базовое решение, которое предстоит постоянно развивать. Оно содержит ряд оригинальных наработок. С участием лингвистов был разработан уникальный лингвистический интерпретатор, являющийся основой интеллектуальной поисковой системы.
Соединение фрагментов
Несмотря на наличие интерпретатора, наладка системы доступа к ресурсам оказалась очень сложной. Во-первых, в БАН уже были базы данных библиотечных записей в электронном виде, но формировались они автономно различными подразделениями, в разное время и на основе разных идеологий. Следовательно, хранились они с использованием нескольких форматов записи данных (UNIMARC, Excel, тексты и таблицы Word, txt, tif и др.).
В начале 80-х годов прошлого века библиотека уже приступала к созданию единого электронного каталога, но проект оказался в целом неуспешным. Каталоги быстро переполнили доступное дисковое пространство, а потом оборудование морально устарело. В период перестройки денег на обновление этого оборудования не выделялось.
Тем не менее некоторые фрагменты единого электронного каталога были созданы. С помощью набора автоматических конвертеров, разработанного программистами «Линукс Инк», их удалось объединить. В настоящее время сотрудники БАН различных подразделений, в которых формировались локальные электронные каталоги, продолжают пользоваться уже привычными программными продуктами. Для доступа к единой базе достаточно иметь на компьютере какой-либо популярный Internet-браузер. В то же время данные старых баз постепенно переводятся на современные форматы.
Другой масштаб
Намного больше проблем возникло при создании системы поиска. Особая сложность заключалась в том, что для компании-партнера по созданию системы это был первый эксперимент по использованию собственного лингвистического интерпретатора для работы со столь большой базой данных, поэтому в ходе реализации проекта пришлось несколько раз отлаживать технологические процедуры, чтобы оптимизировать производительность процессов.
Также пришлось повозиться с информационными киосками, адаптируя к ним пользовательский интерфейс и виртуальную клавиатуру.
Изначально участники проекта предложили рассматривать библиотеку как склад. Подобный подход несколько покоробил отельных сотрудников библиотеки, поскольку они относятся к книгам со священным трепетом. Да и не совсем верно считать книгохранилище складом, поскольку обработка запроса является творческим процессом и имеет мало общего с поиском товара на складе. Тем не менее, решение логистических задач необходимо и в библиотеке, поэтому предложенный подход был с некоторыми оговорками оправдан. Руководство библиотеки признало это, но и в дальнейшем приходилось преодолевать несогласованность взглядов специалистов с различным базовым образованием.
Непонимание библиотекарей и инженеров-программистов осложняло взаимодействие, которое было необходимо для успешного завершения проекта. «Иногда было сложно объяснить нашим партнерам особенности библиотеки как научного информационного учреждения, обладающего уникальными источниками для ученых разных специальностей», — вспоминает руководитель группы «Энциклопедия БАН» Надежда Елкина.
Вероятно, недопонимание было одной из причин неудачных предварительных вариантов решений. «Порой мы впадали в отчаяние и думали, что ничего не получится», — добавляет Колпакова. И все же благодаря постоянным встречам, обучению и совместному обсуждению проблем инженеры и библиотекари стали лучше понимать друг друга. Сотрудничество наладилось и продолжается даже после завершения проекта.
Растущая доступность
Главное достижение совместной работы — создание единой базы данных и системы поиска, которая поддерживает семантику и морфологию русского языка и позволяет читателю найти нужную ему информацию по смыслу, даже при отсутствии точного знания об авторе и названии книги. Автоматический поиск в каталоге возможен по различным параметрам: автор, заглавие, тема, персона и другие признаки.
Доступ читателей и сотрудников библиотеки к общему информационному пространству БАН обеспечивается через локальную вычислительную сеть, компьютеры информационного Internet-центра и восемь информационных киосков. Киоски работают в тестовом режиме с целью подбора наиболее эргономичного дизайна пользовательского интерфейса, но число обращений к ним, как и посетителей Internet-центра, растет в геометрической прогрессии.
В новом информационном центре БАН осуществляется постоянный доступ к полнотекстовым статьям из более чем 10 тыс. отечественных и зарубежных журналов. Каталоги библиотеки имеют около 70 млн. библиографических записей, но в электронный вид переведено пока только 2,5 млн. Процесс сканирования карточек продолжается.
Расширение виртуального доступа к фондам БАН осуществлено при параллельном ограничении доступа к оригинальным документам в целях сохранения книжных фондов в интересах науки и культуры.
Система построена на основе современной сервис-ориентированной архитектуры (SOA) и портальных технологий, позволяющих гибко и полноценно использовать преимущества Internet, мобильных средств, средств интеграции и быстрой разработки приложений. Подобная архитектура обеспечивает работу без ограничения роста количества рабочих мест.
Технологии платформы Plone позволяют персоналу самостоятельно создавать и изменять пользовательские интерфейсы, различные формы, регламенты механизмов организации рабочего цикла, процедуры обработки событий. Пока сотрудники БАН не освоили в полной мере эти технологии, но в скором времени библиотека намерена отказаться от соответствующих услуг компании «Линукс Инк».
В третьем квартале к локальной сети подключен и настроен мощный сервер расширенной конфигурации, позволяющий повысить надежность работы сети, увеличить число одновременно работающих пользователей и повысить быстродействие поисковых систем.
Создан также виртуальный сервер под управлением OC Scientific Linux 5.2, на который будет перенесено программное обеспечение баз данных библиотечных записей БАН. В ближайшее время планируется завершить создание еще одного виртуального сервера —
клона рабочего сервера баз данных библиотечных записей, на котором будут производится манипуляции с содержимым баз. После тестирования работы клона изменения будут вноситься в основную версию баз данных. Такая схема обеспечит наибольшую устойчивость и непрерывность работы всего комплекса. Система виртуальных серверов также позволит оперативно (почти мгновенно) создавать копии рабочего сервера в любой момент времени, не прерывая его работу.
В перспективе планируется обеспечить доступ к информационным ресурсам библиотеки через сайт БАН. Технически это осуществить несложно, нужно лишь решить ряд организационных вопросов. И, конечно же, будет продолжено сканирование изданий для перевода их в электронный вид. Окончание этой работы не просматривается даже в отдаленной перспективе — слишком велики фонды БАН.
Библиотека Российской академии наук
Библиотека Российской академии наук основана в 1714 году по указу царя Петра I. Ее изначальное название — Библиотека императорской академии наук. Созданная как «первая научная принадлежность» Академии, она призвана обеспечивать сохранность коллективной документальной памяти человечества и осуществлять информационное сопровождение развития отечественной науки и техники. Единый книжный фонд БАН, включая бронированный и обменно-резервный фонд, насчитывает более 20 млн. отечественных и зарубежных изданий, рукописей, карт, гравюр (в том числе 19 тыс. рукописей, 9 млн. журналов, 36 тыс. названий газет). Библиотека осуществляет обмен с 78 странами мира. В год БАН посещает 23 тыс. ученых и специалистов.