Если верить аналитикам, то уже через несколько лет средства будут вкладываться не в системы планирования ресурсов предприятия (ERP — enterprise resource planning), как сегодня, а в корпоративные информационные порталы (EIP — enterprise information portal), решающие более широкий круг задач. Согласно прогнозам, рынок EIP будет ежегодно расширяться на 35% и к 2002 году достигнет 14 млрд. долл.
Борис Логинов, директор ГЦНМБ: «Сегодня ДИТ-М и ГЦНМБ развертывают работы над пилотным проектом по дальнейшему развитию системы OPAC-R применительно к электронным библиотекам. В основе проекта лежит информационный сервер Tamino компании Software AG, подде |
Столь широкое распространение корпоративных порталов было бы невозможным без соответствующих инструментов и новых технологий работы с информацией. Давно существующие форматы хранения данных и способы их представления (HTML, PDF, СУБД и т. п.) подготовили почву для появления порталов, однако решающим, по мнению аналитиков, стало появление языка расширяемой разметки XML и инструментов, поддерживающих работу с ним. Так, компания DataChannel разработала инструментальную среду RIO, основанную на открытом стандарте XML, позволяющую строить корпоративные порталы. Каталогизация всех информационных ресурсов организации осуществляется теперь через виртуальные «папки» или информационные каналы, доступные через браузер. Как и в Yahoo, при работе с системой RIO пользователь может комбинировать поисковую машину с указателями на различные ресурсы, формировать свой индивидуальный интерфейс и т. п.
Большинство порталов в современном понимании — лишь тонкая оболочка корпоративной сети intranet. Язык XML же делает доступным все полезные ресурсы, скрытые в недрах intranet. Скажем, SAP дает возможность пользователям R/3 получить информацию о всех клиентах, партнерах и разработчиках по всему миру, имеющих дело с данной программной системой. XML стал ключевой технологией в создании порталов, делая из них качественно другую субстанцию, нежели таблица содержания. Теперь информация доставляется пользователю в удобном для него виде (таблицы, графики, формулы, ноты, тексты, картины), независимо от места ее хранения.
Можно привести много примеров развертывания корпоративных порталов за рубежом. Однако, как это обычно бывает, вслед за появлением новых технологий возникает вопрос, насколько они затрагивают отечественных разработчиков и пользователей? Посмотрим, что в России внедряется технология порталов на базе XML.
Время синтеза
Государственная центральная научная медицинская библиотека (ГЦНМБ, www.scsml.rssi.ru) — крупнейшее в Европе специализированное хранилище информации по медицинской тематике, предоставляющее возможность работы с электронными каталогами. Основанная в 1919 году, библиотека на сегодняшний день насчитывает 15 каталогов, указывающих на 3 млн. томов хранения. Ежегодный прирост составляет 30 тыс. единиц хранения. ГЦНМБ выписывает более 250 отечественных медицинских журналов и ежемесячно получает 800 наименований иностранной периодики, формируя свой фонд из 2200 зарубежных журналов. Это означает, что практически все официально зарегистрированные во всем мире издания по медицинской тематике представлены в ГЦНМБ. Кроме этого, библиотека играет роль депозитария диссертаций по медицине, которых в России ежегодно защищается свыше 5 тыс.
Опора на систематизированные знания и новые технологии дает возможность современному способному врачу работать гораздо эффективнее, чем самому талантливому доктору 100 лет назад, а современному выдающемуся врачу помогает сделать то, о чем раньше медицинский гений вряд ли мог даже мечтать. Поэтому более десяти лет назад в ГЦНМБ при участии компании ДИТ-М начались работы по созданию и реализации концепции электронных библиотек.
Электронные библиотеки состоят из двух компонентов: электронных каталогов и архива документов. Первые представляют собой объемную базу библиографических знаний о документах, а также поисковый язык, позволяющий формировать поисковые предписания для конкретной прикладной области. Главная цель каталогов — поиск и выдача указателя на место хранения первоисточника. Сегодня эта задача решена, и на передний план выходит следующая — предоставление пользователю возможности непосредственной работы с массивами найденных документов, хранящихся в самых разнообразных формах. Если раньше 70% всего времени, которое врач посвящал изучению литературы, отнимал поиск и только 30% уходило на работу с самим документом, то сегодня, после развертывания систем электронных каталогов, соотношение стало составлять 5% к 95%. Узким местом оказалась доставка документа потребителю.
Как достроить электронные каталоги текстами документов? Возможны два подхода. Первый — раздельное существование каталога и документа, связь только в виде ссылки на первоисточник (имя файла, номер шкафа и полки, адрес в Сети, и т. п.). При этом обычно требуется два интерфейса, две различные системы.
Второй подход — единая среда работы как с каталогом, так и с документом. Иначе говоря, поиск и визуализация документа ведутся средствами одной СУБД, однако для этого надо уметь передать ей первоисточник. Но каким должен быть стандарт представления документов: TXT, DOC, PDF, HTML или XML? Большинство первоисточников хранится в графической, а не в структурированной форме. Неплохие шансы имеет широко распространенный в издательствах формат PDF, который, однако, несколько тяжеловат. Учитывая, что специалист читает книги, статьи (тем более справочники) не последовательно, а непосредственно к нужным главам и частям первоисточника, формат должен предоставлять прямой доступ — здесь поможет HTML. Но, как уже отмечалось, первоисточники содержат самую разнообразную информацию, разбросанную по разным уголкам Internet/intranet, поэтому XML оказывается стандартом, подходящим для построения электронных библиотек.
«Единая среда и единый инструментарий выгодны еще и тем, что базы документов не есть некое застывшее, статичное образование. Документы и каталоги постоянно изменяются, поэтому удобно для поддержки и работы использовать один инструмент. Оказалось, что информационный сервер Tamino — это тот инструмент, который позволяет работать с данными любого типа, превращая их в Internet-объекты, включая объекты любой СУБД: Oracle, DB2, Adabas, Sybase и т.п.», — отмечает Борис Логинов, директор ГЦНМБ.
Жидкокристаллический дисплей размером 6х3 м позволяет диспетчеру наблюдать за хозяйством Газпрома, размещенным на территории в 160 тыс. кв. км |
Стратегическое направление развития электронных библиотек — создание межбиблиотечных систем и обеспечение взаимодействия центров каталогизации. Узлами такой системы являются, например, крупные национальные библиотеки, объединенные с региональными и городскими, которые связаны, в свою очередь, с районными. В этой библиотечной структуре имеется еще один мощный пласт — многопрофильные университетские библиотеки, например МГУ. Все библиотеки осуществляют каталогизацию поступающей литературы на общей основе и общем сервере. Важно заметить, что процесс каталогизации требует значительных ресурсов; например, в США стоимость создания одного библиографического описания составляет 20-60 долл. Поэтому оптимальным становится специализация и разделение обязанностей между библиотеками. Если в базе региональной библиотеки еще нет записи на вновь поступившую книгу, то, прежде чем вносить ее в каталог, оператор ищет ее унифицированное описание в других библиотеках, как правило, в более крупных, обладающих квалифицированными кадрами и выполняющих функции центра каталогизации. Остальные библиотеки из единой системы библиотек экономят время и ресурсы, используя уже готовые каталоги.
При разработке корпоративных межбиблиотечных систем в ДИТ-М ориентируются на международные стандарты и стремятся обеспечить надежную работу с сколь угодно большими многопользовательскими базами данных, полагая, что только в этом случае можно рассуждать о перспективах интеграции в мировое информационное сообщество.
С другой стороны, издательства также готовы к распространению электронных версий своей продукции, однако у них нет каталогов. Созданный в ДИТ-М инструментарий позволяет обеспечить совместную работу библиотек, причем доступ к данным может быть открыт уже не только внутренним, но и внешним пользователям.
Итоги реализации проекта компании ДИТ-М на базе системы Tamino подводить еще рано. Однако ясно: если в иерархии библиотек, в которых осознают важность открытых стандартов, и налажено разделение работ, то для эффективной организации обмена данными, исключения дублирования и предоставления первоисточников непосредственно читателям модель корпоративных порталов выглядит весьма привлекательной.
Что хорошо для Газпрома...
Общеизвестно влияние такого стратегического ресурса, как природный газ, на экономику России. Сегодня на территории страны имеется около сотни месторождений, включенных в единую национальную систему газоснабжения через сеть газопроводов протяженностью 150 тыс. км, обслуживаемую на местах 25 дочерними предприятиями Газпрома. Невозможно управлять огромным хозяйством без информационных технологий. Именно с этой целью в 1976 году был создан ВЦ Министерства газовой промышленности СССР, преобразованный в 1991 году в Информгаз, дочернее предприятие РАО «Газпром».
Основная функция Информгаза — оперативное информационное обслуживание администрации РАО «Газпром»: получение, хранение и обработка информации по добыче газа, его транспортировке и поставке заказчикам в России, СНГ и Западной Европе. В его ведение «входит системно-техническое обслуживание вычислительной техники», расположенной на двух площадках — на ул. Наметкина (1600 компьютеров) и ул. Строителей (около 500 компьютеров), а главное — информационная поддержка центрального производственно-диспетчерского управления (ЦПДУ).
Консолидированная информация о добыче газа, текущем состоянии газопроводов, параметрах транспортировки, режиме работы газокомпрессорных станций приходит по выделенным каналам связи от десятков предприятий из разных точек страны. Эта информация используется для формирования балансов добычи и потребления газа, оптимизации маршрутов транспортировки и формирования соответствующих управляющих заданий работы для дочерних предприятий.
Для решения перечисленных задач создана Автоматизированная система сбора, передачи, обработки и отображения технологической информации (АССПООТИ). Один из результатов ее работы — база данных для ЦПДУ, на центральном дисплее которого размещается вся схема и параметры магистральных газопроводов высокого давления.
Основа центрального вычислительного комплекса РАО «Газпром» — два мэйнфрейма Comparex и сервер баз данных, построенный на основе СУБД Adabas от Software AG. Вокруг этой структуры функционирует локальная сеть, любой пользователь которой в рамках своей компетенции может обратиться к серверу и получить оперативную информацию.
Система обработки данных находится в постоянном движении: происходит смена форматов и сводок, модифицируется топология сети трубопроводов, появляются новые показатели, наконец, изменяется внешне- и внутриэкономическая обстановка, влияющая на работу газовой отрасли. Проблема модернизации соответствующих программ требует адекватного инструментария; в качестве такого инструментария избрана среда Natural.
Жизнь диктует новые задачи. С целью повышения оперативности сбора информации, используемой для своевременного реагирования на внештатные ситуации, планируется увеличить плотность мониторинга с 9 до 12 раз в сутки. Поступающая телеметрия будет накапливаться в долговременном хранилище данных, что позволит формировать более информативные отчеты, сводки и прогнозы. Доступ к общей базе данных будет возможен не только в центре, но и в локальных сетях дочерних предприятий.
Существенные изменения ожидают и систему телекоммуникаций — удаленные газодобывающие и обрабатывающие центры получают в свое распоряжение спутниковые каналы связи с высокой пропускной способностью. Это означает еще более интенсивный поток данных, повышение надежности и гибкости, а главное, обеспечение актуального учета состояния системы. В этой связи, по словам Виктора Климова, главного инженера Информгаз, Tamino вполне может помочь. Новые Internet-технологии, построенные на XML, позволят компании и в будущем справляться с задачами по информационному обслуживанию РАО «Газпром».
Через тернии к транснациональным порталам
В обычном представлении электронный бизнес видится как поток транзакций, циркулирующих внутри организаций и между ними для поддержки бизнес-процессов. Несмотря на всю красоту существующих технологий, используемых сегодня для обработки электронных транзакций, организации подстерегает ряд проблем, решить которые способны лишь новые методы.
- Несовместимость форматов данных. Как оформить заказ на поставку, оформив его в виде письма, включив туда выдержки из факсимильных сообщений и запись, полученную с автоответчика? Может потребоваться номер заказа, запрос окажется написанным на языке, отличном от языка документов, используемых при его оформлении. Единственное на сегодняшний день решение — обработка вручную, что несовместимо с технологией электронной коммерции. Возможное решение — собрать через Internet в одном месте информацию из разных источников и на время создания документа хранить ее в стандартном формате XML.
- Консолидация бизнесов. Даже два отлично понимающих друг друга деловых партнера часто испытывают трудности при обмене данными — разные форматы документов, разные типы используемых аппаратно-программных средств, несовместимые системы обеспечения конфиденциальности и т. п. Мало того, один раз составленный заказ или письмо может использоваться многократно с небольшими изменениями, отражающими текущее состояние дел. Для организации такой работы опять же весьма подходит XML, позволяющий задавать правила сбора и преобразования данных различной природы.
- Управление распределенными корпоративными данными. Большинство корпораций, проявляющих живой интерес к электронной коммерции, не мыслят своего существования без филиалов и отделений, разбросанных по всему миру. Вполне естественно, что в каждом из них может эксплуатироваться своя ОС, система документооборота, СУБД и т.п. Возникает вопрос: где и как хранить важные данные без риска потери их целостности и качества?
- Разношерстные Internet-решения. Несмотря на охватившую столь многих Internet-эйфорию, возникли дополнительные трудности, связанные уже с самими Web-технологиями. Сложные сценарии и изощренные шлюзы часто оказываются бессильны перед большим трафиком, а статичные специализированные сценарии пасуют перед частыми изменениями условий ведения бизнеса. Кроме этого, концентрация технологических знаний у небольшого числа ИТ-специалистов вносит дополнительный риск в бизнес. В этой связи возможность интеграции с помощью корпоративных порталов разнообразных старых и новых архитектур, систем обеспечения безопасности и пользовательских интерфейсов может помочь минимизировать издержки Internet-решений.
Что такое Tamino?
Tamino — разработанный компанией Software AG информационный сервер, построенный на языке гипертекстовой разметки XML и предназначенный для хранения и обработки данных любой природы. За счет использования XML сервер Tamino позволяет интегрировать информацию в одном месте, собирая из различных источников данные произвольного формата: реляционные базы данных, графика, аудио, видео, плоский текст. Информация в Tamino хранится в виде Internet-объектов, что гарантирует многократное использование информации, однажды созданной с применением любой из современных или наследуемых аппаратно-программных платформ.
В основе Tamino лежит новая архитектура, специально разработанная в расчете на XML. Базовой технологией является X-машина — первая технология хранения XML-информации, не требующая ее конвертации в другие структуры. Технология X-узла, реализованная в Tamino, является интерфейсом для доступа к существующим базам данных. X-узел позволяет управлять различными типами информации в однородной XML-структуре.
Сервер Tamino основан на открытых стандартах, поддерживает интерфейс прямого доступа к XML-объектам с помощью традиционных URL-адресов, интерфейс языка запросов XQL, интерфейсы OLE DB, ODBC, JDBC и DCOM для приложений, использующих SQL и объектно-ориентированные технологии. Сервер удовлетворяет спецификациям модели Document Object Model, что позволяет предоставлять клиентам объекты XML как объекты DOM.
Иерархическая структура XML позволяет описывать комбинированные объекты, построенные из нескольких блоков, распределенных по гетерогенным базам данных. При этом управление ими, благодаря хранению данных в единой метаструктуре, сводится к минимуму — администратору базы данных нет необходимости вникать во множество разнообразных схем хранения.
Ликбез по XML
- Norman Walsh, The Extensible Style Language: http://xml.com/xml/pub/1999/01/walsh1.html
- Nigel Hutchison, XML Metalanguage Opens Up New Worlds: http://www.softwareag.com/tamino/articles/metalangarticle.htm
- Martin Bryan, The Role of Document Type Definitions in Electronic Data Exchange: http://www.sgml.u-net.com/ xml-edi/edi-dtds.htm
- Dave Carlson, Component Interoperability with XML: http://www.ontogenics.com/research/papers/ObjectMag/Oct98.htm
- Mark Johnson, XML JavaBeans: http://www.javaworld.com/javaworld/jw-02-1999/jw-02-beans.html
- Jurgen Harbarth, XML for Information Servers: http://www.softwareag.com/tamino/articles/xmlarticle.htm
- World Wide Web Consortium: http://www.w3.org/XML/#dev
- «Открытые системы», №5-6, 1999: http://www.osmag.ru