Не называйте это добычей данных
Oracle решила сразиться с SAP на чужом поле
Подобно бессмысленному детскому спору о том, сможет ли Супермен одержать верх над Бэтменом, если эти два супергероя когда-нибудь встретятся, баталии между сторонниками оперативной аналитической обработки данных (OLAP - online analytical processing) и теми, кто убежден в превосходстве реляционной оперативной аналитической обработки (ROLAP - relational online аnаlytical processing), ведутся скорее в сфере теории, а не практики.
Борьба идет между двумя сравнительно новыми, близкими технологиями, которые позволяют менеджерам компаний продираться сквозь корпоративные базы данных в процессе поиска полезных для них агрегированных данных. На самом деле дискуссия между сторонниками ОLАР и ROLAP вовсе не относится к разряду абстрактных, поскольку между продуктами, созданными на базе технологий OLAP и ROLAP, существуют реальные различия с точки зрения их функциональных возможностей и эксплуатационных качеств.
Администраторы информационных систем могут сделать разумные, технически обоснованные выводы относительно лучшей приспособленности той или иной технологии к системным архитектурам, свойственным их компаниям, и требованиям со стороны приложений. Несмотря на это, жаркие дебаты ведутся вокруг вопроса о формировании инфраструктуры складирования данных, позволяющей наилучшим образом подготовиться к неопределенностям будущего, в котором прикладные программы для поддержки принятия решений, по-видимому, будут играть гораздо более важную роль для исповедуемого менеджерами способа ведения своего бизнеса.
Более того, по мнению наблюдателей, технологии OLAP и ROLAP сближаются, по мере того как различные производители объединяют сильные стороны каждой из этих технологий. Гораздо важнее то, что, согласно прогнозам ряда аналитиков и руководителей фирм-производителей, источник наполнения всех баз данных - Internet возможно, заметно изменит роль, которую выполняют OLAP и ROLAP в бизнесе. Некоторые свидетельства этого уже есть в виде большого числа Web-приложений, выпущенных как производителями продуктов на базе ROLAP - компаниями MicroStrategy и Information Advantage, - так и традиционными поставщиками технологии OLAP например, Аrbor Software, Business Objects и Platinum Technology. (Последняя недавно стала обладателем инструментальных средств на базе OLAP приобретя в начале текущего года фирму Prodea Software.)
ЗАМЕШАТЕЛЬСТВО ОСТАЕТСЯ
По-видимому, из-за того, что средства, созданные на базе ОLАР и ROLAP, предоставляют 'аналогичные функции по поддержке принятия решений, до сих пор наблюдается некоторое замешательство при ответе на вопрос, касающийся сравнения сильных и слабых сторон обеих технологий. "В тупик поставлены не только системные администраторы информационных систем, но и консультанты, и фирмы-производители, которые подчас не могут разобраться в продуктах, созданных своими оппонентами", - считает аналитик из консалтинговой компании Archer Decision Sciences Нейл Рейден.
Как OLAP так и ROLAP поддерживают многомерные представления данных в противовес большому количеству атрибутов; для работы с ними обычно используются мощные графические внешние интерфейсы. Предположим, сотрудник сети магазинов розничной торговли, где применяется одна из этих технологий, сможет добраться до финансовой информации, которая позволит ему обнаружить причины уменьшения объемов продаж в конкретных регионах. Информация, хранящаяся в базе данных на сервере, сможет указать на слабость общих итоговых показателей по объемам продаж в регионах; с помощью же систем на базе OLAP или ROLAP пользователь получает возможность сформулировать такой запрос, который позволит извлечь данные об объеме продаж отдельного магазина и даже конкретного продукта. В конце концов, пользователь сможет обнаружить источник неблагополучия, скажем, причину снижения объема продаж определенного продукта в конкретном магазине.
Основное различие между технологиями кроется в их структурных особенностях, а именно в способах, используемых OLAP и ROLAP для поиска и агрегирования информации из реляционных баз данных. Продукты, выполненные в технологии OLAP например, Essbase Server компании Arbor Software, помещают необходимую информацию в специализированный кэш данных. По мнению сторонников ОЕАР, такое решение обеспечивает отличное быстродействие при низких затратах. ROLAP предоставляет похожие функциональные возможности, но выполняет требуемые аналитические операции "на лету", исключая промежуточный этап, связанный с размещением данных на специальном сервере. В результате пользователи получают преимущество в виде быстрого выполнения таких запросов к базам данных, которые являются слишком большими, чтобы эффективно реализовывать синтаксический разбор средствами OLAP.
Поскольку OLAP использует промежуточный сервер, а ROLAP обращается непосредственно к базе данных, программные средства ROLAP зачастую могут обеспечить доступ к более динамично изменяющимся данным, чем это возможно при использовании OLAP Аналогично, некоторые приложения более приспособлены к механизмам поиска, основанным на ОЕАР, а не на КОLAP. По мнению аналитика из Giga Information Group Терезы Уингфилд, OLAP больше подходит для финансовых приложений, поскольку используемая ими информация фрагментирована, причем часто по ведомственному принципу, - а ROLAP выигрывает в приложениях, связанных с вопросами маркетинга, например, в программах, анализирующих результаты продаж, которые используют огромные массивы данных, к тому же постоянно обновляющихся. Чтобы отдать предпочтение той или иной технологии, требуется как следует оценить структуру информации, которая будет анализироваться в дальнейшем, например, определить объем хранилища данных и частоту изменения информации, а также представить себе все типы запросов для отыскания необходимых сведений.
Примером компании, проявившей взвешенный подход к оценке альтернатив и вместо традиционного пакета OLAP выбравшей технологию ROIAP, является фирма, специализирующаяся на продажах потребительских товаров для домашнего хозяйства S.C.Johnson Wax. "Более двух лет назад я искал средства, пригодные для работы с многомерными данными. Мы проанализировали продукты компаний Arbor, Cognos, всех крупных производителей. Но все равно продолжали испытывать трудности, в том числе связанные с недостаточным быстродействием и использованием специализированных структур", - рассказывает системный администратор этой фирмы Дэвид Талски. В конце концов, он остановил свой выбор на пакете Decision Support Systems Server, разработанном компанией MicroStrategy на базе технологии ROLAP При имеющихся на фирме 60 пользователях, Талски требуется всего два специалиста по обеспечению работоспособности инфраструктуры поддержки принятия решений.
С помощью технологии OLAP можно реализовать относительно недорогую среду поддержки принятия решений, при этом большинство соответствующих пакетов продается по цене примерно 600 долл. в расчете на один узел. Несмотря на это, по мнению аналитика из консалтинговой компании Patricia Seybold Group Уэйна Эккерсона, технология ROLAP имеет законное преимущество при работе на уровне подразделений или всего предприятия в целом. ROLAP дает пользователям возможность делать запросы к гораздо более емким хранилищам данных. При обработке размещенной на сервере информации объемом свыше 50 Гбайт продукты OLAP обычно работают со сбоями. Несмотря на то, что большинство крупных компаний накопили громадные базы данных, объемы которых исчисляются в гигабайтах и терабайтах, каждая компания должна оценить, какая часть этих данных действительно может быть "выужена" одним из запросов для поддержки решения.
Средства ОLАР также исчерпывают запас своих возможностей после некоторого количества одновременно используемых измерений - обычно порядка десяти. Это, в свою очередь, ограничивает число специальных запросов, которые пользователь может отправить за разумное время. Кроме того, средства OLAP имеют преимущество в быстродействии из-за дополнительного уровня в архитектуре сервера. В противовес этому DSS Server компании MicroStrategy, построенный на базе ROLAP, выполняет обработку SQL-запросов на уровне базы данных без промежуточного сервера. Однако, по мнению аналитиков, разница между OLAP и ROLAP, по-видимому, нивелируется по мере того, как производители заимствуют друг у друга наиболее сильные стороны продуктов. С этим замечанием согласны и многие производители.
"Вы можете увидеть, что соперничество между ROLAP и OLAP постепенно сходит на нет. Оно перемещается из сферы технологий в область приложений. Вы контролируете исполнение бюджета? Или анализируете оборот клиентов? Самый лучший совет, который можно дать, - досконально изучите природу будущих приложений, и только потом приобретайте соответствующие этим приложениям технологии", - говорит вице-президент по маркетингу из Pilot Software Джон Флеминг.
БОГАТСТВО ВЫБОРА
Выбор между OLAP и ROLAP осложнен тем, что число предложений заметно растет. "Кто знает, как будет выглядеть рынок через год? Я полагаю, что каждый новый участник рынка, каждая крупная компания, специализирующаяся в области баз данных, несомненно будет добавлять в свои СУБД возможности технологии OLAP", прогнозирует Рейден.
Действительно, ведущие производители СУБД Oracle и Informix недавно приобрели технологию поддержки принятия решений с тем, чтобы обеспечить возможности OLAP непосредственно в своих приложениях баз данных. Такое решение иногда называют "оперативной аналитической обработкой баз данных" (ROLAP database online analytical processing). Корпорация Oracle, первой среди поставщиков, готовится к началу будущего года анонсировать план по превращению своей системы управления реляционными базами данных Oracle Express в продукт OLAP-технологии.
Ряд производителей программного обеспечения класса клиент-сервер также вступают в конкурентную борьбу. Компания Hyperion Software недавно проглотила фирму Siner, производящую построенные на базе OLAP продукты, и планирует ввести интегрированную систему поддержки принятия решений в свое семейство финансовых приложений (архитектура клиент-сервер). В мае текущего года крупнейшая компания SAP AG, разработчик приложений в архитектуре клиент-сервер, объявила, что дополнит семейство R/3 своих бизнес-приложений функциональными возможностями поддержки принятия решений.
Однако, в последнее время в области ПО поддержки решений возник мощный фактор, стимулирующий новые разработки. Речь идет об Internet, влияние которой носит прямо-таки угрожающий характер. Напомним, что технология ROLAP присутствует на рынке в течение почти трех лет. Компаниям, ставшим адептами этой технологии в надежде на сокращение времени реакции системы на запросы, необходимо теперь добиться большей гибкости при доступе к очень большим базам данных. Сейчас эти компании пытаются воспользоваться фантастическими возможностями извлечения разрозненных данных, находящихся на серверах Internet.
"Похоже, что Internet станет основной причиной перемен в использовании новых типов данных. С точки зрения Internet или intranet, роль технологии локаторов данных URL и языка гипертекстовой разметки HTML эквивалентна роли языка SQL в реляционных базах данных. Ориентировочно в будущем году продукты на базе ROLAP можно будет использовать для извлечения неструктурированной информации", - считает Уингфилд из Giga Information Group.
Использование механизма OLAP для синтаксического разбора содержимого World Wide Web означает выход этой технологии на новые рубежи. "Сквозной поиск плохо подходит для гипертекста", - говорит Рейден. Он полагает, что сочетание средств традиционного анализа, основанного на извлечении данных, с гипертекстовыми связями, реляционными описаниями и другими видами информации приведет к созданию более продуктивного аналитического метода.
В соответствии с широко распространенным мнением, компании смогут предоставлять систему поддержки решений своему частному клиенту. Например, пользователь, работающий в маркетинговой компании, может приобрести право на доступ к определенному количеству полей и атрибутов специализированной базы данных компании, работающей с кредитными карточками, для сбора статистики о покупках, которые сделаны людьми, входящими в определенную демографическую группу в конкретном регионе страны. По мнению директора компании MicroStrategy по маркетингу Мэниша Ачариа, это смогло бы переместить позицию "хранилище данных" из расходной статьи балансового отчета компании в графу доходов. Недавно компания MicroStrategy выпустила продукт DSS Web, представляющий собой Web-интерфейс для системы ROLAP. Этот продукт позволит конечным пользователям получать доступ к хранилищам данных и приложениям поддержки принятия решений посредством стандартных браузеров Internet. Кроме того, одобренная компьютерной индустрией концепция поддержки принятия решений средствами Internet получила дальнейшее развитие. Компании NCR, Tandem Computers, Sun Microsystems и IBM объявили о поддержке интерактивного средства компании MicroStrategy.
Аналитики в целом одобряют подобные планы компаний. Некоторых администраторов информационных систем волнует ажиотаж вокруг Internet и большие надежды, возлагаемые на него как на громадное хранилище данных, в условиях, когда поддержка принятия решений для их компаний является жизненно важной основой конкурентоспособности. При этом администраторы ссылаются на остающиеся в силе ограничения на защиту информации в Internet и "техническую незрелость" этой глобальной сети.
"Мы оцениваем работу любой сети intranet исходя из того, как она поддерживает функции HTML. Однако остаются проблемы, связанные с защитой и доступом. Я не уверен, что сейчас мы обладаем для этого надлежащей технологией. И сомневаюсь, что Web сможет правильно обрабатывать наши требования к графическому интерфейсу пользователя в условиях развитого контекста", - говорит Тони Янг, старший специалист по приложениям из компании McKesson Water Products. Эта компания является подразделением корпорации McKesson, которая использует разработанный фирмой Planning Sciences инструмент поддержки принятия решений Gentia, основанный на OLAP-технологии.
СТРАТЕГИЯ ВЫБОРА ХАРАКТЕРИСТИК
Внедрение Internet-технологий в приложения поддержки принятия решений связано также с проблемой, неприятной для заказчиков, собирающихся в ближайшее время принять решения о покупках. В то время, как все ждут, что не успевшая одряхлеть парочка OLAP и ROLAP вот-вот распадется на большое количество вариантов, сверкающие вершины Internet затуманиваются ясными практическими решениями, основанными на понятных технических показателях.
Многие аналитики отрасли и представители фирм-производителей рекомендуют пользователям, собирающимся приобретать ПО поддержки решений, обращать внимание на тип (производственный или финансовый) приложения, с которым оно будет взаимодействовать. Более того, серьезными факторами являются быстродействие, гибкость запроса и способность использовать возможности уже установленных систем управления реляционными базами данных, и они должны также учитываться при принятии решения о покупке. Большинство аналитиков рекомендуют сравнивать текущие возможности с потенциалом Internet. Выясните, имеет ли на данный момент фирма-производитель системы поддержки решений привлекательную стратегию для Internet. Это придаст уверенность в том, что Ваши инвестиции в технологию размещены с учетом преимуществ, которые в дальнейшем предоставит Internet. "Я советую своим клиентам, при покупке продукта, ориентироваться на компанию. Побеседуйте с учредителями выбранных Вами компаний. Поговорите с другими заказчиками", - говорит Рейден.
"Иначе, если покупка действительно делается на пять лет, неправильное вложение инвестиций обойдется слишком дорого. Да, проверьте качество продуктов компании, а также стабильность выбранной ею стратегии. Конкретные характеристики почти всегда неуместны", продолжает он.
Не называйте это добычей данных
На первый взгляд может показаться, что инструментарий OLAP и ROLAP предлагает многое из того, что имеется в средствах добычи данных (data mining). На самом же деле многие люди совершают ошибку, смешивая эти продукты. Инструменты для добычи денных используют методы работы с естественными языками, нейросетями и нечеткой логикой и демонстрируют такую изощренность, которой технологии OLAP и ROLAP никогда не достичь.
Добыча денных, подобно OLAP и ROLAP, обеспечивает пользователей агрегированной информацией. Например, используя средства добычи денных, директор супермаркета с помощью базы денных о вечерних продажах может послать запрос для определения наиболее популярных товаров среди заказчиков, которые на завтрак покупают кашу.
Добыча данных функционально напоминает средства OLAP и ROLAP, однако отличается от них тем, что пользователи не должны определять тип результата. Используя в качестве иллюстрации приведенный выше пример, можно сказать, что OLAP требует от пользователя послать запрос на поиск покупок каши и зубной пасты, в то время как пользователям системы добычи денных необходимо только составить запрос на поиск товаров, наиболее часто раскупаемых вместе с кашей.
Из OLAP в DOLAP
OLAP (Online Analytical Processing) оперативная аналитическая обработка. OLAP дает пользователям возможность "перелопачивать" данные путем посылки запросов, содержащих несколько атрибутов. Для хранения предварительно "обсчитанных" многомерных данных OLAP использует промежуточный сервер. Это позволяет OLAP оперативно получать результаты на относительно постоянных наборах данных, которые по объему меньше, чем данные, обрабатываемые ROLAP.
ROLAP (Relational Onfine Analytical Processing) реляционная оперативная аналитическая обработка. Это инструмент для запроса данных, генерирующий SQL-команды к реляционным базам данных. Он допускает использование специально подготовленных запросов и обеспечивает агрегирование данных с более высокой скоростью, чем это делают обычные средства OLAP. Поскольку ROLAP не использует промежуточный сервер, он может работать гораздо быстрее с динамичными, постоянно изменяющимися данными. Он также может работать с более объемными наборами данных.
Database Online Analytical Processing (DOLAP) оперативная аналитическая обработка баз данных. DOLAP представляет собой механизм OLAP, непосредственно интегрированный с базой данных, который из всех рассматриваемых инструментов обеспечивает наиболее быструю обработку запросов. Он реализован, в частности, такими производителями реляционных СУБД, как Oracle и Sybase.
Oracle решила сразиться с SAP на чужом поле
Oracle явно подумывает над тем, чтобы расширить свое присутствие на рынке хранилищ данных и заняться в дополнение к продаже программных продуктов еще и консалтингом, в том числе и по проектам, в которых задействованы приложения R/3 компании-конкурента SAP AG. Именно соперничество и недостаточно длительный опыт знакомства с R/3 не позволяют Oracle, по словам официального представителя компании, осуществить вторжение на рынок консалтинговых услуг для пользователей приложений SAP. Однако в области приложений хранилищ данных и оперативной аналитической обработки данных (Online Analitical Processing - OLAP) такое противостояние вполне реально.