IBM работает на будущее

В DB2 появятся новые средства, избавляющие администраторов БД от рутинной работы

Патрисия Селинджер: «Мы пытаемся избавить администраторов БД от рутинных задач»

В лабораториях корпорации IBM ведутся работы по усовершенствованию платформы управления базами данных DB2. Особое внимание при этом, как недавно отметили представители IBM, уделяется вопросам хранения и интеграции данных, а также построения самонастраивающихся и самоуправляемых вычислительных систем с использованием DB2.

Цель проекта — превратить платформу DB2 в эффективное средство интеграции данных, получаемых из различных источников, в том числе из баз данных, созданных с помощью продуктов других производителей. Специалисты IBM также разрабатывают дополнительные функции самонастройки DB2 и стремятся обеспечить лучшую поддержку работы СУБД в grid-системах. (Последние представляют собой распределенные гетерогенные системы, объединенные вместе для формирования виртуального пула вычислительных ресурсов. — Прим. ред.)

Представители IBM подчеркивают, что их стратегия в отношении систем управления данными отличается от подходов Microsoft и Oracle. В корпорации отдают предпочтение так называемому федеративному подходу. В этом случае данные хранятся и при необходимости извлекаются из множества источников, в противоположность подходу конкурентов, предусматривающему размещение всей корпоративной информации на одной монолитной платформе.

Модуль DB2 Information Integrator уже позволяет компаниям получать доступ к данным из распределенных источников. Masala расширяет эти функции централизованной поддержкой обращения к ним. Integrator включает в себя функцию управления метаданными, позволяющую отслеживать информацию об интегрированных данных, и предлагает более быстрый доступ к распределенным данным. Все это, как считает директор IBM по вопросам информационной интеграции Нельсон Мэттос, позволяет компаниям принимать бизнес-решения на основе сведений, доставляемых практически в реальном времени. По его словам, пользователи могут получить новый продукт на бета-тестирование уже к концу этого года, а окончательная версия, возможно, будет выпущена в 2004 году.

В рамках инициативы IBM, посвященной самонастраивающимся вычислительным системам, создается модуль LEO (сокращение от Learning Optimizer) — программное обеспечение, которое отслеживает связи между наборами данных и затем на их основе оптимизирует выполнение запросов. Программу, к примеру, планируют наделить функцией удаления избыточности в запросах к базам данных — за счет использования знаний о том, как данные согласуются друг с другом. Как предполагается, встроенный модуль LEO появится в программных продуктах IBM в ближайшие год-полтора. Он может применяться в частности в средствах интеллектуальной поддержки бизнеса, например для выявления корреляций между предпочтениями пользователей при совершении покупок.

«LEO создается в рамках исследовательского проекта, в рамках которого мы предприняли попытку создать систему, анализирующую выполняемые запросы. Такой анализ должен приводить к ускорению выполнения данного или связанных с ним запросов. Программа анализирует, сколько строк было возвращено, и учитывает это в статистике, используемой оптимизатором для работы с будущими запросами», — объяснил Гай Ломан, менеджер по вопросам оптимизации исследовательского отдела научного центра Almaden Research Center компании IBM.

Проект IBM в области самонастраивающихся систем, как утверждают представители корпорации, должен освободить администраторов баз данных от выполнения большого количества трудоемких операций, которые могут и должны быть автоматизированы. «Мы пытаемся избавить администраторов от рутинных, однообразных и требующих времени задач и дать возможность заниматься тем, в чем они действительно незаменимы», — заметила Патрисия Селинджер, вице-президент по архитектурам и технологиям управления данными корпорации IBM.

В IBM рассчитывают, что платформа DB2 сыграет важную роль и в широком внедрении концепции корпоративных grid-вычислений. «Голубой гигант», по словам Лауры Хаас, менеджера IBM по разработке DB2 Information Integrator, планирует использовать для поддержки grid-систем свои технологии формирования федеративных данных, тиражирования, кластеризации и высокопроизводительных вычислений.

В IBM уверены, что дальнейшее развитие средств автоматизации работы с базами данных приведет к значительному уменьшению объемов рутинных работ, выполняемых человеком. Селинджер подчеркнула, что по мере расширения использования новых источников информации, таких как сенсорные сети, системы типа GPS, средства спутниковой фотосъемки и т.п., формирование баз данных все реже будет происходить с участием человека.