Под ред. Ави Зильбершатца, Майка Стоунбрейкера и Джеффа Ульмана

1. Введение
2. Достижения последних лет
3. Новые приложения баз данных
4. Тенденции, влияющие на исследования в области баз данных
5. Новые направления исследований
6. Выводы
Литература

Отчет о семинаре NSF "Будущее исследований в области баз данных", 26-27 мая 1995 года1).

1. Введение

В феврале 1990 г. группа исследователей в области баз данных собралась, чтобы обсудить направления будущего развития в этой сфере. Отчет семинара [Silberschatz at al., 1990] привлек внимание общественности к тому, насколько значимы проводимые изыскания, а также к ряду сложных и важных задач того времени. Мы не станем повторять здесь основные положения этого отчета, касающиеся исторического развития реляционных баз данных и систем обработки транзакций. Заинтересованного читателя мы отошлем к материалам семинара или к электронному документу [Gray, 1995], где рассматриваются исторические достижения в этих и других областях исследований, связанных с базами данных. В мае 1995 г. состоялся еще один семинар, на котором вновь обсуждались перспективы развития баз данных; настоящая статья представляет собой отчет об основных выводах, сделанных его участниками2). Эти выводы кратко сформулированы в следующих пунктах.

· Сообщество исследователей в области баз данных играет фундаментальную роль в создании технологической инфраструктуры развития баз данных.

· Грядущее поколение приложений баз данных потребует решения новых сложных исследовательских задач, которые в настоящем отчете сгруппированы в следующие обширные классы: поддержка мультимедийных объектов, распределенное хранение информации, новые виды приложений баз данных, управление транзакциями и потоками работ, простота управления базами данных и их использования.

· В связи с техническими достижениями последних лет, такими как быстрый рост емкости и мощности аппаратных средств, развитие коммуникаций (Internet и Всемирная паутина - WWW, мобильные коммуникации), возникают новые области исследований.

· Для успешного решения этих сложнейших проблем все более необходимой становится поддержка со стороны правительственных и коммерческих структур.

В оставшейся части этого раздела мы коротко охарактеризуем два основополагающих для данного отчета положения. Первое - радикально меняются требования, предъявляемые к системам баз данных, и, для того чтобы "вписаться" в новый прикладной ландшафт, необходимы новые подходы. Второе - сообщество исследователей в области баз данных имеет длительный опыт успешного поиска новых решений и их претворения в практические технологии. Таким образом, поддержка жизнеспособности и активности этих исследований за счет общественных ресурсов является разумным вложением средств.

1.1. Меняющийся мир баз данных

База данных - это компьютеризованная система ведения записей. Хотя ее фундаментальные компоненты - данные, аппаратное обеспечение, программные средства - остаются по существу теми же, однако объемы, мощность, спектр возможностей баз данных выросли неизмеримо.

За последние пять лет наблюдается тенденция к усложнению структур данных. Простые виды информации, представимой в форме чисел и текстовых строк, не утратив своей значимости, дополняются сегодня многочисленными мультимедийными документами, графическими образами, хронологическими рядами, процедурными, или активными, данными и мириадами прочих сложных информационных форм. Характерные примеры новых видов и источников данных можно найти в разд. 2.2, 3, 4.2, 4.4, 5.1 и 5.2.

Еще один важный фактор - широкое распространение дешевых высокопроизводительных компонентов, таких как мультипроцессоры на основе недорогих быстрых микропроцессоров. Ежегодно мы наблюдаем также рост емкости и снижение стоимости доступных и удобных в эксплуатации дисковых устройств и новых видов массовой памяти. В разд. 4.1 рассматривается влияние прогресса в сфере аппаратных средств на развитие баз данных.

В последние годы появилась целая плеяда весьма изощренных СУБД, поддерживающих новые коллекции данных и способных реализовать преимущества современных аппаратных средств. Обзор этих СУБД приводится в разд. 2.

Кардинальные изменения затрагивают не только вычислительную инфраструктуру; подобную же революцию претерпевает сегодня и сообщество пользователей. Едва ли не любое предприятие имеет в качестве своей органической составной части систему компьютерной обработки информации. Мир пронизан "нервными волокнами" разного рода электронных информационных коммуникаций - от свободно структурированной Всемирной паутины (WWW - World Wide Web, разд. 4.4) до поистине астрономической по своим масштабам Системы наблюдения Земли (разд. 3.1). Развитие и расширение пользовательского контингента информационных систем проиллюстрировано в разд. 3, 4.4, 5.3.

1.2. Что дают исследования в области баз данных

Главная цель настоящего отчета - глубоко и всесторонне аргументировать кардинальное значение исследований в области баз данных для всего развития современных информационных систем и показать, что финансирование таких исследований - это хорошо окупаемое вложение средств. Вторая цель - дополнить отчет 1990 г. материалами, подтверждающими целесообразность финансирования фундаментальных исследований в области баз данных. История изобилует примерами, иллюстрирующими связь между фундаментальными исследованиями, коммерческим успехом и практически значимыми результатами. Мы постоянно видим, как на основе теоретических построений формируются рабочие идеи, которые реализуются сначала в экспериментальных прототипах, а потом и в коммерческих продуктах.

Мы начнем (разд. 2) с рассмотрения некоторых областей, где исследования, начавшиеся десять, а иногда и более лет назад, стали находить отражение в программных продуктах начала 90-х годов. В этом разделе наглядно демонстрируется отдача, получаемая от инвестиции в данную сферу. В разд. 3 дается обзор новых типов приложений, которые определят направление будущих исследований. В разд. 4 обсуждается технологические, деловые, общественные тенденции, которые окажут влияние на ход и направление исследований. В разд. 5 сформулированы наиболее важные, по убеждению участников семинара, задачи, стоящие перед специалистами в области баз данных. В разд. 6 содержатся некоторые заключительные замечания и выводы.

2. Достижения последних лет

С 1990 г., когда был опубликован отчет о предыдущем семинаре, в развитии баз данных достигнуты новые серьезные успехи. Наибольшую активность на рынке баз данных проявляют компании США; предлагаемые ими продукты опираются на результаты исследований и экспериментальные работы, выполненные при финансовой поддержке государственных агентств. В этом разделе приведен обзор некоторых достижений последних лет.

2.1. Объектно-ориентированные и объектно-реляционные СУБД

В 1990 г. существовало лишь несколько экспериментальных прототипов объектно-ориентированных систем баз данных (OODB - object-oriented database). Тогда еще только велись дебаты о сущности таких систем и их взаимоотношении с реляционными СУБД. Сегодня уже существует множество коммерческих OODB; годовой объем продаж их составляет $75 млн. при ежегодном приросте 50%.

Аналогичным образом в 1990 г. имелось лишь несколько экспериментальных образцов СУБД, сочетавших лучшие черты реляционных и объектно-ориентированных баз данных (доступ к простым данным на основе SQL и объектное моделирование сложных типов данных). Они послужили источником для СУБД новых поколений - объектно-реляционных (ORDB - object-relational database) и дедуктивно-объектно-ориентированных (DOOD - deductive-object-oriented database) систем. Таким образом, сегодня эти идеи уже воплотились в реальных технологиях и привели к созданию новых рынков. Более того, и поставщики традиционных РСУБД начинают развивать свои продукты в этих направлениях.

2.2. Поддержка новых типов данных

В отчете 1990 г. отмечалось, что новые приложения могут потребовать таких типов данных, которые не сводятся к простым записям из чисел и текстовых строк. Итоги исследований альтернативных информационных форм нашли отражение в ряде коммерческих продуктов последних лет.

· Результаты более чем десятилетних усилий по выработке способов хранения и обработки пространственных данных воплотились ныне в коммерческих геоинформационных системах (GIS - geographic information system).

· Длительные поиски адекватных моделей для представления хронологических данных вылились в ряд серьезных предложений по расширению языков запросов и включению в них поддержки этого типа данных. Одно из таких предложений нашло признание в рамках проекта TSQL2, являющегося расширением стандарта SQL-92.

2.3. Обработка транзакций

Коренная функция любой СУБД - координация совместной работы множества пользователей с разделяемой информацией. В отчете 1990 г. отмечалось, что одним из важнейших достижений 70-х - начала 80-х годов явилась выработка четкого определения понятия транзакции. Тем не менее для современных распределенных информационных систем традиционные способы обработки транзакций не всегда оправданы. Изыскания в области стратегий и алгоритмов поддержки альтернативных, не атомарных форм транзакций, начавшиеся в 70-х годах, приносят сегодня ощутимые результаты.

· Некоторые коммерческие продукты поддерживают репликации данных, обеспечивая согласованное состояние информации в разных узлах сети.

· Некоторые объектно-ориентированные системы поддерживают так называемые "длительные транзакции", когда данные могут изыматься из обращения (check out) на период от нескольких часов до нескольких дней.

· Некоторые коммерческие СУБД поддерживают понятия "версий и конфигураций", т.е. обладают средствами для хранения исторических состояний (версий) объекта и для построения "конфигураций" из заданных версий нескольких объектов. Эти возможности, наряду с "длительными транзакциями", важны для поддержки различных видов проектирования, в том числе проектирования программного обеспечения.

3. Новые приложения баз данных

Для того чтобы обосновать предлагаемый нами список первоочередных исследовательских задач (разд. 5), мы проиллюстрируем их на примерах некоторых приложений нового поколения, которые определяют потребности в новых средствах и возможностях. Мы рассмотрим кратко пять таких приложений.

3.1. База данных Системы наблюдения Земли (EOSDIS)

Система наблюдения Земли (EOS - Earth Observing System) представляет собой множество спутников, которые будет запускать NASA начиная с 1998. Их назначение - сбор информации, необходимой для исследователей, занятых изучением долгосрочных тенденций состояния атмосферы, океанов, земной поверхности. Спутники будут поставлять информацию в объеме 1/3 Пбайт (Petabyte - 1015 байт) в год.

Предполагается, что эти данные будут интегрироваться с уже существующей информацией, а также с данными из других источников (зарубежные спутники, наземные станции наблюдения) и накапливаться в базе данных EOSDIS (EOS Data and Information System) невиданных прежде масштабов.

EOSDIS предназначена для информационного обслуживания как специалистов, так и неспециалистов. Предполагается, например, что доступ к ней будут иметь даже школьники, которые смогут знакомиться с моделями формирования погодных условий, с воздействием вулканических явлений и т.п. Вот наиболее сложные задачи, возникающие в связи с этим проектом.

· Оперативный доступ к базам данных объемом порядка мегабайт, эффективное управление третичной памятью.

· Поддержка многих тысяч потребителей информации с огромной интенсивностью и объемом запросов, которые могут иметь как произвольный, так и регламентированный характер (как, например, ежедневное обновление данных).

· Выработка эффективных механизмов просмотра и поиска интересующей информации.

3.2. Электронная коммерция

В настоящее время существует ряд проектов, общая цель которых - предоставить потенциальным потребителям оперативный доступ к каталогам товаров с последующим электронным оформлением покупок. Предполагается, что возможным промежуточным звеном подобных систем будет электронный брокер. Брокеры аккумулируют данные из множественных источников путем сбора информации, например, из нескольких каталогов предметов одежды. Конечному покупателю такой брокер предложит оперативное оформление покупок.

Как и проект EOSDIS, система электронной коммерции предполагает сетевое взаимодействие огромного числа участников торговых сделок. Разница заключается в том, что в EOSDIS имеется один главный поставщик информации и множество ее потребителей, а торговая система подразумевает наличие множества поставщиков и множества потребителей. Кроме того, участники в данном случае могут испытывать определенное взаимное недоверие и, возможно, имеют свои частные закрытые информационные системы. Наиболее сложные проблемы, связанные с проектами этого рода, следующие.

· Интеграция и согласование разнородных информационных источников. Например, нечто, называемое "коннектором" в одном каталоге, может называться иначе в каталоге другого поставщика. Это хорошо известная и очень трудная задача "интеграции схемы".

· Система электронной коммерции должна иметь высоконадежные средства распределенной аутентификации и перевода денежных сумм.

3.3. Информационная система здравоохранения

Врачу в процессе работы необходим доступ к множеству источников информации. Например, истории болезни одного пациента могут находиться в разных больницах, клиниках, страховых учреждениях. Для получения полной картины их все следует собрать. Точно так же существует множество систем и баз данных, предоставляющих информацию о лекарствах, лечебных процедурах, диагностических средствах.

Записи лечащего врача, результаты обследований, информация о счетах за лечение, договора медицинского страхования для каждого пациента должны фиксироваться в электронной форме и оставаться доступными для последующего использования. Внедрение современных информационных технологий в области здравоохранения окажет кардинальное воздействие на такие характеристики медицинского обслуживания, как стоимость, качество, повсеместная доступность. Вот ряд проблем, которые возникают в связи с реализацией подобной системы.

· Интеграция разнородных источников уже накопленной информации.

· Средства контроля доступа, обеспечивающие необходимый уровень конфиденциальности.

· Интерфейсы доступа к информации, удобные для разных категорий работников здравоохранения.

3.4. Электронные публикации

В издательском бизнесе, как и в сфере здравоохранения, ожидается в ближайщем будущем ряд глубоких перемен. Становится возможным, например, хранение книг и статей в электронном виде и оперативная доставка их потребителям по высокоскоростным сетевым каналам. Далее, само понятие публикации существенно расширяется - документ может содержать графические, аудио- или видеовключения, аннотацию, другие сопроводительные элементы. Общий объем информации, которая доступна уже сегодня, превышает размеры базы данных EOSDIS, а в ближайшем будущем ожидается его рост примерно на порядок.

Естественным следствием этих перемен станет сближение издательской и образовательной сфер. Место "живых" лекций, читаемых для небольшого числа студентов, займут "образовательные продукты" - электронные документы, состоящие из текстовых, аудио- , видео- и других компонентов и включающие элементы интерактивного тренинга. Такой продукт сможет удовлетворить потребности огромного числа студентов. В связи с этими перспективами можно обозначить следующие направления исследований.

· Обработка и пересылка очень больших объемов данных с высокой скоростью. Типичный документ содержит объекты данных размером в диапазоне от мегабайт до гигабайт и может требовать доставки в режиме реального времени.

· Защита интеллектуальной собственности. Подразумевается взимание небольших денежных сумм за пользование информацией, запрет на ее перепродажу.

· Организация огромных объемов информации и обеспечение доступа к ним.

3.5. Коллективное проектирование

Крупные и сложные проекты, например в области самолетостроения, реализуются сегодня объединенными усилиями нескольких независимых компаний. Время жизни информации, относящейся к подобным проектам, может измеряться десятилетиями, поскольку она необходима для поддержки, модификации и развития. Конструкторские решения, прежде чем стать физической реальностью, могут проходить стадии компьютерного моделирования - для исследования рабочих свойств, удобства сборки изделий, правильности функционирования. Эволюция конструкторских схем начинается задолго до выпуска первого изделия и продолжается еще долгое время после этого, что приводит к разрастанию информационной конфигурации, которая должна отражать текущее состояние разработки, экспериментальные версии, историческое развитие. Для разных сфер конструирования характерно использование разнородных конструкторских инструментальных систем, основанных на разных моделях и системах обозначений. Причем процесс конструирования может продолжаться дольше, чем существуют применяемые инструменты, а значит, компоненты одной и той же конструкции могут разрабатываться с применением разных версий инструментальной системы. Таким образом, в связи с электронным проектированием можно сформулировать следующие задачи.

· Как и в некоторых из упоминавшихся ранее сфер, здесь также встает задача интеграции разнородных источников исторически накопленной информации.

· Коллективное проектирование требует новых форм управления совместным доступом к базам данных и механизмов разделения информации.

· Для регулирования совместно выполняющихся разнородных процессов, таких как моделирование и конструирование, необходимы средства управления потоками работ, основанные на четко определенных взаимодействиях посредством долговременных транзакций.

· Исключительно важна поддержка версий компонентов и средства для восстановления согласованных конфигураций из множества компонентов, см. разд. 5.3.3.

4. Тенденции, влияющие на исследования в области баз данных

Прежде чем перейти к формулированию важнейших исследовательских задач в области баз данных, мы рассмотрим ряд тенденций, значимых для этой сферы. К ним относятся тенденции в развитии аппаратных средств, новые подходы к организации самих баз данных, деловой и научный климат, технологии WWW.

4.1. Развитие аппаратных средств

Вот уже в течение пятидесяти лет наблюдается экспоненциальный рост основных параметров вычислительных средств. Каждый из перечисленных ниже показателей за десятилетие улучшается в десять и более раз:

· количество машинных команд, выполняемых в секунду;

· стоимость типичного процессора;

· стоимость единицы вторичной памяти;

· стоимость единицы оперативной памяти.

Благодаря столь быстрому улучшению соотношения цена/производительность для наиболее критичных компонентов, каждые несколько лет мы приобретаем возможности для решения новых классов задач, создания принципиально новых приложений и услуг, которые прежде находились за пределами реального.

Ожидается, что эти тенденции не ослабеют и в будущем столетии. Более того, в последние годы эта мощная спираль развития получила дополнительную динамику за счет еще двух важнейших параметров, совершенствование которых приобрело в последние годы невиданное ускорение:

· стоимость пересылки одного бита информации;

· число бит, пересылаемых в секунду.

Таким образом, сегодня мы имеем среду, где можно экономически эффективно реализовать сложнейшие запросы, манипулирующие с терабайтами данных.

4.2. Развитие архитектур баз данных

В сфере организации и способов применения баз данных также наблюдаются, хотя и не столь впечатляющие, как в сфере аппаратных средств, но все же весьма значительные перемены.

· Если к 1990 г. реляционные СУБД еще только начинали отвоевывать основные позиции, то сегодня они применяются практически повсеместно. РСУБД лежат ныне в основе приложений, спектр которых варьируется от крупнейших, выполняемых на мощных параллельных компьютерах типа NCR 3600, до настольных, работающих на домашних ПК.

· Архитектура клиент-сервер за последние пять лет распространилась со среды файловых систем на приложения баз данных. Ожидается, что прогресс в этом направлении будет продолжаться, и удаленный сетевой доступ к серверам баз данных станет общепринятым.

· Традиционные структуры записей данных, характерные для РСУБД, дополняются сегодня разноообразными видами "мультимедийных" данных. Именно эта тенденция определила успех ORDB и заставляет поставщиков РСУБД совершенствовать свои продукты, включая в них поддержку более развитых моделей данных. Таким образом, чисто реляционные СУБД станут в ближайшем десятилетии тем, что мы называем "унаследованными системами".

4.3. Деловой и научный климат

Экономика научных исследований за последние пять лет претерпела значительные изменения. Корпорации, которые традиционно поддерживали фундаментальные исследования, вынуждены сократить финансирование этой сферы в связи со снижением прибыльности многих видов продуктов и сервиса. Произошла переориентация инвестиций в пользу более краткосрочных исследовательских проектов, направленных на создание не экспериментальных прототипов, а на непосредственное удовлетворение потребностей рынка. Аналогичная переориентация наблюдается и в деятельности правительственных агентств, которым также приходится вкладывать средства, в основном, в краткосрочные проекты, предполагающие быструю отдачу.

В то же время у нас есть основания полагать, что значение исследований в области баз данных позитивно оценивается в правительственных и деловых кругах. Так, в [Toole and Young, 1995], в отличие от более ранних документов такого типа, информационным системам отводится первостепенная роль в списке перспективных исследовательских направлений. Рост информационно-емких отраслей индустрии и значимость повышения эффективности всех видов бизнеса - эти два фактора ставят развитие технологий баз данных едва ли не во главу угла корпоративных интересов.

Тенденции промышленных исследований в сфере баз данных, хотя и противоречивы, имеют тем не менее ряд позитивных моментов. Многие компании, которые за последнее время реструктурировали свои исследовательские подразделения, предпочли сохранить или даже расширить объем изысканий в области баз данных. Некоторые компании ограничили свои интересы лишь изучением баз данных, имеющих статус продуктов, оказавшись фактически вне исследовательского сообщества; в то же время другие компании, не рассматривавшие прежде базы данных как центр своих интересов, начали активно создавать подразделения по исследованиям в области СУБД.

4.4. Информационная супермагистраль проходит через вашу квартиру

Ни одна дискуссия футурологического толка не обходится без разговоров о Всемирной паутине WWW. Пока идут разговоры о природе "Информационной супермагистрали" или "Национальной информационной инфраструктуре", Паутина - неформальная совокупность взаимосвязанных и распределенных в сети документов - разрастается поистине астрономическими темпами. Число бит, пересылаемых по каналам WWW, увеличивается на 15-20% в месяц, что соответствует десятикратному годовому росту.

Число активных пользователей WWW в США превышает, по некоторым оценкам, 10% населения. Если исходить из скорости распространения аналогичных технологий типа VCR или аудио CD, то можно предположить, что через несколько лет пользователями Internet станет подавляющее большинство населения. За эти годы на несколько порядков возрастет объем информации, доступной через Internet. Следует ожидать, что регулярный доступ к данному источнику информации станет насущной потребностью каждого индивидуума.

Базы данных и связанные с ними технологии должны сыграть ключевую роль в этом информационном взрыве. Уже сегодня "Web-мастера" (администраторы узлов WWW) осознают себя фактически администраторами баз данных. На многих узлах WWW начинают применять технологии баз данных, не видя другой возможности держать под контролем растущее число хранимых объектов. Многие вновь возникающие узлы представляют собой, в сущности, аналоги приложений баз данных по типу электронных каталогов, где WWW играет роль инфраструктуры.

5. Новые направления исследований

На том фоне, который был кратко обрисован выше, наиболее важными для реализации новых поколений прикладных систем представляются, по мнению участников семинара, следующие исследовательские задачи. Мы разделили их на пять обширных категорий.

· Проблемы включения мультимедийных объектов в базы данных.

· Новые парадигмы распределенного хранения информации.

· Новые области применения баз данных.

· Новые модели транзакций.

· Простота использования баз данных и управления ими.

5.1. Поддержка мультимедийных объектов

Взрывообразный рост WWW, задачи EOSDIS, электронной коммерции, электронных публикаций ставят ряд сложных проблем, которые должны быть решены в будущих системах баз данных. Важнейшие направления исследований, связанные с поддержкой мультимедийных объектов, рассматриваются в следующих пунктах.

5.1.1. Третичная память

Для хранения мультимедийных объектов необходимы огромные объемы внешней памяти. Как упоминалось в разд. 3, для приложений типа EOSDIS или электронных библиотек характерны объемы данных порядка петабайт. Несмотря на экспоненциальный рост емкости дисковых устройств, для размещения подобных объемов данных вряд ли можно в ближайшем будущем обойтись только магнитными или магнитооптическими дисками. В результате встает проблема эффективного управления новым уровнем иерархии носителей, называемым третичной (tertiary) памятью. На третичном уровне используют носители на несколько порядков более медленные, чем на вторичном, но зато и гораздо более емкие. Устройства третичной памяти - это накопители типа стоек с компакт-дисками или магнитными лентами, где для установки нужной кассеты или ленты используется механическая рука.

В сущности доступ к третичной памяти осуществляется путем буферизации выбранных элементов данных на вторичных носителях, подобно тому, как доступ к вторичной памяти осуществляется путем буферизации дисковых блоков в оперативной памяти. Но объемы и пропорции данных здесь совершенно иные, и подходы к оптимизации обменов между вторичным и третичным уровнями существенно отличаются от методов оптимизации обменов между вторичной и оперативной памятью. В качестве примера, иллюстрирующего эту разницу, рассмотрим задачу поиска информации. Сегодня в качестве третичного носителя используются, в основном, кассеты с магнитными лентами. Здесь приходится учитывать не только то, что скорость считывания данных с ленты (секунды) на три порядка ниже, чем с диска (миллисекунды), но и то, что нахождение нужных данных в середине кассеты может увеличить время доступа еще на 1-2 порядка. Время доступа к данным на диске, напротив, мало зависит от их положения. Таким образом, при хранении данных на ленте необходимо решать задачу их оптимального размещения, в то время как для диска этот фактор не имеет значения.

5.1.2. Новые типы данных

Каждый вид мультимедийной информации (тип данных) требует собственного набора операций и функций и их эффективной реализации на основе соответствующих структур данных и методов доступа. В качестве простого примера рассмотрим недавнее экспериментальное тестирование объектно-ориентированных СУБД, где было отмечено огромное расхождение в эффективности обработки больших текстовых объектов. Задачу выборки последнего байта из текстовой строки длиной в мегабайт одни системы решали путем считывания сначала всего текста с последующим применением операции "взять последний байт", другие проявляли способность считывать непосредственно нужный байт или считывали предварительно лишь небольшой хвостовой участок строки. Тщательного осмысления в связи с этим требуют следующие задачи.

· Набор операций для мультимедийного типа данных, издержки их реализации.

· Интеграция данных, содержащих несколько таких типов.

5.1.3. Качество сервиса

С доставкой мультимедийных данных сразу нескольким пользователям связан ряд сложных проблем. Если объем данных велик, легко могут возникнуть узкие места в обсуживании. В то же время доступ к большим мультимедийным объектам осуществляется, как правило, предсказуемыми способами. Например, видеосервер, доставляющий фильм на несколько домашних видеосистем, может исходить из предположения, что запрос на последовательный просмотр со стандартной скоростью будет оставаться в силе, пока пользователь не нажмет кнопку "стоп". Предсказуемость позволяет оптимизировать реализацию запросов, причем подобные предположения обычно достаточно хорошо оправдываются.

Доставка мультимедийной информации во многих случаях должна удовлетворять довольно жестким ограничениям. Так, видеофильм должен доставляться со стандартной скоростью, иначе будет наблюдаться мигание и задержки кадров. Еще более жесткие ограничения накладываются на процесс доставки аудиоинформации, ассоциированной с фильмом. Если неравномерность доставки видеокадров можно компенсировать за счет алгоритмов интерполяции, которые дают достаточно хороший эффект, то для аудиоданных это невозможно. Ситуация усложняется еще и тем, что разные типы аудио- и видеоинформации обладают разной степенью "терпимости" к погрешностям воспроизведения. Так, для видеокурса лекций допустимой может быть скорость доставки 1 кадр в секунду и ниже, поскольку значимым здесь является только изображение записей, которые лектор делает на доске, или слайдов, которые он показывает.

Эти примеры иллюстрируют задачу исследования "качества сервиса". Предполагается, что с каждой формой мультимедийных данных должен быть связан набор опций, позволяющих ответить на следующие вопросы.

1. Как обеспечить своевременное и реалистичное представление данных в естественной для них форме?

2. Если система не в состоянии обеспечить ожидаемое качество сервиса, то каковы допустимые способы частичной компенсации? Возможна ли интерполяция или экстраполяция отдельных видов данных? Следует ли отвергать вновь поступающие запросы и нужно ли отменять уже принятые?

5.1.4. Запросы с нечеткими критериями

Запросы к базе данных традиционно оперируют с четкими понятиями, например: "каков пункт назначения рейса номер 233?" или "каково значение баланса на счете номер 45678?". Новые типы приложений должны уметь работать с запросами, включающими нечетко определенные понятия, которые позволяют находить наилучшее доступное значение из недетерминированного множества слабо интегрированных ресурсов. Если, допустим, нам хотелось бы получить снятое со спутника изображение заданного района в заданное время, то следует запросить у EOSDIS "наилучшее" в каком-то смысле приближение. Возможно, это будет изображение, включающее данный район и наиболее близкое по времени к интересующему моменту. Для этого необходимо выработать новые языки запросов или усовершенствовать существующие, включив в них в качестве базовых такие понятия, как степени свободы и желаемая точность приближенного результата.

Имеются экспериментальные системы, которые умеют выбирать из базы данных графические образы на основе таких нечетких характеристик, как цвет, форма, текстура. Системы этого типа потенциально способны по нечеткому описанию содержимого производить выборки в среде графических образов, аудио- и видеоинформации, подобно тому, как существующие системы позволяют выбирать текстовые или числовые данные по значению какого-либо поля. Но реально здесь необходим еще значительный объем исследований.

5.1.5. Поддержка пользовательских интерфейсов

SQL и надстраиваемые над ним языковые формы более высокого уровня хороши для доступа к традиционным записям данных. Когда речь идет о мультимедийных данных, то здесь часто необходимы совершенно другие формы пользовательских интерфейсов, и СУБД должны их поддерживать. Так, запросы географических данных (карт) удобнее всего формулировать, указывая интересующий район на схеме материка (страны, города и т. п.), изображенной на экране, и очень сложно, если не невозможно, сформулировать такой запрос в терминах SQL. Для упоминавшихся в разд. 5.1.4 баз данных графических образов необходимы интерфейсы, позволяющие задавать цвета, формы и другие характеристики изображения. С каждым типом мультимедийных данных связана проблема создания простых средств для формулирования запросов.

В связи с мультимедийными видами информации возникает также проблема разработки новых средств для просмотра, поиска, визуализации содержимого баз данных. Например, курс лекций может содержать десятки часов видеоматериала. Естественно, хотелось бы иметь способы быстрого просмотра, чтобы решить, стоит ли этот курс заказывать, или чтобы отыскать в нем, скажем, десятиминутный или часовой фрагмент по интересующей теме. Нужны соответствующие методы доступа, и здесь возможны самые разные подходы - это могут быть наборы ключевых кадров, текстовые индексы, средства поиска сегментов, обладающих заданными характеристиками.

Еще один пример - снимки, полученные со спутников. Как правило, их объем велик, и передача множества снимков, среди которых пользователь будет искать нужные ему, требует слишком много времени. Здесь может помочь выборка фрагментов, содержащих существенные элементы исходных снимков. В результате человек получает возможность быстро просмотреть большое число изображений и отобрать то, что его интересует, например снимки вулканических выбросов.

Приведенные здесь примеры можно экстраполировать и на другие ситуации, когда необходимо предоставить пользователю средства для быстрой и эффективной визуализации содержимого больших объектов данных. Это одна из важнейших задач, которые должны быть решены в СУБД следующих поколений.

5.2. Распределение информации

Как уже упоминалось, WWW - это распределенная среда, состоящая из автономных систем, узлы которой все чаще формируются как реляционные базы данных. Точно так же пользование электронными публикациями предполагает наличие распределенной системы, причем с довольно низкой степенью доверия между клиентом и сервером. Хотя исследовательское сообщество весьма интенсивно занималось вопросами распределенных баз данных, и плоды этих усилий находят отражение в коммерческих продуктах, тем не менее новая среда, возникшая в рамках WWW, заставляет переосмыслить многие концепции в области распределенных баз данных. В настоящем разделе обозначены основные направления исследований в этой сфере.

5.2.1. Степень автономности

Базы данных и другие источники информации, связанные посредством сети, зачастую принадлежат разным владельцам. Примерами такой ситуации могут служить распределенная информационная система здравоохранения (разд. 3.3), распределенные системы проектирования (разд. 3.5), а также WWW. Автономность участников распределенной системы создает множество специфических проблем в организации баз данных.

В распределенной системе необходимо предусмотреть ситуации, когда отдельные партнеры отвергают запросы на подключение. При этом партнеры могут использовать системы с разными возможностями. Например, в системах проектирования наилучшим способом поддержки согласованности будут распределенные ограничения или активные правила, возбуждающие проверку условий, которые могут охватывать нескольких партнеров. Как обеспечить соблюдение необходимых условий, если отдельные участники не имеют или не хотят использовать в своих системах механизм активных правил?

5.2.2. Механизмы учета и выписки счетов

В локально автономных системах сервер может, в уплату за предоставление сервиса, потребовать перечисления определенной денежной суммы. В прежних распределенных СУБД предполагалось, что вся информация является собственностью одной корпорации, и этот "неудобный" вопрос не возникал.

В среде, где информация является предметом продажи, необходима реализация новых стратегий для "измерения" услуг и взимания с пользователей определенной небольшой суммы за каждый доступ к удаленным данным. Эффективный сбор таких средств также составляет предмет исследований. Разумеется, нецелесообразно тратить рубль на то, чтобы получить с пользователя копейку.

Еще один интересный вопрос - выработка стратегий реализации запросов с учетом их денежной стоимости. Допустим, вас интересует библиография публикаций о динозаврах. Местный музей предоставляет информацию бесплатно, но она может быть менее полной, чем та, которой располагает коммерческая библиографическая служба. Желательно, чтобы механизм реализации запросов учитывал плату, взимаемую разными источниками, и использовал бы, в первую очередь, бесплатные источники. Предположим, что после извлечения бесплатных данных запрос к дорогостоящему источнику был бы сформулирован следующим образом: "Пришлите список всех публикаций о динозаврах, за исключением следующих 2000, о которых мне известно: ..." Логично предположить, что коммерческая служба отвергнет подобный запрос, реализация которого потребует больших затрат ресурсов, а результат, скорее всего, окажется мизерным или пустым, и плата за него будет невелика (что, впрочем, зависит от алгоритма вычисления стоимости). Задача исследователей - выработка согласованных механизмов ценообразования, сервисных политик, алгоритмов оптимизации с учетом цен, алгоритмов обработки счетов за обслуживание.

5.2.3. Безопасность и право собственности

В распределенных системах, включающих автономных партнеров, необходимы средства защиты информации. Во многих случаях это нужно для обеспечения конфиденциальности персональных данных. Так, информационная система здравоохранения должна беспрепятственно предоставлять информацию о пациенте его лечащему врачу, но обязана защитить ее от несанкционированного доступа. В других случаях необходимость защиты связана с коммерческой ценностью данных. Примеры - распределенное проектирование (разд. 3.5), электронные публикации (разд. 3.4). Можно выделить следующие важные направления исследований.

1. Разработка гибких систем аутентификации и предоставления санкций, поддержка доступа на основе понятия "роли" пользователя. Так, один и тот же индивид может выступать в роли лечащего врача некоторого пациента, в роли "врача вообще", в роли частного лица.

2. Выработка механизмов для продажи информации большому числу пользователей, не идентифицируемых продавцом.

5.2.4. Репликация и согласование данных

Фундаментальная проблема управления распределенной базой данных - выработка способов функционирования в ситуации, когда сеть распадается на две или более несвязанные группы узлов. Когда врач садится в самолет, имея при себе историю болезни своего пациента, он должен иметь возможность вносить в нее записи, т.е. изменять содержимое базы данных, несмотря на то, что он отключен от сети, пока находится в самолете.

Разумеется, компоненты базы данных, связь между которыми сохраняется, должны продолжать функционировать независимо наилучшим возможным способом. Запросы на выборки и модификации данных, затрагивающие доступные узлы, будут выполняться, а остальные - отвергаться.

Из соображений эффективности данные часто тиражируются на нескольких узлах. Когда все эти узлы связаны сетью, можно поддерживать идентичность копий. В ситуациях, когда связь нарушается, в копиях могут появиться различия. После восстановления связи должен включаться механизм согласования, который формирует некоторую копию, отражающую все сделанные изменения.

С точки зрения традиционных распределенных баз данных, рассоединение сети - случай исключительный, аномальный, поэтому процесс восстановления и согласования данных мог быть сложным и занимать относительно много времени. В новой информационной среде, как показывает приведенный выше пример, подобные ситуации становятся уже не исключением, а нормой. Отсюда необходимость создания быстрых протоколов и алгоритмов согласования.

Отметим также, что, в связи с растущей зависимостью производственных процессов от информационных систем, для многих приложений необходимым требованием становится стопроцентная доступность, или, как это иногда обозначают, "доступность 7х24" (7 дней в неделю х 24 часа в сутки). Некоторые проблемы повышения надежности решаются за счет совершенствования аппаратных средств. Однако в среде баз данных для повышения доступности необходимо исследование новых репликационных схем, обеспечивающих идентичность копий данных и корректное функционирование системы в условиях отказа отдельных компонентов.

5.2.5. Интеграция и преобразование данных

Крупные информационные системы типа системы поддержки здравоохранения, рассмотренной в разд. 3.3, подразумевают взаимодействие информационных ресурсов, в основе которых лежат самые разные форматы и модели представления данных. По-видимому, подобные системы должны иметь в качестве центрального звена некоторую интегрирующую модель и соответствующие нотации. Каждый источник данных должен быть погружен в специальный компонент, транслирующий данные между частным представлением и глобальным представлением, принятым в данной среде. На основе этих "погруженных" источников затем могут создаваться прикладные продукты более высокого уровня.

С проблемой преобразования и интеграции данных связано множество вопросов.

1. Какой должна быть интегрирующая модель?

2. Какой инструментарий необходим, для того чтобы сделать использование произвольных источников данных столь же простым, как работу с индивидуальными базами данных?

3. Как расширить идею словаря данных, чтобы обеспечить корректное использование терминологии в среде, состоящей из интегрированных гетерогенных источников? Эта проблема, по существу, совпадает с "онтологической задачей" искусственного интеллекта.

4. Один из подходов к проблеме комбинирования разнородных источников информации состоит в применении "медиаторов", компонентов, которые могут производить настраиваемую интеграцию, возможно, с дополнительной фильтрацией или обработкой. По своей роли они аналогичны "агентам" в задачах искусственного интеллекта. Как лучше всего применить здесь этот подход - еще один предмет для исследований.

5.2.6. Поиск и выборка данных

Естественно предположить, что все больше и больше информации можно будет получать по каналам системы WWW, которая представляет собой множество неформально связанных ресурсов Internet. Неформальность и распределенный характер управления в среде WWW представляют разительный контраст в сравнении со структурированностью и управляемостью, характерными для современных распределенных баз данных. Подобная среда еще раз подтверждает важную роль инструментов для интеграции гетерогенных информационных ресурсов, которая отмечалась в отчете [Silberschatz at al., 1990].

Природа WWW служит источником ряда новых проблем, а также примеров, которые иллюстрируют крайние случаи многих проблем, связанных с гетерогенной информационной средой.

· Данные с нечеткой схемой, которая может произвольно меняться, или с нерегулярной структурой.

· Данные, не имеющие четкого определения, с неизвестной степенью достоверности.

· В рамках технологий СУБД выработаны эффективные механизмы индексации и другие средства поддержки поиска для хорошо структурированных данных; очевидно, что подобные механизмы следует расширить и адаптировать к неструктурированному миру WWW.

5.2.7. Качество данных

В силу ненадежности механизмов ввода информации всегда существовала проблема правильности содержимого баз данных. В приложениях новых типов информация часто генерируется путем комбинирования сведений из разных источников, степень надежности которых различна. Следовательно, необходимы методы для оценки достоверности полученной таким образом информации. Нужны также средства для опроса достоверности или происхождения (описания источника или источников) данных. В идеале понятия достоверности и происхождения должны стать базовыми для новых языков запросов.

5.3. Новые применения баз данных

Традиционно базы данных использовались как основа для приложений обработки данных в сфере бизнеса, и основные направления исследований были ориентированы именно на этот класс приложений. В последнее время образовались новые важные области применения баз данных, и каждая из них представляет принципиально новую среду, к которой необходимо адаптировать технологии баз данных. Эти области получили названия "добыча данных", хранилища данных, репозитарии данных, и следующие разделы посвящены их обсуждению.

5.3.1. Добыча данных

Идея добычи данных, т.е. извлечения информации из огромных массивов данных, накопленных, возможно, совсем для других целей, вызывает сегодня повышенный энтузиазм. Например, авиакомпании добиваются оптимального заполнения рейсов, за счет исследования накопленных ранее данных о резервировании билетов. Можно привести еще одну совершенно замечательную историю о том, как была обнаружена неожиданная корреляция между покупками пива и покупками салфеток в послеобеденный период. Владелец магазина приблизил друг к другу отделы, торгующие пивом и салфетками, а между ними поместил еще прилавки с картофельными чипсами. В результате увеличились продажи всех трех видов товара.

С запросами, характерными для систем добычи данных, связан ряд необычных проблем.

1. Они включают, как правило, агрегацию больших объемов данных.

2. Они имеют нерегламентированный, сиюминутный характер; их формулируют лица, ответственные за принятие решений, когда им необходимо выявить какие-либо неочевидные соотношения.

3. В приложениях, связанных, например, с торговлей ценными бумагами, очень важно малое время ответа. Суть проблемы состоит здесь в том, чтобы сократить общее время, необходимое для написания, отладки и выполнения запроса.

4. Довольно часто пользователь не в состоянии точно сформулировать запрос - ему просто нужно обнаружить "что-нибудь любопытное".

Таким образом, с добычей данных связаны следующие исследовательские направления.

· Оптимизирующие технологии выполнения сложных запросов, включающих, например, агрегацию и группирование.

· Поддержка "многомерных" запросов, относящихся к данным, организованным в виде "куба", в ячейках которого находятся интересующие данные (например объемы продаж). "Измерениями" такого куба могут быть дата продажи, название магазина, наименование товара, цвет, поставщик.

· Оптимизация использования третичной памяти.

· Языки запросов очень высокого уровня, а также интерфейсы для поддержки пользователей, не являющихся экспертами, которым нужны ответы на сиюминутные запросы.

5.3.2. Хранилища данных

В хранилище данных накапливаются данные из одной или более баз данных. Существует множество потенциальных применений, а также подходов к организации хранилищ данных. Так, крупный магазин может поддерживать хранилище данных о кассовых операциях для целей добычи данных (разд. 5.3.1). Хранилища создаются также для защиты от потерь. Например, центры планирования на случай землетрясений поддерживают сведения о гражданской инфраструктуре (дороги, мосты, трубопроводы и т.п.) в удаленных хранилищах данных, поскольку после землетрясения вряд ли удастся получить эту информацию из городов, находящихся вблизи эпицентра. Еще один пример - получение произвольных срезов данных. В разд. 5.2.5 обсуждалась идея медиаторов, которые дают целостное представление данных, извлеченных из множества источников. Альтернативой медиаторных систем могут служить хранилища данных, обеспечивающие физическое хранение интегрированных данных. В отличие от хранилищ, медиаторы предоставляют информацию, рассылая запросы нескольким источникам, подобно тому, как это происходит при реализации представлений.

Некоторые исследовательские задачи, касающиеся хранилищ данных, совпадают с теми, которые характерны для интеграции данных в целом, но есть и некоторые специфические проблемы.

1. Инструменты для создания насосов данных, т.е. модулей, функционирующих над средой источников данных и поставляющих в хранилище те изменения, которые существенны с точки зрения хранилища; при этом данные должны транслироваться в соответствии с глобальной моделью и схемой хранилища.

2. Методы "чистки данных", которые обеспечивают согласование данных, удаление элементов, соответствующих разным представлениям одного и того же объекта (например "Sally Tones" и "S.A. Tones"), а также удаление неправдоподобных значений.

3. Средства для создания и поддержания метасловаря, информирование пользователей о способах получения данных.

5.3.3. Репозитарии

Класс приложений, называемых репозитариями, можно охарактеризовать как класс систем для хранения и обработки данных и метаданных, т. е. информации о структуре данных. Примеры репозитариев - базы данных для поддержки компьютерного проектирования, включая CASE (системы проектирования программного обеспечения), а также системы управления документами. Отличительная черта этих систем - частые изменения метаданных, характерные для любой среды проектирования.

· В репозитарии необходимо поддерживать множество представлений одной и той же или схожей информации. Например, программный модуль имеет представление в виде исходного кода, объектного кода, промежуточного кода, готовой программы, таблиц использований/определений, документации. Связи между всеми этими представлениями должны отслеживаться репозитарием так, чтобы изменения в одном из них автоматически распространялись на остальные представления того же объекта.

· Репозитарий должен поддерживать понятие версий (состояний объекта в разные моменты времени) и конфигураций (согласованных коллекций версий). Так, различные релизы программной системы будут формироваться как конфигурации из определенных версий файлов исходного кода.

· Репозитарий должен поддерживать эволюцию структуры информации и ее метаданных таким образом, чтобы при добавлении новых свойств данных или новых связей не требовалась полная перекомпиляция.

Цель исследований в этой области - создание "систем управления репозитариями", подобных СУБД.

5.4. Управление транзакциями и потоками работ

По мере того как базы данных получают все более широкое распространение, и сферы их применения выходят за рамки, предусмотренные деловым сообществом, традиционная модель транзакций перестает быть удовлетворительной. Транзакции сейчас могут охватывать множество "независимых" баз данных и не ограничиваться кратким промежутком времени.

5.4.1. Управление потоками работ

Производственные процессы включают и компьютеризованные шаги, где используются базы данных и другие информационные ресурсы, и шаги, где требуется вмешательство персонала. Так, отчет о командировке сначала заполняется сотрудником вручную, затем секретарь вводит его в компьютерную систему, где он автоматически преобразуется в формат бланка для возмещения затрат, после чего направляется клерку, который принимает его или отвергает, используя электронные средства. Если отчет принят, то он направляется в подсистему учета, которая запоминает сумму расходов и генерирует чек. Еще более необходимы средства управления потоками работ, интегрированные в СУБД, если процесс включает обработку мультимедийных документов. Оцифровка бумажного документа включает последовательность шагов, требующих человеческого вмешательства: сканирование, оптическое распознавание текста, проверка и исправление ошибок, регистрация обработанного документа.

Как показывают эти примеры, подобные процессы требуют специальных способов управления данными с поддержкой последовательности взаимозависимых событий. Причем, с некоторыми из этих событий могут быть связаны длительные задержки, например, если клерк находится в отпуске, а заменяющий его сотрудник ушел обедать. Алгоритмы обработки могут включать ветвления и даже откаты, если, скажем, отчет отвергнут и его необходимо исправить для последующего принятия. Так же, как и для репозитариев (разд. 5.3.3), для {потоков работ} необходимы соответствующие "системы управления потоками работ", поддерживающие специфические для этих приложений требования. Необходимы специальные инструменты для конструирования и создания потоков работ, а также для управления ими. С технологиями потоков работ связаны и новые модели транзакций, которые обсуждаются в разд. 5.4.2.

5.4.2. Альтернативные модели транзакций

Транзакции - это единицы обработки данных, обладающие свойствами, существенными с точки зрения традиционных СУБД: атомарность (выполняются либо все действия, либо ни одного), сериализуемость (разные транзакции не оказывают неожиданного воздействия друг на друга), и долговечность (если транзакция зафиксирована, то ее результат не пропадет даже в случае краха системы). Эти свойства сохраняют свою значимость и для многих новых приложений, однако принятые методы реализации транзакций часто оказываются неработоспособными. Некоторые приложения требуют очень продолжительных шагов, как, например, системы проектирования, где инженер изымает из обращения элементы конструкций на несколько часов или дней. Еще один пример - системы управления потоками работ, где действия, выполняемые персоналом, могут также занимать многие часы или несколько суток.

Были предложены альтернативные модели, основанные на концепции вложенных транзакций, когда одна длительная транзакция разбивается на более мелкие шаги, и появляется возможность отменять отдельные шаги, которые оказываются заблокированными последующими шагами. Необходимо усовершенствовать эти модели и развить их таким образом, чтобы обеспечить поддержку более широкого класса транзакций, в том числе для приложений CAD и потоков работ, а также других типов систем, которые будут появляться по мере интеграции все новых информационных источников.

5.5. Простота использования

По мере того как возрастает значение информации в обществе, столь же быстро растет и роль баз данных. К небольшому числу крупных систем, существовавших несколько лет назад, присоединилось огромное количество более мелких систем (а также новые крупные). Однако сложность развертывания подобных систем не соответствует темпам их распространения.

СУБД следующего поколения должны обладать более совершенными интерфейсами, причем не только для конечного пользователя, но и для прикладного программиста и администратора. Целью здесь нужно считать создание баз данных, столь же простых в использовании, как электронные таблицы, которые часто применяются в качестве рудиментарных СУБД.

Задачи установки СУБД или перехода к ее новой версии значительно более громоздки, чем аналогичные задачи для других типов систем. Это неудивительно, если учесть размеры СУБД, их сложность и разнообразие аппаратных конфигураций, на которых они должны работать. Тем не менее мы считаем нужным выдвинуть исследовательскую программу, цель которой - создание интеллектуального инструментария, помогающего системным менеджерам в установке и конфигурировании систем. Современные операционные системы окружены целым слоем "помощников" (wizard), которые обеспечивают их эффективную работу. Подобные "электронные помощники" нужны и для снижения затрат ручного труда по обслуживанию крупных приложений.

С этим же направлением связана и задача интеллектуальной поддержки высокой производительности. Самый распространенный тип звонков в консультационные службы фирм-поставщиков СУБД - это жалоба на то, что "такой-то и такой-то запрос выполняется слишком медленно". Существуют теории подбора индексов и оптимизации схем баз данных, которые могли бы помочь в решении подобных проблем, и здесь нужны электронные "инструменты для физического конструирования баз данных".

6. Выводы

Технологическая среда в Соединенных Штатах и во всем мире меняется очень быстро, и вместе с этим расширяются наши представления о сферах применимости баз данных. Растущие информационные потребности общества отчетливо выявляют ограничения существующих технологий СУБД, и задача исследовательского сообщества - самым энергичным образом устремить свои усилия на эти новые направления. Спектр возможностей и потребностей здесь широк, как никогда, - от сугубо теоретических изысканий в области создания новых моделей и алгоритмических основ до реализации прототипов новаторских систем. В то же время, уровень финансирования исследований в области баз данных, как следует из данных, приведенных в [Toole and Young, 1995], существенно ниже, чем в других сравнимых по значимости сферах.

Поэтому участники семинара рекомендуют вновь призвать к активности правительственные агентства, занимающиеся продвижением работ в области баз данных, а также те коммерческие структуры, которые извлекают выгоду из результатов этих исследований.

В заключение мы хотим напомнить две важные рекомендации из отчета [Silberschatz at al., 1990], не утратившие своего значения и сегодня.

· NSF вместе с другими агентствами Федерального координационного совета по науке, проектированию и технологиям, занимающимися финансированием фундаментальных исследований, должны, при участии академических и промышленных кругов, выработать стратегию, которая бы обеспечила уровень финансирования исследований в области баз данных, соответствующий их значению для развития науки и национального экономического благополучия.

· Промышленные фирмы США, существенно опирающиеся в своей деятельности на технологии баз данных, должны оказать интенсивную поддержку в реализации существующих программ и принять участие в создании новых программ по финансированию университетских исследований в области баз данных.

Мы предвидим десятилетие впечатляющих достижений как в академических, так и в индустриальных исследовательских кругах и надеемся на динамичную и активную поддержку со стороны государственных и коммерческих структур.

Литература

[Gray, 1995] http://www.cs.washington.edu/homes/lazowska/cra/database.html.

[Silberschatz et al., 1990] Database systems: achievements and opportunities. SIGMOD Record 19:4, pp. 6-22. См. также CACM 34:10, Oct. 1991, pp. 110-120.

[Toole and Young, 1995] http://www.hpcc.gov/cic/ forum/CIC_Cover.htm.


1)Семинар организован при поддержке Национального научного фонда (NSF - National Science Foundation) в рамках программы развития баз данных и экспертных систем, грант IRI-9521026. Мнения, выводы и рекомендации, содержащиеся в материалах семинара, принадлежат его участникам и необязательно отражают позицию NSF.

2)Участники семинара: Phil Bernstein, Ron Brachman, Mike Carey, Rick Cattel, Hector Garcia-Molina, Laura Haas, Dave Maier, Jeff Naughton, Michael Schwartz, Pat Selinger, Avi Silberschatz, Mike Stonebraker, Jeff Ullman, Patrick Valduriez, Moshe Vardi, Jennifer Widom, Gio Wiederhold, Marianne Winslett, Maria Zemankova. Некоторые комментарии в этом документе принадлежат Джиму Грею.