В течение многих лет реляционные СУБД ассоциировались с таблицами жесткой структуры, в которых хранились преимущественно числа и тексты, но теперь корпоративная платформа данных стала вместилищем цифровых объектов самой различной природы и «структурности»: огромных числовых массивов, нормативно-справочных данных, электронных документов и записей, неструктурированных текстов, аудио- и видеофайлов, картографических данных и т. д. Эти данные располагаются не только на самих серверах, но и в виртуальном вычислительном «облаке» из серверов, клиентских ПК, ноутбуков и мобильных устройств, — а значит, необходимы прозрачные механизмы доступа, предоставления и синхронизации данных во всех слоях инфраструктуры, и для непосредственной работы с данными предпочтительны привычные программы и интерфейсы, применяемые в повседневной деятельности.
Если для классических СУБД на первый план выдвигались хранение и обработка запросов, то функции корпоративной платформы данных, отвечающей сегодняшним и грядущим вызовам, должны быть значительно шире — она должна гармонично соединять множество смежных технологий и предоставлять сервисы взаимодействия для интеграции данных разнообразных типов, поиска, анализа, формирования отчетности, синхронизации, репликации и создания мобильных решений, обеспечения безопасности и непрерывности работы и т. д.
Франсуа Аженста, руководящий в Microsoft продвижением SQL Server 2008 и один из основных докладчиков на недавно прошедшей конференции Heroes 2008, среди важнейших качеств этого продукта в контексте корпоративной платформы данных выделяет три — надежность, продуктивность и интеллектуальность. Главный принцип заключается в том, что любые данные с момента создания до вывода в архив должны быть согласованы, а также постоянно и повсеместно доступны в пределах полномочий соответствующих приложений и пользователей.
Механизмами SQL Server для управления «внутренними» данными пользуется более 40 программных продуктов Microsoft: Sharepoint Server, Biztalk Server, Visual Studio Team System, Light Communication Server, Systems Center, Dynamics и др. Надежная платформа должна обеспечивать непрерывную работу самых сложных и ответственных систем компании, а поэтому ей следует не только хорошо масштабироваться в зависимости от изменяющейся нагрузки, но и обладать предсказуемым быстродействием и средствами оптимизации производительности. Поэтому была реализована инфраструктура декларативного управления Resource Management Framework, основанная на правилах корпоративной политики. Так, Resource Governor позволяет закреплять за задачами и пользователями ресурсы процессоров и памяти. Расширенный набор показателей производительности, их централизованное накопление и новый инструментарий Performance Studio позволяют осуществлять активное администрирование и мониторинг функционирования системы.
Для повышения производительности ядра SQL Server 2008 были существенно усовершенствованы средства индексирования и организации таблиц. Оптимизация и фиксация планов обработки запросов обеспечила устойчивость и предсказуемое время обработки в виртуальной среде. С целью обеспечения информационной безопасности наряду с разграничением и контролем доступа пользователей в новой версии SQL Server реализованы «прозрачное» шифрование и детальный аудит обновления данных, не требующие модификации кода прикладной программы. За счет средств компрессии целевых данных и резервных копий объем дисковой памяти сокращается на 30-50%, и рост скорости выполнения запросов достигает 60%.
Продуктивность платформы наряду с производительностью механизмов ядра и эффективностью средств управления в немалой степени зависит от возможностей средств моделирования данных и процессов, ориентированных на архитекторов и разработчиков систем. Многообразие источников данных побудило разработчиков SQL Server 2008 существенно расширить «область охвата» традиционной реляционной СУБД. В модель данных были органично введены новые типы с соответствующими методами манипулирования: для представления дат и времени с повышенной точностью, моделирования иерархических структур, хранения и потоковой обработки цифровых объектов большого объема в файловой системе с поддержкой целостности транзакций и едиными средствами индексирования и поиска, а также пространственно-географические типы данных для конструирования композитных представлений и приложений. Для работы с внешними данными (Oracle, IBM DB2 и др.) применяются адаптеры собственной разработки и третьих фирм.
В .Net предусмотрена поддержка высокоуровневой модели сущностей и связей Entity Framework. Инструмент определения и моделирования Entity Designer дает возможность оперировать концептуальными бизнес-сущностями («Клиент», «Организация», «Продукт», «Заказ» и т. п.), а механизм Language-Integrated Query (LINQ) позволяет автоматически строить отображения данных и программных объектов и специфицировать запросы и операции по их обработке на языках прикладного программирования Visual C# и Visual Basic .Net. В типовых сценариях взаимодействия с Web-сайтами, обработки заказов среда хорошо справляется со всеми необходимыми преобразованиями. И хотя еще предстоит убедиться, насколько эффективен данный подход при реализации особо интенсивных транзакционных запросов, в новых сетевых сервисах SQL Data Services будет применяться представление на уровне сущностей. Для мобильных приложений, нерегулярно подключающихся к корпоративной сети, предусмотрены новые сервисы уведомления и синхронизации.
Аженста отметил, что для повышения «интеллектуальных» возможностей платформы прежде всего значительно усилены средства масштабирования и специализированные механизмы, ориентированные на сверхбольшие системы хранилищ данных: секционирование таблиц, оптимизация параллельной обработки запросов и операций Star Join, средства загрузки (1 Тбайт данных загружается менее чем за полчаса), и отслеживания изменений Change Data Capture. Второе направление, к которому приковано внимание потенциальных заказчиков — масштабирование сервисов для анализа данных и формирования документов. С этой целью полностью переработан механизм Reportong Engine с фокусом на масштабирование — теперь он может поддерживать работу десятков тысяч пользователей. В аналитических сервисах улучшены алгоритмы загрузки и обработки запросов к кубам, а аналитические инструменты поддерживают более сложные вычисления и агрегирование данных. Третье направление — это обеспечение удобства для пользователей за счет интеграции средств генерации и визуализации отчетов с другими продуктами Microsoft, и прежде всего, Office System.
В Microsoft уверены, что в верхнем сегменте рынка для крупномасштабных и особо критичных корпоративных систем такие конкурентные преимущества обеспечат надежность, масштабируемость и функциональную полноту решения, а для средних и малых заказчиков наряду со встроенными аналитическими возможностями решающим фактором может оказаться простота развертывания и управления в сочетании с более приемлемой стоимостью владения решением.