Развитие ИТ-индустрии в конкретные периоды ее относительно короткой истории определялось различными факторами: необходимостью концентрации в одном месте вычислительных ресурсов для выполнения масштабных задач, часто национального уровня; требованием автоматизации деятельности целых отраслей и ее ведущих предприятий; потребностью в обеспечении групп пользователей пакетами разнообразных программ и т.п. Сегодня индустрию двигает индивидуализация. Например, для британского премьер-министра, известного своей любовью к различным ИТ-устройствам, специально разрабатываются персонифицированные приложения, в режиме реального времени предоставляющие, согласно индивидуальным настройкам, новости из Интернета, социальных сетей, отчетов различных национальных служб и другие данные.
Сегодня от ИТ-индустрии требуется не вообще хранить биты и достигать абстрактного терафлопсного быстродействия, а обрабатывать конкретные данные любой природы и доставлять их конкретному индивиду. И тут оказалось, что, например, традиционные реляционные СУБД, созданные в эпоху мэйнфреймов и Unix-систем, были рассчитаны только на транзакционную обработку табличных данных и не допускают возможности работы на системах с горизонтальным масштабированием, необходимых для операций с распределенными источниками разнородных данных огромных объемов. Кроме того, стало очевидно, что современные пользователи не хотят тратить время на конвертацию данных в реляционные форматы, а предпочитают сохранять их в исходном виде, структурируя только по мере необходимости, например при решении задач аналитики. Как следствие, сейчас заговорили чуть ли не о кризисе бывшей еще совсем недавно стабильной области СУБД — здесь начались подвижки, выраженные, в частности, в появлении таких движений, как NoSQL и NewSQL.
Переживает ли сфера СУБД кризис? Чего недостает СУБД для работы с Большими Данными? Каким требованиям должны удовлетворять системы обработки информации в реальном времени и в чем преимуществанедостатки Hadoop и MapReduce? В чем новизна давно известных подходов по обработке в основной памяти и систем с репликацией? Об этом рассуждают авторы этого номера журнала, посвященного современным тенденциям в СУБД.
За многолетнюю историю развития систем обработки данных было выработано несколько моделей представления информации: иерархическая, сетевая, реляционная, объектно-реляционная и т.д. Наибольшее распространение получила реляционная, надолго ставшая стандартом представления структурированной информации, и главная причина этого, по мнению Константина Селезнева, — ее простота для прикладного программиста. Реляционный механизм позволяет представлять информацию из разных предметных областей, используя удобный подход к манипулированию данными, оформленный в виде SQL. Простота и естественность реляционной алгебры позволили создать универсальные алгоритмы выполнения запросов, удовлетворяющие большинство разработчиков прикладных систем. Однако реляционная модель оперирует только атомарными данными, что исключает обработку неструктурированной информации, и более того, невозможно даже хранение текстовых документов произвольной длины, все вместе это приводит к невозможности хранения мультимедиа. К тому же транзакционные базы интернет-магазинов сегодня сильно увеличиваются в объеме при персонализации услуг, и работать с ними средствами РСУБД становится все сложнее. Вместе с тем, Сергей Кузнецов обращает внимание на то, что трудно быть за или против вообще решений постоянной готовности с неограниченным потенциалом масштабирования — NoSQL или нового поколения реляционных СУБД — NewSQL, и прежде нужно разобраться, что под всем этим понимается. Например, на NoSQL можно смотреть в очень широком смысле, подгоняя под них давно известные РСУБД, а обработку в памяти также сейчас трудно отнести к новинкам — скорее, инновационными можно считать работу в области параллельных систем распределенного хранения и подходы, направленные на приближение приложений к данным.
Ежедневно во всем мире появляется 2 тыс. новых сайтов, специально созданных злоумышленниками для совершения различных противоправных действий. Мошенникам сегодня все труднее обмануть вообще какую-то группу людей, зато индивидуальное обращение вполне может заставить конкретного человека расстаться со своими деньгами. Череда скандалов, связанных со взломами персональных почтовых ящиков, свидетельствует о том, что в области персональной информационной безопасности дело сегодня обстоит не лучшим образом. В этой связи читателям будет интересен блок статей, авторы которых анализируют причины, несмотря на огромные инвестиции, недостаточной эффективности систем информационной безопасности.
Векторы атак на ИТ-инфраструктуры за последние 40 лет сильно изменились, однако современные виды угроз поразительно похожи на древние. Возможно, стоит переключить внимание с повышения защищенности компьютеров и сетей на изучение самих угроз? Кроме того, защита информации должна быть направленной — существует мнение, что системы безопасности аэропортов во многих странах несовершенны именно потому, что направлены на поиски бомб, а не террористов. По аналогии, имеет смысл сосредоточиться на защите самой информации вместо разработки более защищенных архитектур компьютеров и сетей или внедрения сложных регламентов для пользователей по созданию сильных паролей.
Необходимость обеспечения индивидуального подхода к работе с информацией вызвала в ИТ-индустрии вообще и в области СУБД, в частности, появление ряда рациональных зерен, потенциально способных сильно изменить ИТ-ландшафт. Однако по одному виду зерна невозможно определить, каков будет плод, пока не посеешь и не дождешься урожая.