В последнее время слова «аналитика» и «Большие Данные» звучат повсеместно. Многократно произносились они и на конференции Oracle Big Data и BI Forum, проведенной представительством Oracle. Как заявили организаторы, мероприятие это стало реакцией на взрывной рост интереса к тематике, связанной с обработкой и анализом Больших Данных. Утверждение о росте и об интересе абсолютно точное. Да, условия сложились. Действительно, все время возрастают объемы накопленных данных. Наконец появились компьютерные системы и системы хранения, позволяющие обрабатывать и анализировать эти данные и тем самым улучшить многие стороны деятельности предприятий. Вот почему перед выступающими на форуме были поставлены актуальные вопросы: «Что же такое Большие Данные?», «Как и для чего их можно использовать?», «В каких случаях имеет смысл использовать новые технологии, а в каких традиционные?», «Что нового Oracle предлагает для обработки и анализа Больших Данных?».
В поиске ответов на эти вопросы на форуме обсуждались основы стратегии Oracle по части обработки и анализа Больших Данных, продуктовые линейки компании для хранения и анализа больших объемов данных. Посетители форума смогли получить почти всеобъемлющий комплект ответов на перечисленные вопросы. Однако приходится признать, что при такой постановке предметом обсуждения становятся не Большие Данные как таковые, не их значение для бизнеса, а скорее стек технологий для работы с Большими Данными, обычно включающий системы обработки данных, аналитические системы, средства для визуализации и подготовки отчетов. Если принять во внимание, что для создания такого рода стеков требуются крупные инвестиции, то легко представить, что потребителей интересуют несколько иные, прагматические вопросы — «В чем реальная помощь Больших Данных для бизнеса?», «Что и сколько стоит?», «Каковы риски?», «Как оценить возврат инвестиций?», «Сколько времени уйдет на получение результатов?» и т. д.
Чтобы ответить на такого рода вопросы, требуется не узко технологический, а более широкий, системный взгляд на проблему. Полезные Большие Данные — не просто петабайты видеоизображений или порождения социальных сетей, а информационная основа больших систем. БСЭ определяет такие системы следующим образом: «При системном подходе с целью изучения и совершенствования больших систем используются только такие методы, которые не игнорируют наличия тесной взаимосвязи между большим числом факторов, определяющих поведение рассматриваемой системы; учитывается большая или меньшая неопределенность поведения системы в целом и отдельных ее частей как результат действия случайных факторов и участия в системе людей; принимается во внимание взаимовлияние системы и окружающей ее среды; учитываются изменения во времени свойств системы и внешней среды. Такой подход эффективен при исследовании сложных технических, экономических и биологических систем, для которых оказываются бесплодными традиционные методы, основанные на поочередном изучении отдельных черт системы или отдельных явлений или на далеко идущем упрощении объекта рассмотрения».