Нефтегазовая отрасль — один из пионеров, использующих решения для анализа Больших Данных. Об этом шла речь на конференции «Энергия вашей информации. ИТ-решения для нефтегазовой отрасли», совместно организованной редакциями журналов Oil&Gas Russia, «Директор информационной службы» и компанией EMC. Своими оценками отраслевой и национальной специфики проблемы Больших Данных делится Сергей Карпов, генеральный директор EMC в России и СНГ.
Ряд ИТ-директоров, с которыми мы беседовали, полагает, что проблемы Больших Данных на самом деле нет, зато нередко встречается проблема неправильной организации работы с данными. Какова ваша позиция? Проблема объективно существует или она — лишь результат неверного выбора методов и средств работы с данными?
Даже постановка вопроса о выборе методов уже сама по себе подразумевает наличие тех или иных трудностей в обработке данных. Когда говорят, что данные неверно обрабатываются, это значит, что обработка традиционными методами бессильна. Сказать, что проблемы Больших Данных не существует — это в какой-то степени пытаться уйти от реальности.
В чем чаще всего заключается проблема? Большие объемы данных, высокая скорость их обработки, большое разнообразие форматов — это лишь первые симптомы, по мере того как данные становятся Большими.
Сегодня проблематика Больших Данных выводит компании, заинтересованные в извлечении пользы из них, на новый этап развития. Обработка Больших Данных подразумевает создание конкурентных преимуществ, следовательно, речь идет о трансформации индустрий.
Задача ИТ-директоров состоит в том, чтобы найти данные и превратить их в ценную информацию, которая позволит компании передвинуться на следующий уровень развития быстрее конкурентов. Трансформация заключается именно в этом, а вовсе не в том, чтобы быстрее и надежнее обрабатывать данные.
Различаются ли подходы к Большим Данным в зависимости от отрасли?
Решения для извлечения знаний из Больших Данных могут различаться даже внутри одной отрасли. Например, в нефтегазовой отрасли подобные задачи далеко не исчерпываются обработкой геолого-сейсмических данных. Не меньшую важность для бизнеса может представляять анализ данных со всех аналого-цифровых преобразователей, которые управляют производственными процессами, начиная от добычи и заканчивая доставкой потребителю нефти, газа и продуктов их переработки.
Российская сеть трубопроводов для транспортировки нефти в Европу по праву считается самой разветвленной и сложной по структуре из всех подобных сетей. Сведя воедино данные, поступающие с различных датчиков и измерительных приборов, можно радикально повысить эффективность транспортировки нефти.
Не сомневаюсь, что ИТ-руководители, работающие в нефтегазовой отрасли и понимающие эту предметную область, смогут придумать новые способы ведения бизнес-операций, которые будут базироваться на сборе и оперативном анализе Больших Данных. Например, с его помощью можно решить проблему несанкционированного изъятия (проще говоря, воровства) нефти из трубопроводов, существующую до сих пор.
Еще раз подчеркну, что при генерации идей ИТ-специалисты должны быть лидерами и формировать спрос на Большие Данные внутри своих компаний. Зная возможности современных технологий, они наверняка смогут предложить способ анализа данных, который бизнес-пользователям даже не придет в голову.
Интерес российских компаний к Большим Данным, похоже, есть, и он растет, но в большинстве случаев остается теоретическим. Что нужно, чтобы он перешел в практическую плоскость?
Цель обработки Больших Данных — получение дополнительных конкурентных преимуществ. Есть много российских компаний, уже сегодня готовых двинуться в этом направлении. Единственное, чего им не хватает, — опыта. Необходимые объемы данных накоплены всеми без исключения крупными корпорациями. Вопрос — что с ними делать дальше, где искать те закономерности, опираясь на которые можно трансформировать бизнес и научиться получать новые продукты или даже освоить новые способы ведения бизнеса.
Запросы от компаний есть, и очень многое зависит от производителей и поставщиков, потому что на данный момент готовые решения, существующие на рынке, ограничиваются несколькими программно-аппаратными комплексами для конкретных отраслей. Вопрос заключается в построении конкретных моделей применения Больших Данных в различных индустриях.Такие типовые решения должны появиться на стыке ИТ и бизнеса, и в этом направлении еще предстоит большая работа.