НИК РОССИТЕР: «Многие крупные российские компании уже начали путешествие в мир Больших Данных» |
В рамках форума Big Data 2013, проведенного издательством «Открытые системы», серьезное внимание было уделено экономической эффективности проектов Больших Данных. Своими взглядами на проблему поделился Ник Росситер, региональный менеджер Informatica в России и СНГ.
В чем, с вашей точки зрения, заключается проблема Больших Данных? Каковы ее ключевые проявления?
У многих компаний существует свой собственный взгляд на Большие Данные. С нашей точки зрения, Большие Данные включают в себя три взаимосвязанные, но различные составляющие: «Большие транзакционные Данные», «Большие Данные взаимодействия» и «обработка Больших Данных».
Транзакционные данные компаний растут примерно на 40% в год, что представляет значительную проблему. Но еще большую проблему представляет рост информации в социальных сетях и данных межмашинного взаимодействия — различных устройств и датчиков. Эта категория данных демонстрирует четырехкратный рост ежегодно. Главная проблема, стоящая как перед компаниями, так и перед госучреждениями, состоит в том, что их информационная инфраструктура никогда не рассчитывалась на такие объемы данных, которые сейчас стали реальностью.
Если заглянуть в будущее, анализ Больших Данных станет скорее конкурентным преимуществом компаний или условием их выживания на рынке?
Это не вопрос будущего. С Большими Данными уже приходится иметь дело, и проблема, как я уже сказал, в том, что ими пытаются управлять с помощью устаревших технологий.
Многие крупные российские компании уже начали путешествие в мир Больших Данных. Вероятно, когда-нибудь эти технологии станут обычными для большинства компаний, но в обозримом будущем речь идет все-таки о создании мощных конкурентных преимуществ.Например, один из мобильных операторов использует наши решения для интеграции многочисленных источников данных — как внутренних, так и внешних. Это дает возможность анализировать причины оттока клиентов на базе информации об их звонках, биллинговых данных, записей в социальных сетях. Объединив данные транзакционных систем с внешними источниками, компания вдвое сократила показатель оттока, что, очевидно, дает ощутимый финансовый эффект.
Гора Больших Данных может содержать маленькое зернышко бизнес-ценности, не оправдывающее затрат на хранение и обработку. Как избежать таких ситуаций?
Разумеется, в случае плохого управления проектом такое может произойти. Перед тем как начинать столь инновационный проект, какими сейчас пока являются любые действия с Большими Данными, следует пристально взглянуть на текущую ситуацию. Как показала многолетняя практика внедрения различных ИТ-систем, самое главное, что следует сделать при автоматизации каких-либо ручных процессов, — убедиться, что они работают корректно и эффективно. Примерно то же самое можно посоветовать применительно к Большим Данным. Не все виды данных одинаково ценны для бизнеса, и выбор верных источников критически важен. Ни одна компания не может себе позволить анализ абсолютно всех данных, особенно если они устарели, ошибочны и т. п.
Технологии Больших Данных требуют значительных инвестиций. За счет чего они могут окупиться?
Такие технологии, как Apache Hadoop, позволяют удерживать необходимые инвестиции в разумных пределах, предоставляя платформу для дешевого хранения и обработки информации. Их использование совместно с решениями, ориентированными на аналитику, дает ощутимый возврат инвестиций. К слову, именно такая тенденция наблюдается сейчас и в мире, и в России. Компании создают и тестируют экосистемы вокруг кластеров Hadoop.
Кроме того, никто не отменял практику пилотных проектов. Компании переходят к полномасштабной реализации лишь тех проектов, которые показали свою жизнеспособность и очевидную пользу для бизнеса. Это тоже помогает держать инвестиции под контролем.
Что касается экономических эффектов, то они зависят от сферы деятельности компании и специфики рынка. Например, для телекоммуникационных компаний важно отслеживать лояльность клиентов. Автопроизводители предлагают услуги, основанные на анализе данных с датчиков на машинах. В медицине технологии Больших Данных помогают спасать жизни — это тоже возврат инвестиций.
Как оценить возврат инвестиций в Большие Данные? Можете ли вы предложить варианты таких оценок?
Все просто: возврат инвестиций равен ценности, получаемой от Больших Данных, разделенной на стоимость их сбора, хранения и обработки. Улучшать это соотношение можно как путем повышения значения числителя — функционала созданной системы, так и путем сокращения знаменателя.
Но в рамках каждой компании или даже каждого отдельного проекта могут быть разработаны и собственные метрики. Возврат инвестиций может происходить благодаря ускорению вывода на рынок продуктов и услуг или более точной оценке настроений клиентов.