НИК РОССИТЕР: «Общая цель инструментария для работы с Большими Данными — помочь бизнесу в принятии более гибких, более своевременных решений» |
Отличительная черта выступления Ника Росситера, регионального директора компании Informatica в России и СНГ, на первом в нашей стране форуме Big Data 2012, организованном издательством «Открытые системы», — пристальное внимание к вопросам экономической эффективности проектов в области Больших Данных и увеличения их пользы для бизнеса.
Основная идея Росситера в том, что, поскольку затраты на работу с Большими Данными достаточно велики, очень важно тщательно их оценивать и стремиться к повышению окупаемости инвестиций, выделяемых на эти цели. Этого, как он рассказал в интервью, данном на конференции, можно добиться путем повышения пользы данных для бизнеса благодаря новым возможностям и преимуществам (например, более быстрому выполнению заказов клиентов, расширению круга заказчиков, уменьшению количества рекламаций, снижению бизнес-рисков, повышению производительности труда и пр.), а также через снижение затрат на работу с Большими Данными.
Какие признаки или факты могут указать на то, что предприятию пора учиться управлять Большими Данными?
Первые признаки того, что организация вплотную подходит к необходимости работать с Большими Данными, обнаруживаются, когда объемы информации становятся громадными, при этом данные нередко приходится собирать из большого количества источников. В таких ситуациях выясняется, что данные не удается эффективно обработать, опираясь на имеющиеся технологии. В частности, не удается обеспечить требования соглашения об уровне обслуживания (Service Level Agreement, SLA) в процессах резервного копирования и восстановления данных. Когда организации начинают осознавать, что при работе с огромными массивами данных возникает множество проблем, они начинают искать новые возможности, чтобы обеспечить выполнение SLA.
Похоже, многие предприятия осознали, что столкнулись с проблемой Больших Данных, когда обнаружили беспрецедентно высокую динамику расходов на хранение и обработку данных. Вы согласны?
Абсолютно. Расходы на сбор, обработку данных, обеспечение их безопасности и особенно на их хранение растут очень быстро, и необходимо бороться не только за их снижение, но и за повышение выгоды от работы с данными.
Почему традиционные аналитические инструменты неэффективны при работе с Большими Данными?
Прежние аналитические средства ориентированы на работу с транзакционными данными. Между тем сейчас стремительно растут объемы данных, которые появляются в результате различных видов взаимодействий, в том числе обмена данными между компьютерами. Эти массивы становятся настолько большими, что их не удается обрабатывать традиционными аналитическими средствами, прежние системы оказываются непригодными для эффективного анализа данных о взаимодействиях.
Способны ли новые аналитические инструменты улучшить соотношение выгод и затрат при работе с Большими Данными?
Да, разумеется. Один из важнейших способов повысить эффективность работы с данными — научиться извлекать из них больше сведений, способных принести финансовую выгоду бизнесу. Общая же цель инструментария для работы с Большими Данными — помочь бизнесу в принятии более гибких, более своевременных решений. Например, компания, работающая на фондовой бирже, чтобы принимать правильные решения, должна уметь в крайне сжатые сроки анализировать информацию из очень большого числа источников, в первую очередь биржевых и новостных лент. Если такая компания научится принимать правильные решения, опережая конкурентов по быстроте реакции, она будет иметь конкурентное преимущество. Подобные ситуации характерны для финансового сектора.
По одной из гипотез, проблема Больших Данных на предприятии — это результат неоптимального управления информацией, следовательно, в том, что она возникает, есть определенная вина ИТ-руководителей. Вы согласны с такой точкой зрения?
Нет, не согласен. Очень многие проекты, в которых приходится иметь дело с Большими Данными, финансируются бизнес-подразделениями. Пример — проекты в области CRM: бизнес хочет лучше понимать, как себя ведут покупатели, и получать картину об их поведении в реальном времени: что они приобретают, какие фильмы смотрят, что делают в Twitter, Facebook и пр. В целом спрос бизнеса на работу с Большими Данными стремительно растет. Именно в бизнес-подразделениях следует искать заказчиков и спонсоров подобных проектов (причем не только CRM) и затем привлекать их к активному участию в этих проектах.
Каковы ключевые требования к аналитическим средствам для работы с Большими Данными?
Если говорить в терминах традиционных средств бизнес-аналитики, то в первую очередь это возможность обрабатывать огромные объемы данных. Чем больше информации у вас есть, тем больше пользы вы в принципе можете из нее извлечь (я имею в виду прежде всего подготовку аналитической отчетности). Важно помнить, что требования к срокам подготовки отчетности серьезно изменились: сегодня мало кого устроят аналитические средства, которые готовят, например, финансовую отчетность на основе данных, которые были актуальны месяц или неделю назад. Сегодняшний бизнес требует предоставлять отчетность на основе ежедневных данных. Отдельно следует рассматривать аналитические средства, способные обрабатывать большие объемы данных в реальном времени.
ИТ-инфраструктура многих предприятий, которые вскоре столкнутся с проблемой Больших Данных, уже достигла весьма внушительных размеров. Насколько серьезные изменения потребуются в ней в ходе решения проблемы Больших Данных?
Большие Данные не вытесняют традиционные транзакционные данные, они сосуществуют. Большие Данные появляются на предприятиях, потому что их анализ нужен бизнесу, именно бизнес финансирует проекты в этой области, поскольку хочет получить еще более актуальную отчетность, еще более высокие показатели быстродействия, которые имеются в SLA, и пр. ИТ-инфраструктура для работы с Большими Данными будет сосуществовать с уже созданной инфраструктурой, не заменяя и не вытесняя ее.
Какие шаги вы бы рекомендовали предпринять компаниям, приступающим к решению проблемы Больших Данных?
Для начала необходимо сделать шаг назад и уяснить, имеется ли у вас стратегия в отношении Больших Данных и нужна ли она вам вообще. Есть ли у вас SLA, которые не выполняются из-за того, что объемы данных слишком велики? Все ли вы правильно делаете? В первую очередь следует убедиться, что вы интегрируете данные между приложениями. Если приложения и в самом деле интенсивно обмениваются данными, наверняка встанет проблема качества информации.
Также надо убедиться, что вы располагаете метаданными, что у вас есть единый источник знаний об информации, имеющейся в вашей системе. Решая проблему Больших Данных, вам придется иметь дело с гораздо большим масштабом развертывания, чем в традиционном подходе к данным, поэтому нужно убедиться, что средства, которые вы хотите использовать, способны работать с Большими Данными.