Ник Росситер: «Успех проектов Больших Данных определяется эффективным взаимодействием ИТ-службы и бизнес-пользователей, фокусом на бизнес-задаче и использованием инструментов корпоративного уровня как альтернативы самостоятельному программированию» |
Мало того, многие современные аналитические системы не приспособлены для работы как с данными, поступающими в реальном времени и необходимыми для принятия решений в момент наступления события, так и с ретроспективными данными, используемыми для выявления устойчивых стратегических тенденций. В рамках третьего форума Big Data 2014, проведенного издательством «Открытые системы», Ник Росситер, региональный менеджер компании Informatica в России и СНГ, рассказал об особенностях инфраструктуры обработки Больших Данных, позволяющей их монетизировать.
— В отчетах аналитиков решения компании Informatica редко отмечаются в категории Big Data. Почему?
Правильнее было бы сказать, что на данный момент авторы аналитических отчетов не делают исследований о технологиях Больших Данных «вообще», поскольку соответствующие продукты крайне разнородны как по функционалу, так и по степени зрелости. Часто под технологиями Больших Данных подразумевают только одну конкретную технологию, а именно Hadoop, однако ставить между ними знак равенства нельзя. Hadoop — всего лишь одна из технологий Больших Данных со своим определенным кругом задач. Имеющиеся исследования аналитиков как раз позволяют сравнить степень зрелости дистрибутивов Hadoop от различных производителей, оценить их сильные и слабые стороны и эффективность решения.
Informatica не занимается разработкой своего дистрибутива Hadoop – мы сфокусировались прежде всего на решениях по интеграции и репликации данных, обеспечении качества данных, управлении мастер-данными, включая продуктовый каталог, а также на решениях по управлению жизненным циклом информации. В соответствующих областях наши решения традиционно высоко оцениваются аналитиками. У нас хорошие отношения с крупнейшими вендорами, работающими в области Больших Данных. Независимость от какого-либо поставщика СУБД или другого программного обеспечения позволяет компании Informatica предлагать пользователям действительно гетерогенную платформу.
— Какой из этапов обработки Больших Данных наиболее важен?
На интеграцию данных в широком смысле приходится порядка 70-80% трудозатрат – это общепризнанная точка зрения, которая подтверждается множеством исследований. Если сравнить задачу аналитики Больших Данных с поиском иголки в стоге сена, то интеграция Больших Данных – это, несомненно, сбор сена в стог, для того чтобы можно было перейти к поиску иголки. В свою очередь, если мы рассмотрим задачу аналитики Больших Данных как поиск иголки, то ключом к успеху станут решения для управления качеством данных и мастер-данными, а также управления жизненным циклом информации.
— Что самое главное в проекте Больших Данных?
До начала проекта нужно сформулировать его цель, обозначить, какую бизнес-задачу планируется решить, а также определить целевые значения показателей эффективности, например снижение оттока клиентов на 5%. Отсутствие цели является наиболее частой причиной неудач проектов и разочарований в технологиях Больших Данных.
На сегодняшний день большинство проектов Больших Данных инициируются департаментами ИТ и во многом ориентированы на достижение исследовательских целей, вплоть до изучения возможности самостоятельно запрограммировать функционал доступных инструментов корпоративного уровня. В этом случае есть опасность, что бизнес-цель не будет достигнута и ресурсы ИТ будут напрасно отвлекаться от актуальных задач основной деятельности предприятия. Ключевым фактором успеха является эффективное и прозрачное сотрудничество представителей бизнес-подразделений и служб ИТ, позволяющее обеспечить оптимальный баланс управления и утилизации всех ресурсов.
— Имеется ли специфика проектов Больших Данных в России? Какие продукты вашей компании здесь наиболее востребованы?
Традиционно большинство наших клиентов решают задачи интеграции транзакционных данных, однако ситуация меняется. Сегодня все более актуальны вопросы обработки массивов данных, являющихся результатом взаимодействия людей, например социальных медиа. За последние два года стабильно растет интерес и количество внедрений решений Informatica по управлению мастер-данными и продуктовым каталогом для розничных продаж. Эти проекты, несомненно, относятся к области Больших Данных, так как основываются на совместной обработке структурированных данных, мультимедиа, данных социальных сетей в режиме, близком к реальному времени. Для наших клиентов — это естественный путь развития и возврата инвестиций от платформы интеграции данных.
— Что ждет экосистему Больших Данных в будущем?
Уже в этом году мы увидим существенный рост количества внедренных решений на основе технологий Больших Данных. Бизнес-заказчики получили достаточное представление об эффективности доступных решений на основе многочисленных тестирований и пилотных проектов, которым были посвящены несколько предыдущих лет. Важно помнить, что проекты монетизации Больших Данных будут подвергаться значительным рискам, как и инновационные проекты в других областях, и ключом к успеху, безусловно, будет использование зрелых решений корпоративного уровня, а не попытки самостоятельного программирования.