Российский ИТ-холдинг Fplus построил корпоративное хранилище на платформе RT.Warehouse. Обеспечение доступности критически важной для бизнеса информации стало важным этапом в реализации стратегической задачи – повышения культуры работы с данными. Именно от этого зависят скорость и обоснованность принятия решений, что влияет на конкурентоспособность компании. О реализации проекта и его роли в развитии бизнеса компании рассказывает Ярослав Назаров, начальник управления корпоративных данных (CDO) Fplus.

- Почему потребовалось создание корпоративного хранилища данных? Чем не устраивала сложившаяся ситуация?

Решение было взвешенным, причем оно не было основано на какой-то «боли» бизнеса. Мы прошли определенный эволюционный путь и просто переросли аналитику, доступную в ERP-системах. Мы видели тенденции рынка к изучению и самостоятельной проверке пользователями бизнес-гипотез и хотели ответить на этот вызов времени.

- В чем заключался этот вызов? Какие задачи требовалось решить?

Вызов времени заключается в том, что ценность данных продолжает расти, и скорость доступа к ним становится конкурентным преимуществом компаний. Для своего развития они должны обеспечить мощь созданной аналитической системы и уметь поддерживать ее на достаточно высоком уровне. При этом требуется обрабатывать все больший объем данных и делать данные доступными для сотрудников, которые хотят проверить гипотезу или принять решение.

Поворотным моментом стало создание управления корпоративных данных (Data Office) – отдельного подразделения, которое занимается построением процессов работы с данными и аналитикой в целом. Внутри этого подразделения была сформирована стратегия того, как компании хотелось бы развивать культуру работы с данными. Разрабатывая эту стратегию, мы поняли, что очень важным в дальнейшем будет именно показатель доступности данных. Насколько быстро человек, сформулировав свою гипотезу, может ее проверить? Знает ли он, где взять эти данные, насколько они ему в целом понятны, насколько он может на них полагаться? И в рамках именно понимания того, как мы хотим развивать в дальнейшем культуру работы с данными в компании, и родился проект, связанный с внедрением MPP-платформы.

- Какова история аналитических решений в вашей компании? Что они собой представляли?

Изначально аналитика была выстроена вокруг ERP-систем «1С» и Dynamics AХ, и до определенного момента этого более чем хватало. Агрегация происходила на уровне хранения BI-системы. Данные, полученные из разных источников, в том числе с внешних площадок, представлялись исключительно в виде картинок – в агрегированной и обработанной форме. Однако они требовали большого количества действий для того, чтобы их изучить или проверить гипотезу, которая не была изначально заложена в тех или иных графиках или стандартных показателях отчетности.

Мы выбирали MPP-систему как аналитическое ядро, вокруг которого будет работать абсолютно все. Использование MPP-платформы – это как широкие возможности производства данных и обработки больших массивов, так и высокая доступность, и простота для бизнес-пользователей. Большое количество людей может использовать именно мощности самой MPP-системы, а не пытаться где-то еще обработать большой объем данных. И самое важное, при этом они могут использовать готовые наработки, которые в виде стандартных отчетов, стандартных витрин данных можно легко использовать для формирования или проверки своих гипотез.

Встав на путь внедрения MPP-платформы, мы обратили внимание на технологии open source, и даже несколько месяцев смогли проработать на решении Greenplum. Мы достаточно быстро смогли его запустить, но столкнулись функциональными ограничениями, на решение которых нам понадобилось бы очень много времени и привлечение специалистов совершенно другого уровня. И это стало очень веской причиной выбора вендорского продукта. Мы не хотим заниматься самодеятельностью, пытаясь тюнинговать доступные сейчас продукты open source под свои нужды.

- Почему было выбрано решение RT.Warehouse? Каковы были критерии?

Разумеется, мы ориентировались на российских производителей. Нам было важно понять, насколько полно продукт может закрыть весь ландшафт аналитических систем, которые предстоит внедрить для реализации нашей стратегии. Оценивались такие факторы, как стоимость владения и возможность технической поддержки, а также функциональные характеристики в части управления и масштабирования кластера, мониторинга его состояния. Нами было принято решение перейти на решение, предложенное TData.

- Как были разделены проектные работы между вашей командой и поставщиком решения?

Непосредственно установку платформы и процессы миграции мы провели самостоятельно, но коллеги из TData обеспечили нам мощную поддержку в момент предварительного тестирования. Уже в тот момент, когда мы работали с Greenplum, у нас были критические потоки данных, в рамках которых мы должны были поддерживать высокий SLA. Поэтому подготовка к миграции между платформами осуществлялась достаточно серьезно.

- Какие сложности возникали в ходе проекта, как их решали?

Можно сказать, что мы прошли миграцию без особых проблем и сложностей. В ходе подготовки были технические шероховатости, например, связанные со спецификой системы управления кластером RT.ClusterManager – инструментом, который поставляется вместе с RT.Warehouse. Все они решались с помощью обычных консультаций, то есть коллегам не потребовался даже удаленный доступ. Мы достаточно оперативно обменивались необходимыми логами, если это требовалось, и эксперты на своей стороне решали эти вопросы.

- Сколько времени потребовалось?

Для меня это далеко не первый процесс миграции между платформами. Мы получили зрелое вендорское решение, которое не подбрасывает сюрпризов, и имели собственный опыт, знали, что нужно делать. Это дало очень высокую динамику работ. Полный цикл проекта – от получения дистрибутива и полной его проверки до установки и миграции – занял около месяца, включая праздничные дни. Для такого, в общем-то, немаленького и важного проекта это отличный показатель. Все-таки внедрение MPP-платформ и развитие аналитических систем уже не является чем-то уникальным, на рынке немало опыта и людей, которые понимают, как это сделать без очевидных проблем.

- Каких результатов уже удалось достичь? Чем можете поделиться?

В основу проекта было заложено именно изменение культуры работы с данными. В этих словах, на самом деле, и находится основная ценность того, чего удалось достичь. Раньше основными инструментами были подручные средства вроде таблиц Excel и маленьких баз данных. Нам удалось довольно быстро перевернуть сознание пользователей, особенно самых прогрессивных, которые с каких-то самодельных решений полностью перешли на работу с RT.Warehouse. Уже сейчас цикл подготовки прототипов и приемки результатов происходит не в виде пересылки какого-нибудь агрегата с конечной цифрой или обмена каким-нибудь огромным файлом Excel. Речь уже идет именно о работе целых департаментов внутри системы. То, что в RT.Warehouse работает не только офис данных, но и бизнес пользователи, — это один из ключевых результатов, которого удалось добиться в короткое время. И это не случайно: использование качественно подготовленных данных и мощного инструмента в некоторых случаях в десятки раз ускоряет время подготовки и обработки данных. Ну и, конечно, важна возможность сохранить результаты не у себя на столе, а в общем доступе для дальнейшей работы.

- Насколько важно наличие продвинутых пользователей, которые выступают проводниками новой технологии?

По сути, на их примере другие департаменты видят, что подход к подготовке тонн специфической операционной отчетности радикально меняется. Оказывается, ее можно делать проще и быстрее, а самое важное — гораздо более гранулярной. Зачастую требуется более серьезный, фундаментальный инструмент для того, чтобы иметь возможность разобрать многолетнюю динамику с точностью до конкретной позиции товара.

- Чтобы быть убедительным в оценке результатов, надо показать бизнесу цифры. Пытались ли оценивать результаты с финансовой точки зрения?

Все-таки проект еще достаточно молодой, и полноценного теоретическо-экономического обоснования с полным анализом затрат пока нет – нам еще предстоит его провести. Не вся функциональность еще внедрена, но отдельные особенности, связанные с скоростью принятия решений, мы уже оценивали и видели эти цифры.

Еще одним важным моментом, который предстоит оценить, является эффект от изменения культуры. Зачастую, когда в компании создают офисы данных, экспертиза по данным начинает сосредотачиваться внутри, но далее никуда не распространяется. И нам видится, что мы смогли обойти эту проблему. Мы не создавали MPP-платформу для регламентированной обработки данных силами дата-офиса, а действительно сделали так, чтобы этот инструмент сразу же попал в руки бизнесу. Бизнес на самом деле гораздо четче понимает пользу самих данных и быстрее может извлечь ее, чем в случае создания каких-то фиксированных показателей в отчетности. Именно свобода, которую нам удалось сохранить и приумножить благодаря доступности данных, является огромным результатом. Это фундаментальная история про эффективность бизнеса, которая даст конкурентное преимущество в будущем.

- В чем роль проекта для бизнеса компании и ее развития?

В эпоху быстрого развития и меняющихся трендов очень важной метрикой является доступность данных и, как следствие, скорость принятия решений. И не отвечать этим вызовам, — это по сути терять, а уметь эффективно отвечать на них, — значит получать конкурентное преимущество. Поэтому для бизнеса построение корпоративного хранилища стало жизненно важным проектом. Мы видим, что другие компании решают эти вопросы более ограниченно, не делая акцент на доступности данных, больше сосредотачиваясь на каких-то общих показателях. Мы же пошли путем более комплексного развития. Бизнес видит это именно как прямую эффективность, связанную со скоростью, гибкостью и углубленным пониманием трендов – например, когда люди, сформулировавшие гипотезу, не сидят в очереди к аналитику, а сами проверяют ее.

- Как вы видите направление развития этого проекта?

Пока направлений развития не сильно меньше, чем на старте проекта, и нельзя выделить отдельный вектор, на котором стоит сосредоточить 90% усилий. Нам приходится до сих пор заниматься технологическими аспектами – например, мы продолжаем интеграцию с источниками данных. Но если все-таки говорить про точку фокуса, то мы больше начинаем смещаться от доступности данных к их прозрачности.

На наш взгляд, мы преуспели в том, чтобы данные стали доступными, но еще не очень много сделали для того, чтобы они были на 100% понятны пользователю. Важно донести цепочку их преобразования. Доверие к ним становится для нас все большим приоритетом. Дальнейшая популяризация созданного нами продукта невозможна без прозрачности данных. Пользователь должен понимать, как данные были подготовлены, как и по каким методикам рассчитаны показатели, почему именно этими данными правильно пользоваться, и это для нас становится все более важным.