В споре «Excel vs система бизнес-аналитики» звучат полярные мнения. Кто-то выступает исключительно за аналитику средствами Excel (под Excel понимается любой табличный процессор), отмечая гибкость работы и простоту изучения инструмента. Другие же уверены, что за электронными таблицами невозможно увидеть единую версию данных — это позволяют сделать только инструменты бизнес-аналитики. Такое противостояние не прекращается: там, где внедряют инструменты бизнес-аналитики, пользователи все равно выгружают данные в Excel. Однако неправильно рассматривать такую ситуацию как борьбу. Речь идет об инструментах, предназначенных для разных задач, но имеющих большое пересечение по функциональности. В каких случаях следует применять конкретный инструмент и как их оптимально бесшовно интегрировать?
Практически любая начинающая компания сегодня ведет всю свою аналитику, используя Excel — инструмент зрелый, зарекомендовавший себя, содержащий множество функций работы с различными базами данных и пр. Однако, по мере роста, компании начинают сталкиваться с проблемами.
Производительность падает, как только приходится работать с большими объемами данных. Например, быстродействие сильно деградирует при вычислении формул и выполнении скриптов. В момент настройки логики анализа обычно не задумываются о работе с большими данными, а когда объемы начинают расти взрывными темпами, система зависает.
Коммуникации в компании нарушаются при передаче знаний через Excel. Достаточно подготовленный пользователь может с помощью электронных таблиц выполнять множество сложных операций, но при организации взаимодействия с другими сотрудниками крайне редко удается передать вместе с готовым файлом все вложенные в него знания. Восстановить связи, разобраться в логике и структуре файла без его создателя — сложнее, чем разобраться в чужом программном коде (отследить все ячейки, формулы, источники данных достаточно трудоемко). Если сотрудник, реализовавший в Excel относительно серьезную аналитику, увольняется или переходит в другое подразделение, то его преемник уже вряд ли сможет использовать созданные наработки в полном объеме.
Отсутствие протоколирования приводит к ошибкам. Бизнес-пользователи могут в Excel многое сделать без вовлечения специалиста по ИТ, что на первый взгляд хорошо, но отсутствие протоколирования ведет к тому, что при решении одной и той же задачи в двух разных отделах результаты окажутся разными. Сотрудники каждого подразделения действуют на основе своих правил и допущений, исполнение которых, скорее всего, не задокументировано.
При агрегировании данных возникают ошибки консолидации. Многим компаниям для формирования единой отчетности требуется собирать данные из всех своих подразделений. Для этого создается форма сбора в табличном процессоре, ее рассылают всем подразделениям, представителям, контрагентам и через определенное время собирают заполненные варианты для создания единой отчетности. Это достаточно просто реализовать, однако большое количество файлов практически невозможно корректно свести воедино: велика вероятность внесения ошибок, происхождение которых отследить невозможно. Например, очень сложно выявить расхождения в периоде исторических данных, введенных в свое время неправильно: данные не коррелируют, и невозможно понять, откуда пошло расхождение. Для этого требуется вручную просмотреть сотни исходных Excel-файлов, которые, кстати, могут быть уже утеряны.
По утверждениям практически всех поставщиков систем бизнес-аналитики (QlikView, Tableau, IBM и др.), их продукты решают все перечисленные проблемы. Однако не так часто говорят о том, что при использовании таких платформ неизбежно возникают новые сложности. Одна из основных проблем классических систем бизнес-аналитики — стоимость внесения изменений, которая существенно выше, чем в табличном процессоре. Если, например, требуется загрузить новые данные, связать их с уже существующими, изменить методику подсчета одного из показателей, удалить неактуальные данные, то в системе бизнес-аналитики сделать это весьма проблематично. Конечно, именно благодаря этому процесс в целом становится методически более правильным и устойчивым, однако возникают ситуации, когда крайне важна именно скорость внесения изменений, а методическая устойчивость общего процесса вторична по значимости. Понятно и то, что поставщики решений стараются предложить рынку максимально гибкие инструменты, чтобы уменьшить стоимость внесения изменений, однако есть предел такого уменьшения, иначе система бизнес-аналитики превратится в Excel.
Если согласиться с тем, что выходом станет применение обоих инструментов, то можно определиться, в каком направлении следует двигаться, а противопоставлению систем бизнес-аналитики и Excel следует предпочесть их глубокую интеграцию и тщательный учет запросов пользователей.
Как показывает опыт выполнения разных по масштабу проектов, ни в одной организации не встречалась ситуация, когда совсем не используются табличные процессоры. Независимо от масштаба предприятия, всегда существуют слишком гибкие, слишком динамичные и слишком устойчивые к ошибкам (стоимость ошибки много ниже, чем стоимость ее исправления) процессы. Это верно и в отношении персональной аналитики в интересах одного сотрудника, решающего конкретную аналитическую задачу, и для корпораций, привлекающих к бизнес-аналитике тысячи специалистов, работающих с сотнями источников информации и с терабайтами данных. Таким образом, выбор табличного процессора или системы бизнес-анализа определяется не масштабом организации, а решаемой задачей.
В отчетах аналитиков и материалах поставщиков систем бизнес-аналитики табличным процессорам обычно отводится весьма скромная роль. Это вполне объяснимо: трудно ожидать от поставщиков решений бизнес-аналитики признаний в том, что некоторые задачи удобнее решать в Excel. Аналитические агентства тоже чаще всего сравнивают платформы бизнес-аналитики друг с другом, а не с Excel, считая их инструментами разного класса. С другой стороны, в любой системе бизнес-аналитики непременно имеются модули интеграции с табличными процессорами. Oracle Hyperion Planning и IBM Cognos, например, позволяют вводить данные через Excel, а облачная платформа Anaplan для финансового и операционного планирования и моделирования бизнес-процессов изначально предусматривала Excel-подобный интерфейс. Пользователи последней — финансовые директора, экономисты, бухгалтеры и пр. — буквально «выращены» на Excel. Аналогичная ситуация наблюдается и с продуктом Power BI — одним из лидеров рынка бизнес-аналитики, также тесно интегрированным с Excel. При разработке языка аналитических функций DAX его разработчики изначально ориентировались на формулы Excel, а инструмент преобразования данных PowerQuery вообще сначала появился как плагин к Excel и только потом начал развиваться в независимую аналитическую систему.
В этом же направлении развивается и эволюционирует платформа Visiology, интеграция средств бизнес-аналитики и Excel (см. рисунок) в которой предусмотрена, например, в рассылке регламентированной отчетности.
Взаимодействие средств бизнес-аналитики и табличных процессоров |
Анализ потребностей пользователей по формированию отчетов показал, что изначально многие операции выполняются в Excel на основе многочисленных готовых шаблонов с большим количеством формул, сложным форматированием, определенной цветовой палитрой, внешним оформлением и т. д. Многие поставщики систем бизнес-аналитики предлагают специальные конструкторы, позволяющие создать отчеты, допускающие сохранение в файлах xls, doc, pdf для их последующего использования в соответствующих редакторах, однако функциональность такого конструктора отчетов всегда будет беднее, чем в Excel. Поэтому имеет смысл изначально реализовать следующий сценарий: отчет настраивается в Excel; система его актуализирует, используя данные из внешних систем бизнес-аналитики, корпоративных хранилищ и других доступных источников; выполняется рассылка отчетов.
Одна из серьезных проблем инструментов бизнес-аналитики — скромные механизмы загрузки данных из табличных процессоров: файлы должны быть определенного вида (один заголовок, все данные в столбцах, использование формата данных long). Такие файлы сильно отличаются от типичных файлов Excel с отчетами, включающими многоуровневые шапки, объединенные ячейки, иерархии и группировки строк и т. д. В них отсутствуют функции «матчинга», облегчающего процесс сопоставления справочников, указанных в таблице Excel, с данными из аналитической системы. Если, например, нужно загрузить архив с данными за десять лет в Excel-формате, скомпонованными как ежемесячные отчеты с десятков предприятий по разным направлениям, то таких возможностей будет явно недостаточно. Кроме того, Excel может быть настолько плотно встроен в процесс отчетности, что быстро заменить этот табличный процессор не получится: какое-то время понадобится для поддержки текущих процессов сбора данных. Такая ситуация типична для госучреждений, собирающих отчетность от своих географически распределенных подведомственных или смежных организаций. В условиях плохой связи ввод данных через, например, веб-формы работает плохо, и файлы Excel оказываются единственным возможным решением. Для таких случаев в платформе Visiology предусмотрен веб-сервис, позволяющий вручную или автоматически загружать Excel-файлы, которые пользователь затем может разметить, указав местоположение данных и справочников, и загрузить в систему сбора данных Visiology. Система позволяет разрешить неоднозначности, возникшие при загрузке (например, слияние по элементу справочника не произошло — отсутствуют кавычки), и оповестить пользователя, который может исправить ошибку в исходном документе или создать новый элемент справочника. После этого пользователь может сохранить созданную разметку в виде шаблона и применять к следующим файлам, не тратя время на повторную разметку. Если новые файлы не будут различаться по разметке и по данным, импорт будет выполняться автоматически. Поскольку на каждом этапе происходит загрузка в систему сбора данных, то сохраняется полный аудиторский след (кто, когда и что загрузил) с возможностью отката по цепочке.
***
Инструменты платформы Visiology для поддержки взаимодействия системы бизнес-аналитики и табличного процессора сегодня эксплуатируются в ряде организаций, обеспечивая требуемую производительность, сохраняя коммуникации и исключая ошибки консолидации, возникающие на стыке работы двух инструментов. Для развития платформы запущен сервис ViLabs для учета возникающих запросов пользователей и совершенствования функций аналитической платформы.
Иван Вахмянин (ivan@visiology.com) — генеральный директор, компания Visiology (Москва).