Надежный источник информации — мечта каждого руководителя. Превратить мечту в реальность позволяет внедрение хранилища данных. Подобные проекты весьма затратны, но другого пути, видимо, нет.

Известно, что хороший аналитический инструмент помогает компании принимать более качественные управленческие решения, оптимально распределяя ее усилия и ресурсы и способствуя таким образом получению максимальной прибыли и повышению конкурентоспособности бизнеса. Как показывает опыт, создание хранилища данных помогает превратить накопленные данные в надежный фундамент для поддержки принятия решений с помощью средств BI.

 

В начале пути

Когда чуть более года назад Андрей Щукин занял должность руководителя аналитического отдела фармацевтической компании «Валента Фарм» и познакомился с объемом данных, а также теми усилиями, которые предпринимали аналитики, чтобы превратить их в знания, он понял, что эти люди работают на пределе своих возможностей. С утра до вечера группа сотрудников занималась формированием стандартных отчетов, которые необходимо было получать с определенной периодичностью. Подготовка некоторых из них занимала до шести месяцев, поскольку обновление одного из источников данных происходило раз в полгода. Малейшее уменьшение численности персонала или увеличение объемов выполняемых ими работ могло привести к срыву сроков предоставления данных.

«Отсутствие достоверных данных — общая проблема статистики в России», Андрей Щукин, руководитель аналитического отдела компании «Валента Фарм»

В целом, по словам Щукина, предоставляемые в то время потребителям информации отчеты были очень трудоемкими. Под большим вопросом также была их ценность для бизнес-заказчиков — менеджеров по продуктам и топ-менеджеров компании. Как выяснилось из разговоров с ними, далеко не вся информация в генерируемых для них отчетах необходима им для работы. Стало очевидно, что можно сократить отчеты и изменить форму подачи полезной информации. Кроме того, вид отчетов был сформирован два-три года назад, и новая информация, появившаяся за это время, в отчетах просто не отражалась. Оказалось, что имевшиеся источники данных непостоянны — компания меняет поставщиков данных год от года, в результате чего возникают нестыковки значений тех или иных показателей от периода к периоду. «Отсутствие достоверных данных — общая проблема статистики в России», — считает Щукин.

Для аналитических потребностей в компании активно использовали Microsoft Excel, который, обладая многими преимуществами, не позволял без значительных усилий объединить данные из разных источников из-за отсутствия единой нормативно-справочной информации. Одни и те же объекты (например, территории), упомянутые в разных источниках, могли иметь разные названия. Необходимо было наладить управление НСИ.

Прежде, чтобы дать ответы на нестандартные запросы менеджеров по продуктам, по словам Щукина, требовалось много времени и трудозатрат, ответ часто запаздывал, и продакт-менеджер принимал решение интуитивно. Аналитическая работа не поспевала за исполнением бизнес-процессов. Менеджеры по продуктам были морально готовы к задержкам со стандартными отчетами в несколько месяцев, поэтому ориентировались либо на данные аналогичного периода за прошлый год, либо работали интуитивно и, только получив, иногда через полгода, отчет, могли оценить, насколько правильно они поступили.

Чтобы осознать всю важность управленческой отчетности для менеджеров по продуктам, необходимо понимать специфику их работы в фармакологии. Основное решение, которое они должны принять, — это решение о целесообразности посещения медицинскими представителями тех или иных врачей. В основе распространения рецептурных препаратов фармацевтическими предприятиями лежит взаимодействие медицинских представителей с врачами различных специальностей. Для повышения результативности этого взаимодействия необходимо иметь данные о том, какие препараты выписывают те или иные врачи. При задержке отчетов до полугода медицинский представитель может посещать врачей, чей потенциал выписки препарата невысок.

 

Удачное начало

Ранее руководство компании не уделяло работе аналитиков много внимания. Наибольшая значимость придавалась анализу бухгалтерских данных. Подразделение Щукина проанализировало связь между отгрузками и вторичными продажами (продажи дистрибьюторов в аптеки). В частности, распространенной практикой многих компаний являются большие отгрузки в конце года с целью, например, выполнения плана. Вместе с тем во многих компаниях с нового года повышается цена. Дистрибьютор, видя эту ситуацию, повышает цену продажи полученного в декабре товара. Но он-то получил его по старой цене с дополнительной скидкой за большой объем. Следовательно, производитель недополучает доход, оседающий у дистрибьютора. Таким образом, был обнаружен возможный источник дополнительной прибыли.

«Мы стремимся понять, где банк зарабатывает деньги и куда их тратит», Александр Олешко, директор департамента ИТ «Проминвестбанка»

Функционала Excel вполне хватало, но, отмечает Щукин, для объединения хотя бы четырех источников был нужен очень мощный компьютер. Кроме того, если возникала необходимость анализировать данные за большой промежуток времени по всем территориям, где присутствуют медицинские представители компании, то размер файла Excel достигал 150–250 Мбайт. Распространить этот файл по региональным менеджерам непросто, поскольку далеко не везде существуют хорошие каналы связи. Кроме того, необходимо сопоставлять данные о приросте объемов продаж с динамикой сегмента, чтобы получать объективное представление о результатах работы. Очевидно, что скорость роста объемов продаж не должна быть меньше скорости роста сегмента. Если включить в распространяемый файл и эти данные, его объем может увеличиться в два раза. В результате даже в центральном офисе, находясь в локальной сети, приходилось долго ждать загрузки требуемого отчета на компьютер.

 

Основа BI

Было решено использовать промышленную СУБД для хранения данных и Excel в качестве инструмента анализа. Как показывали предварительные оценки, реализовать этот вариант можно быстро, но скорость подготовки отчетов снизится за счет самостоятельно реализованных ETL-процедур.

Летом прошлого года было принято решение о создании хранилища данных. В качестве исполнителя была приглашена компания BI Partner (входит в ГК «Ай-Теко»). Опыт реализации хранилищ данных для фармацевтических компаний у подрядчика на тот момент уже был, но, с точки зрения Щукина, в работах такого рода отраслевая компетенция не так важна, как общий опыт построения хранилищ. Кроме того, BI Partner предложила приемлемые для компании сроки и стоимость работ.

Спецификой реализации хранилища являлось наличие отдельной системы управления НСИ. ИТ-специалисты компании «Валента Фарм» разрабатывали ее самостоятельно, не используя тиражируемые решения. В сотрудничестве с внедряющей компанией ими были также созданы интерфейсы для справочников в создаваемом хранилище данных. Наполнением справочников занимался аналитический отдел Щукина.

В качестве платформы СУБД в обоих проектах использовался Microsoft SQL Server. Выбор СУБД определялся в первую очередь стоимостью лицензий. Все ETL-процедуры для хранилища были реализованы BI Partner при постоянном взаимодействии с ИТ-специалистами фармкомпании, которые разрабатывали необходимые интерфейсы учетных систем — источников данных хранилища.

В проекте было задействовано четыре основных источника данных. Первый — источник данных о рынке. Данные здесь выгружаются из внешней базы в виде таблицы Excel раз в месяц, затем она перегружается в хранилище. Второй — источник данных о вторичных продажах. После обработки отчетов от дистрибьюторов данные помещаются в файл Microsoft Access. Эти данные также автоматически загружаются в хранилище. Третий источник — бухгалтерское приложение, из которого берутся данные об отгрузках. Наконец, четвертый — CRM-система медицинских представителей, которые синхронизируют свои данные с данными офиса еженедельно.

 

Инструмент анализа

В Акционерном коммерческом промышленно-инвестиционном банке («Проминвестбанк») стартовал проект создания нового корпоративного хранилища данных и системы отчетности. Основной бизнес-заказчик этого проекта — Мехди Ширази, директор департамента операционной и финансовой деятельности.

«Мы стремимся понять, где банк зарабатывает деньги и куда их тратит», — поясняет Александр Олешко, директор департамента ИТ «Проминвестбанка». Основная цель проекта — создать условия для получения более достоверной и всеобъемлющей управленческой отчетности, которая станет реальной основой для принятия управленческих решений. На сегодняшний день проект реализован менее чем наполовину, но при этом бизнес-заказчики уже получили важные результаты. Выяснилось, например, что некоторые из клиентов, многие годы считавшиеся сверхприбыльными для банка, на самом деле убыточны для него.

До начала проекта управленческая отчетность в банке готовилась с помощью хранилища данных на платформе Sybase IQ, внедренного силами ИТ-специалистов банка. Позже от этого решения пришлось отказаться из-за его негибкости. По словам Олешко, за годы жизни банка в нем накопилось около 2800 отчетов. Руководство на всех уровнях менялось, другими становились и требования к отчетам, при этом иногда вместо того, чтобы немного исправить старый отчет, разрабатывался новый. В результате система отчетов стала требовать слишком сложной и дорогой ИТ-поддержки.

В 1999 году у банка сменились акционеры, после чего началось его полное технологическое перевооружение. Было заключено стратегическое соглашение с корпорацией Oracle, и банк приобрел несколько продуктов Oracle, в том числе готовое решение для банка, содержащее модель данных для его хранилища данных, — Oracle Financial Services Analytical Applications (OFSAА). Появилась возможность заменить приложения собственной разработки на более совершенное промышленное решение. По результам тендера была выбрана новая банковская система — Oracle Flexcube, поддерживающая модель данных OFSAA.

На сегодняшний день в банке работают два хранилища данных и, пока проект, реализуемый при сотрудничестве с компанией «РДТех», не завершен, основным является старое. Новое хранилище активно разрабатывается, в него добавляются данные из уже подключенных источников, подключаются новые источники данных. Пока в хранилище реализована только часть необходимых для работы отчетов. Их состав и структуру определяет множество бизнес-заказчиков. Также в банке выстроен единый процесс добавления новых ИТ-артефактов, в частности отчетов. Ответственным является управляющий комитет по ИТ, который сопоставляет требуемые для инновации ресурсы и ожидаемый эффект. В скором времени планируется создать специальное аналитическое подразделение, не входящее в ИТ-департамент. Его сотрудники с помощью Oracle BI будут в состоянии самостоятельно конструировать и модифицировать отчеты.

 

Технические детали

По словам Олешко, проект не сводится к простой миграции с одного хранилища на другое. Сделать это практически невозможно из-за принципиальных различий платформ и степени документированности старого хранилища. Приходится все строить заново: данные извлекаются из систем-источников, проверяются на наличие ошибок, ошибки устраняются, данные закачиваются в новое хранилище и используются для построения отчетов новыми средствами. Модель данных OFSAA в целом сохраняется, подвергаясь лишь незначительной корректировке. Дальнейшую поддержку хранилища банк рассчитывает обеспечивать самостоятельно, для этого готовит своих специалистов. Их обучает «РДТех». Кроме того, ИТ-специалисты банка участвуют в реализации проекта и учатся в ходе выполнения работ.

Для реализации ETL-процедур используется Oracle Data Integrator. Сами ETL-процедуры, по словам Олешко, пишутся своими силами, поскольку большинство источников — старые информационные системы собственной разработки. Что касается витрин данных, то на данном этапе проекта для управленческой отчетности используются стандартные витрины, которые предлагает Oracle. Для регуляторной отчетности «РДТех» создал специальные витрины. Витрины спроектированы для использования OLAP-технологий, которые лежат в основе формирования управленческой отчетности. Именно они дают возможность пользователям относительно просто создавать отчеты и модифицировать их.

Одна из наиболее сложных частей проекта — это обеспечение достоверности данных в хранилище. В старом хранилище при обнаружении неверных данных в процедуру формирования отчета добавлялся код, позволявший исправить в отчете ошибку. В хранилище неверные данные продолжали существовать. В текущем проекте поставлена задача исключить наличие недостоверных данных. Если отчет не может быть сформирован по причине некорректности данных, осуществляется исправление источника с последующей перезагрузкой. Занимается этой работой специальная группа обеспечения качества данных.