За 15 лет работы банка DeltaCredit постоянно меняющийся ландшафт информационных систем привел к существенной гетерогенности и разобщенности важных для банка данных. До недавнего времени сведения о каждом клиенте на каждом этапе его жизненного цикла — от заявки до погашения кредита — находились в разных информационных системах, поэтому очень сложно было построить единую управленческую отчетность, опирающуюся на данные из всех учетных систем банка.
«Гибкая аналитика является преимуществом для банка», Михаил Северов, руководитель стратегических проектов банка DeltaCredit |
Отчеты формировались разными подразделениям и зачастую готовились вручную с использованием Microsoft Excel, Access и т. д. «Требовался удобный гибкий инструмент, чтобы строить отчетность на основании информации, накопленной банком за весь период обслуживания клиента, и привлекать все имеющиеся данные», — рассказывает Михаил Северов, руководитель стратегических проектов банка DeltaCredit. Важно было получить легкий доступ к данным не только об открытых кредитах, но и о закрытых, а также просроченных и находящихся на пересмотре. Однако и этого было бы недостаточно: сотрудники банка хотели получить не просто набор новых отчетов, а возможность самостоятельно, с минимальными трудозатратами, без привлечения ИТ-специалистов строить необходимые им отчеты с любым набором данных. Все эти обстоятельства привели руководство банка к необходимости организовать корпоративное хранилище данных.
Точка отсчета
Проект по созданию хранилища данных начался с выбора платформы и подрядчика. По словам Северова, было принято решение сначала выбрать платформу, а затем определить интегратора. В банке на тот момент уже были внедрены две платформы — СУБД Oracle для банковской системы и Microsoft SQL Server для CRM-системы.
Приглашенные банком независимые эксперты провели подробный сравнительный анализ различных платформ для реализации хранилища данных. Было очевидно, что в качестве основы создаваемой системы следует взять три компонента: СУБД как основу хранилища; инструмент для сбора и загрузки данных из разнородных источников (Extract, Transformation, Load, ETL); BI-систему как основной инструмент работы пользователей с данными из хранилища при построении отчетов.
«На сегодняшний день в корпоративном хранилище данных имеется порядка 300 таблиц», Владимир Гридчин, менеджер проектов банка DeltaCredit |
В числе требований к платформе были масштабируемость, надежность, производительность, перспективность технологий, стоимость приобретения и эксплуатации, информационная безопасность и т. д. В итоге в качестве СУБД было выбрано решение от Oracle, в качестве ETL-инструментария — Oracle Data Integrator, а в качестве BI-системы — SAP Business Objects.
Интеграторы выбирались по результатам тендера. Основными требованиями к ним были: опыт внедрения хранилищ данных в банковской сфере, организация банку визита к одному из клиентов, где такая система уже внедрена, наличие гибкой модели данных, развитие которой возможно силами специалистов банка. Также, конечно, учитывались стоимость предлагаемого проекта. «Преследовалась цель — выбрать партнера таким образом, чтобы минимизировать риск попасть от него в зависимость», — поясняет Северов. В результате была выбрана компания BI Partner, входящая в группу «Ай-Теко».
Требования и данные
Поскольку хранилище данных является общекорпоративным активом, единственного заказчика у этого проекта не было. «В роли заказчиков выступали все бизнес-подразделения: кредитный департамент, департамент по работе с рисками, департамент маркетинга, казначейство, департамент продаж, аналитический отдел, отдел по работе со страховыми и оценочными рисками, отдел по работе с просроченной задолженностью и др.», — вспоминает Северов. Сложнее всего оказалось согласовать бизнес-требования, поскольку каждый департамент имел свою точку зрения на состав и логику выбора данных. Нередко их требования было практически невозможно совместить. Нелегкая задача по поиску компромисса была возложена на подрядчика.
Важнейшим этапом на пути построения хранилища данных стало создание глоссария, который включает в себя общие для организации определения всех сущностей в хранилище данных. «В ходе анализа выяснилось, что единого глоссария в банке не существует», — отмечает Владимир Гридчин, менеджер проектов банка. Один и тот же термин (например, просроченная задолженность) в разных подразделениях понимают по-разному. Чтобы можно было использовать разные определения, пришлось ввести в модель данных расширенный набор атомарных сущностей — на их основе можно рассчитывать все необходимые показатели в рамках разных определений (в частности, разные варианты сроков просроченной задолженности), используя витрины данных. Такой подход позволил избежать излишнего разрастания семантических слоев.
Предложенная специалистами BI Partner модель данных, ориентированная на универсальный банк, была адаптирована к особенностям DeltaCredit, основной бизнес которого — предоставление ипотечных кредитов: из модели были удалены избыточные объекты, соответствующие различным направлениям деятельности универсальных банков, и добавлены объекты, связанные с особенностями ипотечного бизнеса. Работа велась совместно с BI Partner: банк формулировал требования на бизнес-уровне, а интегратор интерпретировал их в термины модели данных. На этапе анализа проводились совместные встречи с каждым бизнес-заказчиком. По итогам встреч вся собранная информация тщательно фиксировалась, а затем передавалась на согласование в бизнес-подразделения. После подтверждения все требования были сведены в одно большое техническое задание.
Интеграция с источниками данных
Хранилище было создано за полгода. Сразу помещать в него весь объем данных было нецелесообразно, поскольку их количество постоянно меняется, поэтому в модели данных был определен «скелет» — основные сущности, которые были загружены в хранилище в первую очередь.
Реализацией модели данных в Oracle занимались специалисты BI Partner. Еще при запуске проекта была достигнута договоренность с BI Partner и SAP о том, что для сотрудников банка будет проведено обучение. Один поток объединил будущих бизнес-пользователей Business Objects, другой — сотрудников ИТ-департамента, которым предстояло взять на себя роль разработчиков для поддержки и развития модели данных, а также работу с инструментами ETL.
На первом этапе было решено подключить только два источника данных: единую CRM-систему банка, в которой оформлялись заявки на предоставление ипотечных кредитов и подготавливались сделки, и автоматизированную банковскую систему (АБС), в которой создаются счета, оформляются кредитные договоры и фиксируются операции по их обслуживанию. ETL-процедуры разрабатывали консультанты BI Partner, ИТ-департамент банка выступал для них в качестве контролера, анализируя правила обработки тех или иных наборов данных.
Проектная команда взялась получить правильный, востребованный пользователями результат проекта всего за один проход, без итераций и существенных переделок. Внедрение состояло из четырех этапов: анализа и подготовки технического задания; разработки; внедрения и тестирования; перевода системы в промышленную эксплуатацию с подготовкой эксплуатационной документации и документации по администрированию всего комплекса решений.
Основа для аналитики
В самом начале проекта, чтобы проанализировать качество работы создаваемого хранилища, было определено порядка пяти-семи контрольных отчетов. Их предполагалось реализовать на основе данных из хранилища и сопоставить с такими же отчетами, построенными на данных в АБС. При подготовке процедур формирования этих отчетов были определены необходимые витрины данных и агрегаты. «На сегодняшний день в корпоративном хранилище данных имеется порядка 300 таблиц, из них витрин данных — около трех десятков», — рассказывает Гридчин.
Основным эффектом внедрения BI-системы стало то, что сократилось время подготовки аналитической и управленческой отчетности банка, так как почти отпала необходимость запрашивать отчеты в ИТ-департаменте. Теперь бизнес-подразделения могут самостоятельно строить интересующую их отчетность в рамках предоставленных семантических слоев. «Гибкая аналитика, внедренная в рамках проекта, является преимуществом для банка, поскольку дает пользователям удобный инструмент для самостоятельной и быстрой подготовки отчетности без привлечения ИТ-службы, — резюмирует Северов. — Бесспорно, внедрение корпоративного хранилища данных позволило банку повысить прозрачность своих процессов и сделать их более управляемыми».