В Альфа-Банке внедрили подход Data Governance by Design. Это позволило выстроить процесс управления данными как корпоративным активом на всех этапах жизненного цикла данных. О реализации проекта рассказывает Александр Бояркин, руководитель дирекции развития процессов управления данными Альфа-Банка и номинант на премию Data Award.

- Каков путь Альфа-Банка в Data Governance?

Альфа-Банк развивает направление Data Governance с 2020 года. Первый этап был сосредоточен на работе с хранилищем данных и высококритичными регуляторными процессами. На втором этапе, начиная с 2023 года, зона влияния Data Governance расширилась на все данные, проходящие через хранилище, в том числе систему самообслуживания (self service). Появились системы мониторинга соответствия объектов Data Governance стандартам и качеству данных, а также первые автоматизированные проверки в рамках производственного цикла.

С 2024 года начался третий этап – трансформация всего data-ландшафта и внедрение принципов Data Governance by Design.

- Какие проблемы привели к необходимости полномасштабного тиража практик управления данными на банк?

Ключевыми драйверами развития Data Governance послужили как внешний, так и внутренний контекст. Внешний контекст для нас – это усиление внимания регулятора за управлением данными в банках, динамичное развитие ИИ и рост доли решений на основе ИИ, а также борьба за лучший клиентский сервис.

Внутренний контекст также включает несколько направлений. Это оптимизация рутинных задач для сотрудников, работающих с данными (мы их называем data people), – поиск, понимание, интерпретация данных. Также важно повышение доверия к данным и качеству отчетности и демократизация доступа к данным, в том числе с помощью инструментов low-code/no-code. Наконец, был запрос на формирование культуры управления данными.

- Какие были ключевые направления работы?

На пересечении внешнего и внутреннего контекстов мы выделили четыре ключевых направления: ролевая модель, единые правила, инструменты, культура. Каждое направление переросло в функцию со своими целями, задачами и командой.

Мы начали с самых продуктивных и важных этапов: с людей и создания новой ролевой модели. Первым шагом стало внедрение новой системы распределения ответственности: банк был разделен на более чем 20 доменов — предметных областей, в каждой из которых определены владельцы данных из числа бизнес-лидеров функций. Параллельно была сформирована отдельная команда Data Governance, отвечающая за координацию работ и поддержку доменов. В ее зону ответственности входит помощь с внедрением практик управления данными в доменах, развитие инструментов управления данными, а также формирование и развитие сообщества data people.

Работу в доменах начали с наиболее критичных процессов, где есть «боли» у бизнеса. Интересно, что ожидания у владельцев доменов от внедрения Data Governance были разные. Для большинства команд релевантно повышение качества, ответственности, прозрачности и переиспользования данных.

В процессе мы также столкнулись с важным выводом: в банке не было функции, которая могла бы взять на себя работы по домену клиентских данных — при том, что именно клиентские данные являются одними из самых ценных. Поэтому управление этим доменом мы взяли на себя.

- Какие новые роли появились?

Мы выстроили федеративную модель организационной структуры, поэтому появились три новые роли. Первая из них – локальные CDO, ставшие владельцами доменов (предметных областей). Вторая важная роль – дата-стюарды доменов, которые являются движущей силой DG-трансформации и непосредственно организуют работы по повышению зрелости управления данными в доменах. Третья роль – Data Governance-партнеры, которые в формате наставничества занимаются внедрением практик Data Governance by Design совместно с командой домена.

- В чем уникальность такого подхода?

Во-первых, мы приняли решение при тираже практик делать фокус не столько на создании регламентов и контроле их исполнения, сколько на поиске существующей инициативы внутри доменов, вовлечении в работу этих людей и распространении культуры работы с данными. На этом этапе принципиально важно наличие партнеров от централизованной команды, которые смогут помочь и провести онбординг дата-ролей команды домена.

Во-вторых, мы поняли, что, не изменив сам производственный цикл дата-продуктов в банке, невозможно дотянуться до всех процессов. Именно так мы и пришли к концепции 'Data Governance by Design', когда правила встраиваются во все этапы жизненного цикла данных – от проектирования до сопровождения.

При таком подходе в дата-контракте сразу фиксируются ключевые элементы: процесс, критичные данные в нем, а также требуемые контроли по качеству данных. При внедрении в промышленную среду метаданные автоматически загружаются в каталог данных.

- Какие ИТ-продукты использованы для повышения зрелости управления данными в банке?

Ранее мы использовали «коробочные» решения (Alation и др.), но начиная с 2022 года был выбран путь развития инструментов на основе продуктов open source и самостоятельной разработки.

Одним из приоритетов мы считаем обеспечение дата-специалистов эффективными инструментами для работы с данными. В рамках этого направления мы активно развиваем собственный каталог данных, в котором уже зарегистрировано более 1 млн дата-объектов. Каталог предоставляет широкий набор инструментов: заведение обращений по объектам, мониторинг их решений, карта данных (lineage), профилирование объектов, оценка влияния на потребителей и др.

Кроме того, мы разработали собственную платформу для создания и мониторинга контролей качества данных, которая также интегрирована с каталогом данных.

- Что в ходе проекта было самым сложным?

Самым сложным было определить зоны ответственности различных дата-ролей относительно объектов управления данными: кто и когда должен реагировать, кто отвечает за описание и поддержку функционала в актуальном состоянии и т.п. Особенно это касается кросс-доменных объектов, которые используются большим количеством команд.

- Какие результаты можете отметить?

Внедрение практик Data Governance привело к ряду изменений в повседневных обязанностях data-ролей в доменах. Удовлетворенность сотрудников работой с данными выросла на 20%. Сократилось время на получение данных на 10%. Время на решение инцидентов с данными уменьшилось также на 10%.

Реализация проекта заложила фундамент для развития цифровых продуктов. Data Governance стал «сквозной инфраструктурой», поддерживающей рост банка. Кроме того, мы сделали прозрачной оргструктуру: локальные офисы CDO и четко прописанная ролевая модель упростили коммуникацию между различными подразделениями банка.

- В каких направлениях будет развиваться управление данными в банке дальше?

Наша задача – максимально автоматизировать управление данными и упростить работу с ними для сотрудников. Мы развиваем помощников и чат-ботов для быстрого поиска и навигации по данным, маркетплейс данных, получение синтетических данных на основе сэмплов.

Параллельно будем продолжать совершенствовать качество данных, в том числе за счет применения ИИ-технологий для выявления аномалий и выбросов.