Управление данными из модного словосочетания переросло в целую отрасль ИТ-индустрии — в 2022 году мировой рынок Data Governance оценивался примерно в 2,6 млрд долл. с прогнозом роста около 20% в год [1]. Рост объемов и разнообразия данных побудил ведущие российские компании и предприятия задуматься над применением решений для управления этими данными. Многие корпорации уже прошли этап оценки своих текущих практик управления данными и разработки планов, сформировали стратегии развития и политики управления данными. Но образовался большой разрыв между лидерами рынка и остальными компаниями — за счет инициатив в области данных первые могут тратить до 75% меньше времени на операции, связанные с подготовкой данных для аналитики, задач ИИ и пр. [2].
Вместе с тем развитие рынка управления данными привело к появлению множества готовых коммерческих решений и систем категории Open Source, поддерживающих автоматизацию процессов ведения каталога метаданных, профилирования данных, контроля качества данных и пр. Такие системы могут быть внедрены сравнительно небольшими усилиями, а компании получают возможность расходовать на это относительно небольшие ресурсы. Однако, как и в случае с любыми системами автоматизации процессов, подобные средства лишь помогают решить проблему. Успех зависит от того, правильно ли на предприятии выстроены процессы — если они не достигли определенного уровня зрелости, внедрение системы управления данными ожидаемых плодов не принесет.
В доступном информационном поле сегодня много материалов, посвященных внедрению тех или иных информационных систем, а вот публикаций об особенностях оценки зрелости процессов компании, к сожалению, относительно мало [3].
Начало
В DMBOK (Data Management Body of Knowledge) [4] есть глава про подходы к оценке зрелости процессов управления данными. В ней предлагается, оценив уровень зрелости для каждой из областей знаний, определить пробелы и точки роста, а затем разработать дорожную карту развития. Рекомендуется проводить эту оценку поэтапно:
- сбор информации;
- оценка;
- интерпретация результатов;
- подготовка отчета.
Рис. 1. Рамочная структура управления данными DAMA-DMBOK2 (колесо DAMA) [5] |
Ограниченность ресурсов требует эффективного планирования и их бережного использования. Очевидно, что управление данными проводится в организации еще до внедрения практик рамочной структуры (рис. 1) и обычно представляет собой договоренности, практики и инструменты, используемые для решения насущных задач. Часто подобные инициативы исходят от сотрудников и подразделений, чьи результаты напрямую зависят от организации работы с данными. Проводя оценку зрелости DMMA и внедряя практики рамочной структуры управления данными, полезно воспользоваться этими наработками. В нашей ситуации реализация инициатив по управлению данными осуществлялась в условиях, когда функции Data Office и CDO были переданы департаменту аналитических решений.
Сбор и оценка информации
Если у компании нет возможности начать оценку зрелости в масштабах всей организации, то DMBOK рекомендует делать локальные оценки с привлечением ограниченного круга экспертов и распорядителей данных. Они смогут точечно оценить уровень зрелости по наиболее критичным или перспективным для компании направлениям. Есть смысл задействовать архитекторов информационных систем, системных аналитиков, дата-инженеров и дата-аналитиков. Мы, например, проводили серию встреч в формате мозговых штурмов, каждая из которых была посвящена отдельной области знаний DAMA (рис. 1). Цель такого штурма — перечислить артефакты, процессы и роли, которые уже существуют в организации и относятся к управлению данными в конкретной прикладной области. Изначально никто из приглашенных специалистов не был знаком с рамочной моделью управления данными, но во всех встречах участвовали эксперты по управлению данными, которые вводили присутствующих в курс дела. Чтобы такие встречи были эффективными, с участниками проводился предварительный разбор контекстной диаграммы областей знаний (рис. 2). Кроме того, эксперт объяснял, какие из упоминаемых артефактов и процессов относятся к области знаний, которой посвящена встреча, а какие нет и почему.
Рис. 2. Контекстная диаграмма области знаний [5] |
Полученные списки позволили впоследствии составить план внедрения системы управления данными и соответствующим образом ее настроить. В таблице приведен пример с результатом такой встречи по метаданным.
Внимание к уже существующим на предприятии практикам позволило снизить сопротивление изменениям со стороны причастных к этим практикам департаментов и сотрудников. Когда сотрудники, задействованные в процессах по управлению данными, поняли, что рамочная модель внедряется не для кардинального слома привычных способов работы с данными, а для их улучшения, они стали больше заинтересованы в новых идеях.
Особое внимание следует уделить интервью с руководителями и экспертами бизнес-направлений, а также со специалистами сервисных подразделений, таких как служба безопасности и финансовая служба. Именно они распоряжаются ресурсом и в перспективе могут стать спонсорами изменений или даже агентами влияния. В процессе интервью определяются проблемы работы с данными, достаточность обеспечения данными и незакрытые потребности.
Данные, которые были получены в результате интервью, фильтровались:
- проблемы, связанные с данными, отделялись от прочих;
- проблемы с данными, относящиеся к дата-продуктам, отделялись от процессных;
- определялись точки пересечения и конфликты требований разных подразделений;
- выявленные потребности преобразовывались в задачи, и фиксировались зависимости.
Результатом встреч стало определение уровня зрелости по CMM [6], который отличался в разных подразделениях, а также формирование классифицированного списка потенциальных улучшений и зависимостей между ними. Преобразование в задачи позволило выявить будущих заказчиков корпоративной системы управления данными.
От мозговых штурмов и интервью был получен еще один эффект. Разъяснение принципов и методов управления данными позволило повлиять на организационную культуру, подчеркнуть важность отношения к данным как к ценному активу, добиться понимания критичности работ по управлению данными и наладить сотрудничество.
Дополнительным источником информации о потребностях организации в средствах управления данными стал анализ текущих и прошлых стратегических проектов компании, связанных с данными. Стратегические проекты направлены на реализацию наиболее перспективных и приоритетных направлений. Как правило, такая деятельность находится на особом контроле, и проблем с тем, чтобы получить информацию о ходе работы, целевых показателях и возникших сложностях, нет. Для нас ценной стала история задач в корпоративном таск-трекере (Jira). Анализ этих данных позволил выявить точки роста, связанные с данными, и конкретные подразделения, с ними связанные. Хороший признак наличия таких точек — циклически повторяющиеся ошибки и сбои, связанные с данными или ошибками в системах. Тот факт, что точки роста были связаны со стратегическими проектами, позволил упростить обоснование перед топ-менеджментом ценности инициатив по данным.
Интерпретация результатов и подготовка отчета
Проецирование практики управления данными из DMBOK на текущее состояние дел в компании позволило разработать меры по повышению уровня зрелости. Выявленные незакрытые потребности помогли определить, какие из этих мер наиболее востребованы.
Адресность опросов и определение текущих ролей, связанных с управлением данными, позволили уже на этом этапе определить, кто готов тратить ресурс на имплементацию практик управления данными именно в тех случаях, когда они могут удовлетворить актуальные потребности заинтересованных сторон.
Сформулировав пул проектов, можно переходить к продаже внутренним заказчикам услуг по разработке решений. Основная задача на этом этапе — формулировка эскиза проекта, демонстрирующего, как можно решить проблемы заказчика и вернуть потраченные ресурсы. Такой подход представлялся наиболее действенным в случае горизонтального распространения в компании практики управления данными, ориентированного на быстрый и конкретный результат. Понимая необходимость уже на первых этапах доказывать эффективность практик управления данными, мы разбили список проданных проектов по следующим критериям:
- соответствие стратегическим целям компании;
- вычислимость и наглядность материального результата;
- отношение затрат к результату.
Полученный список проектов представляет собой основу корпоративной программы развития управления данными. В нее вошли проекты, связанные с четырьмя областями знаний: метаданные, качество данных, архитектура и хранение, операции с данными. Это самые востребованные направления, позволяющие добиться ощутимого результата при сравнительно небольших затратах.
Чтобы защитить программу по развитию управления данными перед руководством, ее сформировали в виде плана с подробными этапами, затрагивающими оперативный период в шесть месяцев и список конкретных задач в интересах конкретных заказчиков. Из менее приоритетных проектов была составлена дорожная карта на полтора года.
Для успешной защиты плана перед руководством компании потребовались конкретные показатели затрат и метрики оценки результатов: количество пользователей, перешедших на новые инструменты управления данными; трудоемкость задач, связанных с данными для оперативного периода, и пр.
***
Подготовка к развертыванию системы управления данными означает не только развитие соответствующей корпоративной культуры — внутренние заказчики должны осознать и сформулировать свои потребности по работе с данными. Более того, непременно найдутся заказчики, готовые активно участвовать в управлении данными и стать агентами влияния в компании. В дальнейшем их можно привлекать к регулярным встречам, например в рамках функции Data Office.
Концентрация на насущных проблемах и выход на заказчиков, готовых тратить ресурсы на развитие инструментов и практик улучшения работы с данными, позволяют сформировать программу развития управления данными и быстро перейти к конкретным шагам. Наличие метрик и оценок эффекта от инициатив дает возможность наглядно представить результаты руководству.
Системный подход к формированию пула проектов позволяет выявить взаимосвязи и соседние проблемы, что в итоге означает синергетический эффект от реализации проектов по управлению данными.
Еще один полезный вывод — при реализации функций управления данными не в выделенном Data Office, а в департаменте аналитических решений естественной оказалась именно федеративная, или сетевая, организационная структура компании.
Литература
1. URL: https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/designing-data-governance-that-delivers-value (дата обращения: 21.12.2023).
2. URL: https://www.dataversity.net/trends-in-data-governance-in-2023-maturation-toward-a-service-model (дата обращения: 21.12.2023).
3. Светлана Бова, Алексей Наталенко. Как обосновать инвестиции в качество данных // Открытые системы.СУБД. — 2023. — № 2. — С. 35–37. URL: https://www.osp.ru/os/2023/02/13057147 (дата обращения: 21.12.2023).
4. Николай Скворцов. DAMA-DMBOK2: трудности перевода // Открытые системы.СУБД. — 2020. — № 2. — С. 44–45. URL: https://www.osp.ru/os/2020/02/13055423 (дата обращения: 21.12.2023).
5. DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International [пер. с англ. Г. Агафонова]. — Москва: Олимп — Бизнес, 2020. — 828 с.: ил. ISBN 978-5-9693-0404-8
6. URL: https://www.techtarget.com/searchsoftwarequality/definition/Capability-Maturity-Model (дата обращения: 21.12.2023).
Антон Смирнов (smirnovanton@yoomoney.ru) — руководитель команды разработки BI, Евгений Виноградов (jonny@yoomoney.ru) — директор Департамента аналитических решений, компания «ЮMoney» (Санкт-Петербург).
Статья подготовлена на основе материалов выступления на форуме «Управление данными 2023».