Обсуждение цифровой трансформации невозможно без переосмысления понятия «данные», вопросы управления которыми рассматриваются сегодня уже на федеральном уровне. Так, в рамках программы «Цифровая экономика Российской Федерации» предусмотрено уже к 2021 году создание национальной системы управления данными (НСУД). В основе этой системы лежат три принципа: данные — стратегический актив, имеющий ценность; ценность может быть повышена за счет дополнительной обработки; как и любым другим активом, данными необходимо управлять. Между тем о важности проблемы управления данными серьезно задумались многие коммерческие и некоммерческие организации.
Поле деятельности в сфере управления данными достаточно обширно и включает буквально все — начиная от принятия решений о том, как извлечь стратегическую выгоду из имеющихся информационных активов, и кончая развертыванием и эксплуатацией цифровых платформ и их поддержкой. Управление данными требует весьма разнообразных как технических, так и бизнес-навыков, а ответственность за управление данными распределяется между бизнес-менеджерами и сотрудниками, обеспечивающими координацию бизнеса и ИТ (директор по данным, распорядитель данных, бизнес-аналитик и пр.). Ясно, что эффективное сотрудничество всех этих специалистов невозможно без общего языка общения.
В целом можно считать, что к профессионалам по управлению данными относится любой сотрудник любой организации, который по характеру своей работы имеет отношение к одному из аспектов управления данными. Для оказания помощи таким специалистам еще 30 лет назад была образована Международная ассоциация управления данными DAMA (Data Management Association International), объединяющая профессионалов в области управления данными по всему миру и призванная собирать, систематизировать и пропагандировать лучший опыт. Важная задача DAMA — выработка единой терминологии и рамочной структуры (framework) знаний и подходов.
В 2009 году вышло первое издание Руководства DAMA к своду знаний по управлению данными (DMBOK), заложившее фундамент развития и созревания совокупности профессий, относящихся к управлению данными, а в 2017 году увидело свет второе издание — DAMA-DMBOK2.
Основное назначение DMBOK — предоставление наиболее полного, точного и актуального введения в дисциплину управления данными:
- выработка общепринятого согласованного представления об областях знаний по управлению данными (11 областей);
- определение руководящих принципов управления данными;
- предоставление стандартных определений для наиболее часто используемых понятий (общих и по областям знаний);
- обзор лучших практик, методов и методик, а также альтернативных подходов;
- краткий обзор общих организационных и культурных вопросов;
- уточнение границ сферы управления данными.
Сегодня в России все больше предприятий определяют себя как «управляемые данными» (data-driven) — у отечественного бизнеса, нацеленного на сохранение своей конкурентоспособности, не остается иного выбора, кроме как перейти к применению аналитики в поисках действенных решений и отказаться от принятия решений, основанных лишь на интуитивных предположениях. Более того, нынешний темп изменений в бизнес-среде прямо указывает на то, что назревшие перемены в области управления данными носят уже характер обязательных, а не факультативных. «Цифровой прорыв» стал нормой, и для адекватной реакции на него бизнес должен плотно взаимодействовать со всеми специалистами по управлению данными для создания наиболее эффективных решений.
Управление на основе данных подразумевает безусловное признание необходимости управлять ими эффективно, причем речь идет не о создании отдельных частных решений по повышению качества данных или управлению нормативно-справочной информацией (НСИ), а о построении полнофункциональной системы управления данными. Требуется определить основные функции этой системы, выделить и устранить пробелы в их реализации. Подобного рода система должна опираться на хорошо проработанную рамочную структуру функциональных областей управления данными — именно такая структура («колесо» DAMA — DAMA Wheel) и предлагается в DMBOK2. Однако до недавнего времени в России отсутствовал русскоязычный вариант этого авторитетного справочника, написанного ведущими аналитиками во взаимодействии с участниками ассоциации DAMA.
Сегодня появился перевод книги DMBOK2 [1]. Однако на пути к всеобъемлющему и целостному изданию, охватывающему все области знаний по управлению данными, было множество препятствий — начиная от отсутствия устоявшейся русскоязычной терминологии и заканчивая необходимостью учета множества нюансов в каждой из областей знаний, имеющих отношение к управлению данными. Тем не менее была обеспечена достаточно высокая степень соответствия оригиналу благодаря применению при переводе DMBOK2 следующих трех принципов:
- Максимальный учет существующей практики перевода терминов. Каждый из применяемых в издании терминов переведен с учетом уже имеющихся прецедентов, причем для поиска вариантов перевода использовались наиболее авторитетные источники: публикации в известных журналах и сборниках, переводные материалы ведущих отечественных ИТ-компаний и отраслевых организаций, официальные переводы международных стандартов.
- Точность перевода. DMBOK — серьезное руководство, имеющее важное методическое значение, и практически в каждом его предложении отражены основные шаги какого-либо процесса, свойства объекта или принципы деятельности. Неточный перевод мог бы ввести читателя в заблуждение и привести к неправильному использованию изложенных практик.
- Cохранение стиля издания. В DMBOK обобщен опыт множества специалистов в области управления данными — издание содержит много поясняющих замечаний и конкретных практических рекомендаций. Например, различие и связь между руководством данными (Data Governance) и управлением данными (Data Management) лаконично разъясняется следующим образом: руководство данными нужно для того, чтобы «делать правильные вещи», а управление данными — для того, чтобы «делать вещи правильно». Не менее полезна практическая рекомендация по поводу уровня детализации стандартов данных: «Важно помнить, что документирование дает возможность зафиксировать детальную информацию или знания, которые без такой фиксации могут быть потеряны. Воссоздание или реверс-инжиниринг c целью получения доступа к этим знаниям весьма затратны по сравнению с документированием в самом начале их выявления». Все подобного рода фрагменты были сохранены в переводе максимально близко к оригиналу.
При переводе отраслевой терминологии был достигнут компромисс между стремлением использовать привычные и понятные русскоязычные термины и сохранением терминологической стройности, связности и лаконичности оригинального текста. В этой связи возникли проблемы в отношении двух ключевых терминов: Data Governance и Data Stewardship, для которых наиболее приемлемым решением стало введение семантических неологизмов (сочетаний терминов, которые звучат не совсем по-русски, но по смыслу наиболее точно соответствуют оригиналу): «руководство данными» и «распоряжение данными». Наиболее весомыми аргументами в пользу этих вариантов стали пояснения, приведенные в тексте DMBOK2. Например, в отношении термина Data Governance приводится такой комментарий: «Слово “руководство” (governance) образовано от глагола “руководить” (govern), который в данном случае — ключевой. Смысл руководства данными проще всего понять на примере политического руководства. В отношении данных предусматриваются функции, подобные законодательным (определение политик, стандартов и корпоративной архитектуры данных), судебным (управление проблемными вопросами и эскалация) и исполнительным (защита и обслуживание, выполнение обязанностей по администрированию). Для лучшего управления рисками большинство организаций выбирают представительную форму руководства данными, обеспечивающую учет мнений всех заинтересованных сторон». Поэтому слово «руководство» наиболее точно передает смысл, заложенный в оригинале. При этом следует заметить, что более корректным является следующий вариант перевода: «руководство в области управления данными». Однако, с учетом высокой частоты его использования и наличия многих производных от него терминов, такой вариант был бы крайне неудобен.
Подробные пояснения приведены и относительно термина Data Stewardship: «Деятельность, связанная с несением ответственности и подотчетностью за данные и процессы, обеспечивающие эффективный контроль и использование информационных активов, чаще всего обозначается термином “распоряжение данными” (data stewardship). Распорядитель (steward) — это лицо, чья работа заключается в управлении собственностью другого лица. Распорядители данных управляют информационными активами от имени других лиц и в интересах организации. Часто по отношению к тем, кто выполняет функции, подобные распорядительским, применяют такие термины-синонимы, как “хранитель” (custodian) или “попечитель” (trustee)».
DAMA-DMBOK2 — терминология
Важная задача ассоциации DAMA — выработка единой терминологии в области управления данными:
- управление данными (data management) — разработка, выполнение и контроль исполнения политик, программ и практик предоставления, проверки, защиты и повышения ценности данных и информационных активов на протяжении всего их жизненного цикла;
- руководство данными (data governance) — деятельность по осуществлению руководящих и контрольных полномочий (планирование, мониторинг и обеспечение выполнения) в отношении управления информационными активами (см. рисунок);
- распоряжение данными (data stewardship) — деятельность, связанная с несением ответственности (и подотчетностиью) за данные и процессы, обеспечивающие эффективный контроль и использование информационных активов;
- распорядитель данных (data steward) — лицо, управляющее информационными активами от имени других лиц и в интересах организации;
- владелец данных (data owner) — распорядитель бизнес-данных, обладающий подтвержденными полномочиями на утверждение решений, касающихся его области данных;
- жизненный цикл данных (data lifecycle) — совокупность процессов (процессы, создающие или получающие данные; процессы, которые осуществляют их перемещение, преобразование, хранение, а также обеспечивают обслуживание данных и предоставление совместного доступа к ним; процессы использования или применения данных, а также процессы, обеспечивающие их ликвидацию);
- происхождение данных (data lineage) — путь, по которому данные движутся от места своего возникновения до места использования (иногда называемый цепочкой данных, data chain).
Разделение ответственности между руководством и управлением данными |
От эффективности организации управления данными во многом зависит успех цифровой трансформации, поэтому неудивительно, что сегодня уже на федеральном уровне активно обсуждаются такие вопросы, как обязанности и полномочия руководителей цифровой трансформации органов федеральной власти по реинжинирингу рабочих процессов внутри министерств и ведомств для поддержки инфраструктур оказания онлайн-услуг населению. Русское издание DAMA-DMBOK2 может быть важным подспорьем в решении этих ответственных задач. Выпуск книги стал важным шагом на пути к созданию терминологии для общения отечественных специалистов, работающих с данными, и к продвижению современных методических подходов к управлению данными в российских государственных и коммерческих структурах.
***
Варианты перевода многих терминов из книги DAMA-DMBOK2 могут вызывать вопросы, однако пока вышла лишь первая редакция русского издания, подготовленная компанией Unidata. Работа над следующими редакциями будет продолжена, в том числе и при активном участии сообщества Unidata Community.
Литература
1. Дмитрий Волков. Руководство по управлению данными // Открытые системы.СУБД.— 2019.— № 4. — С. 47. URL: www.osp.ru/os/2019/04/13055217 (дата обращения: 21.04.2020).
Николай Скворцов (nikolay.skvortsov@unidata-platform.ru) — руководитель направления «Методология», компания «Юнидата».