Переход от управления данными на предприятиях и в холдингах к управлению данными в цифровых партнерских экосистемах должен сопровождаться переосмыслением и согласованием не только технологических, но также методологических и организационных аспектов. Необходимость в этом возникает в связи с тем, что в рамках экосистем взаимодействуют компании, придерживающиеся, как правило, различных подходов к управлению данными и применяющие разные форматы, инструменты и платформы.

О наиболее острых вопросах, возникающих при выстраивании управления данными в экосистемах, мы попросили рассказать участников IX форума «Управление данными» — знакового ежегодного мероприятия, посвященного стратегическим аспектам организации работы с данными и управления компаниями с опорой на данные (Data-Driven).

Наиболее острые проблемы

Олег Гиацинтов«Необходим постоянный архитектурный контроль над экосистемой и разумный подход к ее развитию»

Согласно наблюдениям Олега Гиацинтова, технического директора DIS Group, программная основа цифровых экосистем обычно не пишется с «нуля», а собирается из доступных компонентов или продуктов. Их встраивание в единую архитектуру с учетом возможностей и ограничений каждого из компонентов требует немалых затрат времени и сил. «Основная задача, которую должны выполнить создатели экосистемы, — это формирование и поддержка в актуальном состоянии всех процессов ее использования, чтобы не возникали дисбалансы, когда один компонент перегружен, а другой вообще не используется. Экосистемы вообще страдают от наличия неиспользуемых решений, при этом включение в их состав новых компонентов может оказаться затруднительным из-за сложностей с интеграцией с имеющимися компонентами, а также качеством используемых данных, — поясняет Гиацинтов. — Необходим постоянный архитектурный контроль над экосистемой и разумный подход к ее развитию».

Кирилл Евдокимов: «Очень важно обеспечить безопасность данных и требований законодательства о персональных данных»

Кирилл Евдокимов, руководитель направления Data Governance компании GlowByte, выделяет три основные проблемы при создании экосистемы. Первая — это обеспечение безопасности данных и требований законодательства о персональных данных: «Кроме технических сервисов защиты информации, необходимо обеспечить учет и управление согласиями на обработку персональных данных, полученных от клиента или отозванных с его стороны, а также управление активами данных, которые в совокупности позволяют однозначно идентифицировать клиента. Эту задачу можно решать различными способами, в том числе путем маскирования, контроля доступа и пр. Основой для этого служит управление метаданными с поддержкой разметки и классификации элементов».

Второй важной задачей, которую отмечает Евдокимов, является управление изменениями: «Состав сервисов, набор централизованных данных, правила и подходы к гармонизации и пр. — все это требует внимания центральной команды и регулярных циклов обратной связи от продуктовых и сервисных команд, развивающих экосистему». Третья задача, требующая решения, — стимулирование взаимного интереса к обмену данными внутри экосистемы. «Необходимо выстроить процессы по принципу Data Mesh и мотивировать команды продуктов и сервисов на предоставление общего доступа к большей части их данных (разумеется, с учетом юридических ограничений и требований безопасности). Для обеспечения такой мотивации необходим “магазин данных”, в котором конечный потребитель платит за них поставщику данных или делится с ним прибылью», — добавляет Кирилл.

Эльвин Мустафаев: «Первая из наиболее острых проблем касается возможных нарушений безопасности и конфиденциальности данных в результате кибератак, несанкционированного доступа и утечек данных»

Эльвин Мустафаев, директор департамента BI Polymatica компании SL Soft, перечисляет пять наиболее острых проблем. Первая касается возможных нарушений безопасности и конфиденциальности данных в результате кибератак, несанкционированного доступа и утечек данных. Для защиты от этих рисков необходимы многоуровневые системы безопасности, регулярные аудиты ИБ и систематическое обучение сотрудников навыкам и знаниям в области кибербезопасности. Вторая проблема связана с качеством и совместимостью данных: их низкое качество или нестандартный формат могут исказить аналитические выводы или помешать их исполнению. Повысить качество данных помогут установление и обеспечение стандартов их качества, регулярные проверки и чистка. Проблема актуальности данных, третья по счету, решается через регулярное обновление данных и использование автоматизированных систем для мониторинга их актуальности. Преодолеть сложности в масштабировании, представляющие собой четвертую проблему, поможет внедрение облачных решений и использование платформ, позволяющих масштабировать инфраструктуру по мере необходимости. Наконец, пятая проблема связана с тем, что неэтичное использование данных может вызывать недовольство со стороны общества. Для ее решения нужны четкие этические стандарты и практики использования данных, а также вовлечение заинтересованных сторон в поиск приемлемых вариантов.

Игорь Моисеев: «Участникам экосистем предстоит большая работа в области гармонизации стандартов, соглашений и процессов между различными элементами, а также вопросов совместимости и согласованности данных»

«Участникам экосистем предстоит большая работа в области гармонизации стандартов, соглашений и процессов между различными элементами, а также вопросов совместимости и согласованности данных, — считает Игорь Моисеев, директор по развитию компании DataCatalog (входит в группу Arenadata). — Поскольку в цифровых экосистемах метаданные могут распространяться между различными субъектами, становятся еще более востребованными каталоги метаданных — они позволяют участникам экосистемы безопасно делиться информацией о накопленных ими объектах данных, не создавая угроз для конфиденциальности. Наличие единого инструмента для управления данными и централизованного бизнес-глоссария становится признаком зрелости экосистемы в области работы с информацией».

По мнению Станислава Шлишевского, руководителя направления по работе с финансовым сектором компании «Инфосистемы Джет», актуальными с практической точки зрения будут вопросы реализации и внедрения инструментов управления данными, а также выбора между решениями с открытым исходным кодом и вендорскими продуктами. Среди других важных вопросов Станислав выделяет поиск новых способов монетизации данных, а также инструментов управления данными, позволяющих ее обеспечить.

Станислав Лазуков, генеральный директор TData, в числе наиболее острых проблем видит мотивацию и заинтересованность всех участников экосистемы в выработке подходов к управлению данными и дальнейшему их соблюдению: «Необходимо выбрать подход и решение, позволяющие с минимальными усилиями и затратами охватывать основные бизнес-запросы, касающиеся анализа и поиска доступных в рамках экосистемы данных. Кроме того, компании могут различаться по уровню зрелости процессов управления данными, качеству данных и разрезов, в которых они рассматриваются, поэтому важно, чтобы инструменты позволяли выравнивать все эти показатели до единого уровня».

Андрей Андриченко: «Синхронизировать разрозненную терминологию можно, опираясь на методологию открытых технических словарей».

 

Андрей Андриченко, директор по развитию компании «ЭсДиАй Солюшен», призывает обеспечить синхронизацию терминов и справочников: «Объекты НСИ, из которых складываются прикладные модели данных, являются общим достоянием участников экосистем. Вместе с тем, их прикладные информационные системы содержат собственные, дублирующие друг друга базы данных НСИ, заставляя специалистов задумываться над синхронизацией терминологии и свести к общему знаменателю варианты описаний одних и тех же информационных объектов. Синхронизировать разрозненную терминологию можно, опираясь на содержащуюся в стандарте ГОСТ Р ИСО 22745 методологию открытых технических словарей (ОТД), предполагающую создание единого реестра атрибутов и библиотеки шаблонов, которые разрабатываются для группы однородных номенклатурных позиций и включают набор утвержденных (стандартизованных) терминов (характеристик), описывающих свойства объектов НСИ в соответствии с нормативно-технической документацией».

Борис Bольпе, президент ГК «Максима», первым среди важных вопросов цифровых экосистем называет взаимное обогащение данных: «Оно необходимо для формирования широкого и продуктивного профиля пользователя, динамично обновляющегося по мере накопления нового пользовательского опыта. Вопрос состоит в том, чтобы создать динамичную обогащаемую модель данных, не допуская при этом угроз безопасности, не нарушая регуляторных требований и быстро адаптируясь к их изменениям».

Борис Bольпе: «Первым среди наиболее острых вопросов построения цифровых экосистем является взаимное обогащение данных»

Другой важный вопрос касается поддержки безопасности и целостности экосистемы в условиях, когда ее участники продолжают свои процессы в области импортозамещения и развития своих решений и вносят различные изменения в модели данных. «Обычно удержание такого динамического равновесия достигается усилиями сводных квалифицированных команд: группы архитекторов, группы маркетологов, группы ИТ-экспертов и пр., — продолжает свою мысль Вольпе. — Такая работа должна идти как между участниками, так и между отдельными вертикалями, чтобы не было разногласий между маркетингом, правовыми отделами, ИТ-службами, командами, отвечающими за управление данными, и т.д.».

Наконец, прежде чем браться за создание экосистемы, считает Вольпе, бизнес должен просчитать и сопоставить, во-первых, выгоды от экосистемы и затраты на нее и, во-вторых, оценить уровни зрелости ИТ у разных ее участников: «Это нужно, например, чтобы в составе экосистемы не было тех, через кого может произойти хищение данных. По-хорошему, участники должны иметь равный уровень зрелости данных, в том числе их качества, чтобы один сегмент некачественных данных не исказил аналитику и не привел к сбоям в работе всех остальных участников экосистемы».

Распределение зон ответственности

Один из важных вопросов, которые приходится решать, выстраивая управление данными в экосистемах, — распределение зон ответственности и полномочий между участниками.

Станислав Шлишевский: «Важно не упустить из виду поиск новых способов монетизации данных, а также инструментов управления данными, позволяющих ее обеспечить»

Чтобы показать, как это работает, Шлишевский приводит несколько примеров: «Первый — Банк России и цифровой рубль: здесь ответственность за платформу и регулирование лежит на ЦБ РФ. Другой пример — Национальная информационная страховая система (НСИС) и страховые компании: участники рынка являются заказчиками аналитических данных, получая доступ к ним через сервисы НСИС, чтобы, опираясь на них, повышать эффективность своей работы. Третий пример — Сбер и его экосистема: здесь мы видим пример взаимного обмена и обогащения между участниками».

По мнению Вольпе, экосистема, объединяющая, к примеру, банк, страховую компанию, сеть автозаправок и сервис готовой еды, не может работать так же, как «плоская» организация: «Да, на одном сайте можно сделать пять приложений, но это еще не экосистема. Должна быть компания-оркестратор, которая определяет сквозные финансовые модели, бизнес-процессы и устанавливает приоритеты, а также правила и требования к качеству данных, периодичности аудитов данных, надежности и резервированию систем участников и пр. Это очень сложная работа — построить открытую экосистему, которая сможет бесшовно и быстро вбирать в себя новых поставщиков данных. Для этого необходимо задействовать масштабируемую платформу Customer Data Platform (CDP), систему расширения полей в описании профиля клиента и масштабируемую систему ИБ. Также нужны системы таргетинга, аналитики и рекомендательные решения, которые могут работать со всеми этими системами».

Сергей Шевяков: «Создание экосистемы данных должно начинаться с выстраивания системы управления бизнес-процессами, которая обеспечит поддержку методик и регламентов работы с данными»

Первым важным шагом для управления данными в рамках экосистем является нормализация мастер-данных. По наблюдениям Сергея Шевякова, архитектора компании PARMA TG, ответственность за ведение справочников и классификаторов на отдельных предприятиях несут профильные специалисты, которые знают свою сферу деятельности и способны корректно вносить новые или править существующие записи.  «Для экосистем такая схема неприменима — необходимы централизованные механизмы обновления данных и специально разработанные методики, определяющие, в частности, полномочия и ответственность за действия с данными, — продолжает Шевяков. — В любой системе управления данными существует два главных участника — владелец и потребитель: потребитель готовит заявку на создание или изменение элемента, а владелец предоставляет необходимые данные. В экосистемах между этими двумя шагами может происходить несколько этапов согласований — это нужно, чтобы результаты изменений не повлияли негативно на других участников. Поэтому создание экосистемы данных всегда должно начинаться с выстраивания системы управления бизнес-процессами, которая сможет обеспечить поддержку методик и регламентов работы с данными».

Станислав Лазуков: «Полномочия и ответственность участников должны регулироваться дата-контрактами, определяющими поставку данных»

Полномочия и ответственность участников должны регулироваться дата-контрактами, определяющими поставку данных, уверен Лазуков: «Спецификация контракта данных, поддержка его версионности, проверки качества, интеграция в каталог данных и необходимая аналитика дают не только прозрачное представление о качестве данных, получаемых от поставщика, но и определяют полномочия потребителей данных. В их числе — требования SLA, объем получаемых уведомлений об изменениях, если они встроены в процессы CI/CD, и др. Несомненно, имеющаяся у участников экосистем степень зрелости процессов управления данными оказывает непосредственное влияние не только на содержимое, но и на саму необходимость внедрения дата-контрактов в модель взаимодействия. Так, в проекте, реализованном в периметре группы “Ростелекома”, мы опирались на уже выстроенные процессы, что позволило нам закрыть большую часть вопросов с использованием уже подготовленных и заполненных в инструментарии для документирования данных RT.DataGovernance описаний продуктов и артефактов данных».

Мустафаев отмечает, что распределение зон ответственности и полномочий особенно важно обеспечить не только в технических направлениях, таких как управление данными и обеспечение их безопасности, аналитика и отчетность, но и в организационных — в области коммуникации и совместного взаимодействия, а также управления конфликтами, мониторинга, оценки и развития процессов работы с данными.

Гиацинтов, впрочем, не видит особенных отличий от ситуаций с разнородными решениями, состоящими из различных продуктов, за исключением введения ответственности как за отдельные компоненты экосистемы, так и за ее функционирование в целом.

Итак, эксперты сходятся в том, что партнерам, участвующим в экосистеме, необходимо о многом между собой договариваться и многое согласовывать, чтобы избежать ситуации лебедя, рака и щуки. От продуктивности этих согласований и дальновидности принятых при этом решений будет зависеть и техническое «долголетие» экосистемы, и ее ценность для конечных потребителей, и выгода для каждого из ее участников.