26 февраля издательство «Открытые системы» провело очередную ежегодную конференцию «Качество данных». Ее главная тема — обсуждение подходов, инструментов и лучших практик в области построения и эксплуатации надежных конвейеров данных, обеспечивающих гарантированный требуемый уровень качества данных. Это единственная в России конференция, полностью посвященная стратегии и практике обеспечения качества данных.
Участники конференции обсуждают ключевые аспекты получения качественных данных и повышения на их основе эффективности бизнес-процессов. На конференции широко представлены технологические платформы и инструменты для управления качеством данных, управления мастер-данными, интеграции данных, автоматизации процессов по подготовке данных и управлению нормативно-справочной информацией, созданию массивов данных для обучения и применения моделей ИИ.
Представители ведущих российских компаний и организаций делятся с коллегами своим опытом и наработками. Так, анализу практики управления качеством данных посвятил свое выступление Николай Шевцов из «ОТП-Банка».
Максим Солопин из МКБ представил архитектуру фреймворка, автоматизирующего и упрощающего загрузку данных из множества источников в корпоративное хранилище. Виктор Черников из ВТБ обсудил особенности подходов для поиска аномалий и идентификации проблем в слоях потоков данных. Ирина Шахтарина из Сбера рассказала о выстроенной в банке системе мониторинга данных с целью контроля их качества и устранения дата-инцидентов. Олег Молчанов из «Магнита» поделился опытом управления командой обеспечения качества данных крупнейшей федеральной розничной сети. Алексей Горячев и Александр Ткачев из «Лемана Тех» описали эволюцию корпоративной платформы качества данных и культуры работы с данными в компании «Лемана Про» («Леруа Мерлен»).
Павел Коротенко из Unilever предложил свою «дорожную карту» для реализации стратегии управления метаданными. Татьяна Борисова и Андрей Ефимов из Пивоваренной компании «Балтика» обсудили организационные и технологические решения, позволяющие обеспечить бесперебойность формирования отчетности. Ирина Соколова-Краевская из «АЛРОСА» рассказала, как встраивание проверок в дата-сервисы и их визуализация помогают обеспечить финансирование мероприятий по обеспечению качества данных. Анна Ерохина, выступившая как независимый эксперт, сконцентрировалась на проблемах, связанных с человеческим фактом, и организации подразделений, ответственных за управление основными данными.
Сергей Духовенский из ФМСМ представил опыт своей компании по переводу управления качеством данных на объектно-ориентированную модель. Геннадий Чепиков из «Белоруснефти» обсудил подходы к получению данных, отвечающих заявленным критериям качества. Денис Тепляков из «МегаФона» поделился результатами внедрения инструментария, давшего пользователям возможность самостоятельно контролировать актуальность и качество получаемых данных. Александр Ошурков из МТС рассказал о внедрении ИИ-агентов и использовании LLM-моделей, позволивших ускорить формирование качественного описания данных в дата-каталоге. Сергей Панов из ГК «Интерлизинг» раскрыл секреты реализации системы управления качеством данных, позволившие удерживать смету ее расходов в разумных рамках. Несколько иной подход к построению системы контроля качества данных предложил Евгений Виноградов из «ЮMoney». Марина Суслова из HeadHunter остановилась на практиках Data Governance, реально помогающих повысить качество данных.
Свои методические наработки, рекомендации и технологические инструменты представили партнеры конференции. В частности, Олег Гиацинтов из DIS Group рассказал о тенденциях в работе с данными и об условиях получения синергетического эффекта при развертывании систем управления качеством данных. Сергей Полехин из PIX BI представил инструмент бизнес-аналитики «3 в 1», позволяющий быстро приводить качество данных к необходимому в рамках конкретной бизнес-задачи уровню. Андрей Андриченко из «ЭсДиАй Солюшен» проанализировал основные способы обеспечения качества мастер-данных в среде MDM, особо остановившись на содержащейся в ГОСТ ИСО 22745 методологии открытых технических словарей Open Technical Dictionary (OTD).
Евгений Обелов из компании «Гармония MDM» и Антон Коваленко из Arenadata обсудили сценарии управления мастер-данными в сфере продаж товаров повседневного спроса, интеграцию систем MDM и каталогов данных и их влияние на качество ландшафта данных. Евгений Антропов из IBS с решением «Планета.НСИ» поделился опытом повышения качества справочников контрагентов и формирования взвешенной оценки кредитора. Кирилл Евдокимов из «Дата Сапиенс» предложил свой ответ на вопрос о том, может ли решение для управления метаданными помочь обеспечить полный охват всех процессов управления качеством данных, касающихся метаданных. Его коллега Ярослав Игнатьев сконцентрировался на ответе на другой вопрос: как обеспечить корректные результаты аналитики, если автоматизированные методы исправления ошибок в данных не дают мгновенного эффекта.
Григорий Бокштейн из TData привел свои рекомендации по эффективному внедрению практик DataOps на базе инструментов управления данными. Юлия Шарафутдинова из Т1 ИИ проанализировала особенности применения методов анализа больших данных при нормализации производственных данных. Максим Зацепин из «БФТ-Холдинга» рассмотрел различные аспекты MDM как инструмента обеспечения качества данных. Александр Учаев из «1С» обсудил основные изменения законодательства в области управления качеством персональных данных. Алексей Арустамов из Loginom Company рассказал, как можно эффективно интегрировать инструментарий Low-Code с LLM-моделями для того, чтобы создать действительно полезные решения. Алексей Пятов из VK Cloud представил свой взгляд на происшедшие за последние три года изменения в том, что касается зрелости и степени участия бизнес-подразделений в процессах управления данными, в том числе их качеством.
Михаил Александров из Axenix предложил рекомендации, которые помогут обеспечить соответствие процессов и инструментов управления качеством данных актуальным потребностям бизнеса. Виталий Масальский из СОФРОС представил уникальный механизм управления Rich-контентом, реализованный в проекте для крупнейшего отечественного федерального дистрибьютора. Алиса Школьникова из «КОРУС Консалтинг» провела параллели между уровнями мастерства восточных боевых искусств и уровнями зрелости в области качества данных. Мария Ришняк из PARMA TG рассказала о возможностях для построения аналитической системы, способной обрабатывать более 150 млн записей, собранных из десятков источников.
Участниками конференции стали топ-менеджеры компаний и организаций, руководители функциональных подразделений и направлений, ведущие специалисты, руководители проектов и продуктов, аналитики, консультанты, специалисты по данным и эксперты по качеству данных, представители органов власти, профильных ассоциаций и союзов. Они не только получили возможность посетить сессии и мастер-классы, но и смогли пообщаться, установить личные контакты с докладчиками и отраслевыми экспертами, обменяться опытом.
«Цифровизация вызвала предсказуемо высокий спрос на качественные и согласованные данные, без которых невозможны ни получение дополнительной прибыли, ни повышение производительности. Более того, высокую рыночную стоимость сегодня способны продемонстрировать лишь предприятия, имеющие в своем штате квалифицированных специалистов по работе с данными. Однако не следует ожидать быстрых побед на пути повышения качества данных — очень легко впустую потратить ресурсы, выбрав ошибочное направление развития. Надеюсь, VI Всероссийская конференция помогла ее участникам выбрать верный вектор для инвестиций в построение и эксплуатацию эффективного конвейера управления качеством данных и минимизировать риски при решении бизнес-задач с вовлечением «гражданских» бизнес-аналитиков, самостоятельно применяющих инструменты для работы с данными», — подчеркнул Дмитрий Волков, программный директор конференции «Качество данных — 2025».