Чтобы помочь региональным властям в достижении поставленных целей социально-экономического развития страны, команда «СберАналитика» разработала информационно-аналитическую панель «Мониторинг экономики регионов». Ее пользователями панели уже стали более 100 российских органов власти и местного самоуправления. Этот продукт будет также интересен работающим на федеральном уровне предприятиям, которым важно знать и понимать социально-экономическую ситуацию в различных регионах. С подробностями проекта знакомит Дарья Мерзлякова, ведущий специалист направления продуктов для государственного сектора компании «СберАналитика», номинант на премию Data Award.

- Расскажите, как родилась идея создания решения?

Вышедшие в прошлом году указы президента РФ о национальных целях развития страны поставили перед региональными и федеральными властями амбициозные цели: к 2030 году нужно добиться повышения продолжительности и уровня жизни населения, улучшения жилищных условий, увеличения ввода жилья, подъема качества городской среды, а также целого ряда других ключевых показателей жизни граждан. Достичь этих целей трудно без качественного и оперативного мониторинга показателей социально-экономического развития. Чтобы его обеспечить, эксперты «СберАналитики» разработали инновационную аналитическую панель «Мониторинг экономики регионов».

- В чем заключается важность и в чем — сложность ее создания?

Россия активно повышает цифровую зрелость управленческих процессов на всех уровнях — от муниципалитетов до федеральных институтов. В рамках нацпроекта «Экономика данных» команда «СберАналитики» создает стандарты качества статистики и работы с большими данными, позволяющие модернизировать методологии расчета показателей и перевести статистику на новую технологическую основу.

- Каковы ключевые возможности решения?

Мы предоставляем аналитику в максимально удобном формате: в режиме онлайн на информационной панели доступны более 20 показателей социально-экономического развития региона с помесячной динамикой и ретроспективой данных с 2019 года. Среди индикаторов — уровень благосостояния, финансовый поток, миграции, затраты на спорт и культуру и пр.

- На основе каких технологий и платформ реализована аналитическая панель?

Для анализа информации в ней используются наши собственные автоматизированные системы хранения и обработки данных. Для работы с данными применяются Hadoop, Spark, Python, Jupyter, Hive, Hue, Scala, SQL и другие популярные инструменты. Для анализа данных, моделирования и визуализации используются библиотеки Pandas, Numpy, Scipy, Seaborn, Matplotlib, Sklearn и другие.

- Какие данные используются в вашем продукте — какой природы, из каких источников, каких типов?

В основе продукта лежат обезличенные и агрегированные данные более чем из 70 внутренних и внешних источников. Благодаря механизмам дооценки и обогащению данными из других источников аналитическая панель позволяет отслеживать до 100% рынка.

- Какой математический аппарат встроен в аналитическую панель?

В панели широко применяются модели искусственного интеллекта. На основании агрегированных и обезличенных данных о доходах граждан и их структуре, половой принадлежности, возрасте и домашнем регионе с помощью модели логистической регрессии SARIMAX производится расчет вероятности миграции, изменения заработной платы. Кроме того, осуществляется количественная оценка по каждому из выбранных сценариев.

Мы строим прогнозные модели по всем ключевым метрикам инструмента и формулируем для клиентов динамику изменений показателей в долгосрочной и среднесрочной перспективе.

- Какие возможности решения вы выделяете в качестве наиболее удачно реализованных?

Наша компания располагает обезличенной и агрегированной информацией о тратах более 109 млн граждан нашей страны и 6 млн юридических лиц. Доля покрытия безналичных расчетов в стране уже превысила 70% — это повышает полноту имеющейся у нас выборки и ее репрезентативность.

Точность расчетов показателей обеспечивают собственные запатентованные алгоритмы обработки данных. На текущий момент у нашей компании уже имеется девять патентов, среди которых алгоритмы для определения объема торговли в точках продаж, технологии обработки данных и подготовки структур данных для просмотра и визуализации, а также другие патенты.

Хочу также особо отметить защищенность данных: при проведении исследований никакая персональная информация и данные, составляющие коммерческую тайну, не раскрываются.

- Как бы вы охарактеризовали типичного заказчика вашей аналитической панели?

Целевая аудитория продукта «Мониторинг экономики регионов» состоит из двух сегментов. Первый — федеральные и региональные органы власти, местного самоуправления, различные институты развития. Второй сегмент — предприятия крупного бизнеса, которым важно знать социально-экономическое положение того или иного региона и динамику уровня жизни населения в нем.

- Каковы успехи решения на рынке?

Пользователями панели «Мониторинг экономики регионов» уже стали более 100 клиентов из числа органов власти и местного самоуправления России. Как видите, опыт использования больших данных уже принес результаты.

- В чем, на ваш взгляд, заключаются роль и значение продукта для рынка?

Наш продукт выступает связующим звеном между большими данными, с одной стороны, и принимаемыми управленческими решениями, с другой. «Мониторинг экономики регионов», по сути, трансформирует полученную на основе разносторонних данных статистику в эффективные решения, способствующие ускорению достижения национальных целей.

- В каком направлении планируете развивать аналитическую панель?

В 2025 году мы рассчитываем сформировать собирательный комплекс метрик, отражающих уровень жизни населения, провести исследование рынка труда и изучить миграцию между муниципалитетами и регионами. Также планируем расширить использование в продукте механизмов искусственного интеллекта и машинного обучения.