«СберАналитика» разработала панель «Туризм» — работающий на основе больших данных аналитический инструмент, помогающий госорганам и бизнесу принимать решения, касающиеся развития туризма в регионах и необходимой для этого инфраструктуры. Панель «Туризм» позволяет анализировать более 20 показателей туристической отрасли, включая ее оборот, объем въездного потока, географию и длительность поездок, а также социально-демографический и финансовый профили туристов. К использованию панели «Туризм» уже присоединились 44 региона России. С деталями и перспективами проекта знакомит Владимир Куликов, руководитель направления продуктов для государственного сектора компании «СберАналитика», номинант на премию Data Award.
- С чего начиналось создание решения «Туризм»?
Запуск национального проекта «Туризм и гостеприимство» показал необходимость разработки более детальной аналитики для развития отрасли. В 2019 году основными источниками данных были сведения мобильных операторов и официальная статистика — они отражали только объем поездок. Однако регионам нужна была информация о туристах, их расходах и интересах. Чтобы помочь им, команда «СберАналитики» разработала панель «Туризм» — аналитический инструмент на основе больших данных, который помогает органам государственной власти оценивать туристический потенциал регионов.
- В чем важность и в чем сложность создания этой аналитической панели?
Как известно, туризм — одна из движущих сил развития экономики: каждый рубль, вложенный в туристическую индустрию, согласно оценкам многих экспертов, приносит два-три рубля в смежных отраслях. Главная сложность заключается в интеграции данных для формирования инфраструктуры, маркетинга и мер поддержки, а также в трансформации информации в конкретные решения для регионов.
- Какие возможности имеются у решения на текущий момент?
Панель «Туризм» анализирует более 20 показателей туристической отрасли, включая ее оборот, объем въездного потока, географию и длительность поездок, а также социально-демографический и финансовый профили туристов. Это позволяет не только подсчитывать количество гостей, но и лучше понимать их потребности — от предпочтений в расходах до степени лояльности к региону. Решение помогает оптимизировать инфраструктуру, создавать персонализированные сервисы и повышать экономическую отдачу от каждого туриста.
- На каких технологиях и платформах реализована аналитическая панель?
«СберАналитика» использует собственные автоматизированные системы для хранения и обработки данных. Для работы с данными применяются Hadoop, Spark, Python, Jupyter, Hive, Hue, Scala, SQL и другие. Для анализа данных, моделирования и визуализации используются библиотеки Pandas, Numpy, Scipy, Seaborn, Matplotlib, Sklearn и подобные.
С помощью планировщика задач на базе AirFlow мы автоматизировали расчет базисных и продуктовых витрин данных и высвободили аналитиков от выполнения рутинных задач по обновлению данных. Витрины доступны для круглосуточной работы и учитывают требования к продукту по проведению еженедельного или ежемесячного анализа.
- Какие данные используются в решении?
В основе продукта лежат агрегированные и обезличенные большие данные, они поступают из имеющихся у «СберАналитики» источников.
- Какие математические и ИИ-модели используются в аналитической панели?
Для составления прогнозов в отношении туристического потока используется модель прогнозирования временных рядов SARIMA. Она объединяет четыре компонента: авторегрессию (AR), которая учитывает влияние прошлых значений турпотока на будущие; интеграцию (I), обеспечивающую стационарность временного ряда; скользящее среднее (MA), которое учитывает шум и случайные колебания в данных путем усреднения предыдущих ошибок прогнозов; и, наконец, сезонные колебания (S) — эта характеристика туристических поездок является определяющей.
Применение этой ИИ-модели позволяет с высокой точностью прогнозировать основные характеристики туристической индустрии на несколько сезонов вперед. Возможность предсказания бюджетных эффектов от развития отрасли делает продукт уникальным на рынке.
- Какую функциональность или особенность решения вы считаете наиболее интересной?
Мы анализируем агрегированные и обезличенные траты 109 млн физлиц и 6 млн юрлиц, охватывая свыше 70% безналичного рынка, — это повышает полноту выборки и ее репрезентативность. Благодаря девяти патентам «СберАналитики», включая алгоритмы оценки розничных продаж и плотности туристического потока, данные трансформируются в ценные и полезные аналитические выводы — от социально-демографического профиля туристов до «точек притяжения» в регионах. Интеграция внешних источников дополняет картину, а высокая скорость внедрения нашей аналитической панели позволяет регионам уже через неделю после подписания договора получить в свое распоряжение готовые инструменты для прогнозирования спроса, оптимизации инфраструктуры и роста экономической отдачи. Другими словами, решение не просто собирает статистику, а превращает ее в стратегический актив для управления туризмом.
Важно отметить, что наши исследования строятся на основе обезличенных и агрегированных данных о финансовом поведении клиентов банка. Персональные сведения и данные, которые составляют коммерческую тайну, не раскрываются.
- Кто является типичным заказчиком вашей аналитической панели?
Целевая аудитория продукта — федеральные и региональные органы власти, структуры местного самоуправления, различные институты развития. Также решение может быть интересно компаниям, так или иначе занятым в туристической отрасли и развитии инфраструктуры популярных среди туристов мест.
- Каковы успехи решения на рынке?
На текущий момент к использованию панели «Туризм» присоединились 44 региона России. Применение ими анализа больших данных с целью развития отрасли уже принесло заметные результаты. Так, в одной из областей благодаря аналитике выяснили, что регион давно перестал быть местом однодневных экскурсионных поездок из соседних субъектов. Следовательно, нужны новые места для размещения туристов и их досуга. Бизнес получил возможность понять, где создавать новые объекты и на кого их следует ориентировать, чтобы привлечь достаточно гостей и обеспечить прибыльность этих объектов.
- В чем вы видите ценность и пользу вашего продукта для рынка?
В настоящее время мы совместно с Комитетом по туризму города Москвы и Федеральной службой государственной статистики разрабатываем методологию интеграции официальных источников, содержащих большие данные, — это поможет уточнить используемые в отчетах индикаторы.
- В каком направлении планируете развивать решение?
Мы подготовим семь новых функциональных направлений в составе продукта. В их числе — гастротуризм, выявление пересечения аудиторий, а также анализ возвратности, выездного туризма, занятости в туристическом секторе, маршрутов и брендов.