В X5 Group построили аналитическую систему, ориентированную на мобильных сотрудников, в которой запросы производятся на естественном языке. В результате удалось значительно увеличить скорость доступа к данным и удовлетворить потребность в точной мобильной аналитике. О реализации проекта рассказывает Дмитрий Иванов, директор департамента развития аналитической платформы Х5 Tech, и номинант на премию Data Award.
- Как в X5 пришли к созданию аналитического решения с запросами на человеческом языке?
У нас выстроена продуманная система работы с данными: зрелое хранилище, множество аналитиков и тщательно проверенные данные. Мы не просто использовали имеющиеся наработки, но и активно вкладывались в подготовку кадров через собственную Школу данных и внедрение self-service. Однако успех технологий, таких как ChatGPT, вдохновил нас выйти на новый уровень.
Первоначальная идея была амбициозна: предоставить топ-менеджменту инструмент для взаимодействия с корпоративными данными на естественном языке. Однако первая попытка привела к нежеланным результатам – вместо четкой и точной аналитики мы получили галлюцинации со стороны ИИ и зависимость от человеческих ассистентов, что серьезно затормозило развитие проекта. Этот неудачный опыт не остудил наш пыл, а лишь внес коррективы в наш путь.
В процессе обучения сотрудников в регионах нам открылась новая ниша. Региональные команды, которые нуждаются в оперативных аналитических данных, особенно на мобильных устройствах, стали нашими первыми пользователями обновленной системы.
Опыт внедрения технологий взаимодействия с данными показал, что даже первые неудачи могут стать частью успеха, если к ним подходить с гибкостью и креативностью. Каждое новое открытие, будь то в обучении сотрудников или в развитии технических решений, приближает нас к стратегическим целям и показывает, что истинная сила данных заключается не только в их количестве, но и в их доступности.
- В чем заключалась задача при создании новой аналитической системы?
Основной задачей было предоставить качественно новый уровень аналитики, позволить получать инсайты, общаясь на естественном языке, обеспечить возможность мобильной работы с данными. Значительная доля аудитории – это мобильные сотрудники, работающие в рамках своих задач и полномочий.
Технологии обработки естественного языка (NLP+text2sql) позволяют пользователям взаимодействовать с системами аналитики так же легко, как они общаются друг с другом. Это значительно снижает порог входа для работы со сложными инструментами: вместо изучения громоздких интерфейсов и профессиональной терминологии пользователи могут задавать вопросы на обычном языке. Например, вопрос «Какие были продажи за последний день?» автоматически преобразуется в запрос к системе.
Скорость получения аналитических ответов стала решающим фактором конкурентоспособности. В условиях быстро меняющегося рынка возможность получать результаты анализа в реальном времени значительно увеличивает гибкость бизнеса.
- Как пришла идея обратиться к технологиям NLP для работы с данными?
Идея использования технологий NLP и Text to SQL возникла как стратегический шаг нашей компании после изучения тенденций как на российском, так и на западном рынках. Мы оценивали различные решения, основанные на LLM-движках. Несмотря на отсутствие возможности протестировать эти технологии непосредственно, мы увидели в них большой потенциал.
Ключевыми условиями стали высокая точность ответов (малейшие отклонения недопустимы) и безопасность данных. Сочетание технологий NLP и Text to SQL позволяют извлекать факты без дополнительной интерпретации и делать это максимально быстро, что критически важно для мобильной аналитики.
- У пользователей были проблемы с существующими инструментами?
Да, инструменты были доступны только в корпоративной сети и десктопно. У нас есть развитый BI с огромным объемом пользователей, который хорошо решает задачи сценарной аналитики. Но покрыть все кейсы невозможно, а дальше происходит подключение аналитиков, использование Excel и рост времени до получения ценности. Например, при работе над проектом Customer Journey Mapping (CJM) пользователям приходилось задействовать несколько человек для получения цифр по одному показателю во время совещания.
Повышение скорости доставки ценности стало одним из факторов изменения подхода: мы не просто создали BI-систему – мы сделали интеллектуального помощника. Это радикально новое направление использования аналитики: общение на естественном языке, мобильный доступ, высокая скорость получения данных, инсайты и рекомендации, интегрированные в бизнес-процессы для трансляции принятых решений.
- Какие требования предъявлялись к создаваемому решению?
Их было довольно много. Я уже называл высокую скорость получения данных, возможность общения на естественном языке и доступность с личного мобильного устройства. Не менее важны работа только во внутреннем контуре без выхода в интернет, 100% качество ответов без дополнительной интерпретации и интеграция движка в различные решения внутри компании (мобильное рабочее место сотрудника, платформы, BI). Кроме того, можно отметить сохранение контекста диалога, реальное построение графиков, отправка отчетов по электронной почте, рush-уведомления о важных событиях или изменениях, проактивная работа бота по предоставлению инсайтов.
- Что собой представляет разработанное решение? Из каких элементов оно состоит?
Разработанная система включает несколько ключевых компонентов: LLM (для генерации рекомендаций к текущим фактам и обогащению необходимым контекстом – основной элемент системы); NLP (для обработки естественного языка); text2sql (для обработки запроса и обращения в базу данных для получения факта).
Модуль промтов содержит в себе информацию управления контентом и правильную маршрутизацию на уровне данных: модуль алертинга – уведомляет пользователей о наступлении важных событий; брокер запросов – управляет взаимодействием между компонентами; интеграция движка – позволяет подключать систему к различным решениям внутри компании.
- Какие платформы использованы?
Текущее решение представляет собой универсальный интерфейс доступа через корпоративный мессенджер RoomsX5 как с мобильного устройства, так и через десктопную версию.
RoomsX5 – корпоративный мессенджер на базе eXpress. Используется в качестве основного способа взаимодействия с конечными пользователями. NLP+text2sql – модуль, обрабатывающий запросы на естественном языке. Базируется на гибридном NLP-ядре с детерминированной логикой, позволяющей достичь точности распознавания свыше 99% и избежать искажений. LLM – развернутая в контуре компании модель qwen72b или qwen8b.
В качестве поставщиков данных используются существующие достаточно развитые хранилища данных. Обновление происходит раз в сутки, либо в месяц, в зависимости от среза и пула метрик. Также пользователи получают индивидуальные рush-уведомления раз в 30 минут по расписанию.
Реализован функционал сквозной авторизации посредством интеграции с корпоративным решением «Х5 Ключ» на базе Keycloak.
- Как выглядит взаимодействие пользователя с системой?
Пользователь получает доступ через корпоративный мессенджер RoomsX5 как со своего мобильного устройства, так и ноутбука после одноразовой аутентификации через «Х5 Ключ». Пользователь может запрашивать необходимые метрики прямо из чата, система предоставляет результаты мгновенно или визуализирует данные по желанию пользователя.
Это первый шаг к быстрому предоставлению ценности конечному пользователю. Дальнейшие планы включают интеграцию движка бота в рабочие места торговых сетей и BI-инструменты для расширенного функционала рекомендаций.
- Все ли потребности пользователей охватывает решение?
На данный момент акцент сделан именно на разъездном характере работы сотрудников, классические BI-инструменты остаются актуальными для детализированного анализа больших объемов данных или исторических данных. И мы продолжаем исследовать кейсы переноса функций классического BI в нашу мобильную аналитику.
- В чем заключались основные сложности проекта?
Основные сложности заключались в изменении культуры потребления данных среди сотрудников: необходимо было адаптировать привычки использования информации под новые условия работы системы NLP+text2sql. На первых этапах мы активно поддерживали пользователей – следили за их запросами онлайн и помогали формулировать вопросы правильно. Кроме того, стоит учитывать уровень подготовки целевой аудитории – многие пользователи ранее не имели опыта работы с подобными решениями.
- Насколько легко новшество было воспринято бизнес-пользователями? Оно вписалось в корпоративную культуру?
Внедрение инструмента совпало с принятием новой стратегии Х5 в части ИИ-технологий, и новшество воспринималось достаточно легко благодаря активному участию директоров операционной вертикали – амбассадоров изменений. Кто видел для себя в этом новую возможность, тот заходил в эту тему очень быстро, и дальше мы уже вместе развивали и оттачивали решение. Конечно, не без сложностей – как культурных, так и нюансов, о которых говорил ранее.
Популярность начала набирать обороты со второго месяца, и буквально за четыре месяца мы достигли более 500 уникальных пользователей за месяц и более 200 уникальных пользователей за день. Как следствие, число запросов выросло с 1,2 тыс. до 7,5 тыс. в месяц.
- Какова обратная связь? Что «зашло» или «не зашло» пользователям?
«Заходит» скорость отклика, фактические цифры без галлюцинаций, доступность данных быстрее, чем в BI-инструментах. Важна возможность в любой момент времени и в любом месте иметь доступ данных по своим объектам. Что «не зашло» – трудно сказать: обратной связи много, и есть специфичная или субъективная, например «Неудобно смотреть из-за маленького дисплея на телефоне». Есть жалобы, что, когда бот показывает картинку по большому объему объектов и набору показателей, неудобно приближать и смотреть каждый, двигая картинку. Но для таких случаев есть возможность использовать Excel или отправить файл на почту. Мы собираем обратную связь регулярно, чтобы держать руку на пульсе и понимать своего пользователя.
- Каких результатов удалось достичь?
C момента внедрения решения на пилотной группе мы видим его востребованность по росту уникальных пользователей за месяц. Также растет количество обращений к системе: в среднем на текущий момент у нас их свыше 5 тыс. в месяц. Также мы отслеживаем такую метрику, как Sticky Factor – она показывает, насколько часто пользователи возвращаются к нашему инструменту. Она тоже растет, сейчас находится на уровне 23%. Для сравнения, если брать аналоги на инструментах Qlik, то у них эта метрика составляет 13%.
Сейчас мы исследуем корреляцию и влияние на ключевые показатели магазинов в рамках двух тестовых групп директоров магазинов-партнеров, одни из которых пользуются мобильной аналитикой, а другие – нет.
- Исходя из чего будет оцениваться успешность проекта?
Успешность будет оцениваться по снижению количества обращений к традиционным BI-инструментам и эффективности использования ИИ-агента при принятии решений. Для нас проект имеет стратегическое значение – он архитектурно меняет ИТ-ландшафт X5: поддерживает развитие направления стратегии, появляются инсайты, сокращает путь получения знаний из данных. В итоге растет скорость принятия обоснованных решений, основанных на актуальных данных.
Проект является важнейшей точкой роста для бизнеса X5, он открывает новые горизонты возможностей анализа больших объемов информации путем применения современных технологий искусственного интеллекта и получения из данных знаний.
В ближайших планах – расширение функционала ИИ-агента, что позволит работать в системе всем уровням сотрудников, интегрироваться непосредственно внутрь рабочих процессов компании и производить изменения в корневых системах.