Логистическая компания ПЭК реализовала сквозную аналитику и внедрила ML-инструменты, что позволило повысить точность прогнозов и маршрутизации грузов. О пути компании к современной аналитике и достигаемых результатах рассказывает Антон Слученков, директор департамента разработки и визуализации данных ПЭК и номинант на премию Data Award.

- Как вообще эволюционировала аналитика в ПЭК?

Можно сказать, что наша аналитика прошла путь от «каменного века Excel» до машинного обучения. В 2012 году у нас были разрозненные выгрузки из «1С», вручную собранные в таблицы. Это было похоже на попытку собрать космический корабль из деревянных палочек.

Потом мы поняли, что так далеко не улетим, и в 2013 году создали BI-хранилище, которое объединило большинство источников данных. В 2014 появились OLAP-кубы, а в 2017 — Power BI и Grafana. Сейчас мы активно развиваем машинное обучение и смотрим в сторону ИИ.

- То есть путь «от кустарных методов к продвинутой аналитике». А какие принципы заложены в вашу платформу?

У нас строгая философия. Во-первых, никакой двусмысленности — если показатель есть, он должен быть один и понятный. Дубликаты и разночтения запрещены. Во-вторых, качество данных — BI-хранилище не должно превращаться в телефонный справочник, где половина информации устарела. Важна и стабильность — если данные не пришли вовремя, кто-то уже нервно грызет ручку. Наконец, скорость — если данные долго загружаются, это уже не аналитика, а «историческое исследование».

- Какие инструменты составляют ваш технологический стек?

В основе у нас Microsoft SQL Server, данные загружаются через инструменты SSIS и CDC, обрабатываются Python, витрины строим с помощью OLAP, а визуализируем все в Power BI, Grafana, Excel, Web. Если говорить про продвинутую аналитику, используем Python, LLM, ML, RAG, а для ролевого управления — MDS.

- Вы ориентируетесь на готовые решения или предпочитаете кастомные разработки?

Здесь золотая середина. Готовые решения — это стабильность и документация. Open Source — это гибкость и стоимость. Особенно в ИИ, где кастомные модели дают больше возможностей, чем стандартные решения.

- Если спросить, чем в платформе вы гордитесь больше всего, что это будет?

BI-хранилище. Оно объединило все данные компании, и теперь у нас нет ситуации, когда бухгалтерия считает прибыль в одном отчете, а коммерческий отдел — в другом, и цифры у них не совпадают даже в пределах одной вселенной.

- Каков масштаб вашей системы?

Сейчас у нас 12 Тбайт данных, 200 Гбайт обработок в сутки. Хранилище охватывает более 80 источников, сформировано 50 OLAP-кубов и 1,2 тыс. Excel-отчетов. Разработано 500 дэшбордов Power BI. Наша аудитория 1,7 тыс. пользователей в день.

- Какие бизнес-проекты удалось реализовать благодаря аналитике?

Приведу несколько ярких примеров. Рейтинг филиалов позволяет моментально увидеть, где проседает операционная эффективность. С помощью прогноза нагрузки клиентам стало удобнее выбирать время посещения офисов. Оптимизация логистики дала снижение издержек благодаря моделированию маршрутов.

ИИ в контакт-центре проводит обработку входящих звонков, суммаризацию и выделение смыслов, категоризацию, заполняет карточки лидов. Также производится оценка эффективности работы сотрудников контакт-центра, выявление зависимостей коммуникации клиентов на грузооборот.

Компьютерное зрение, сейчас находящееся в разработке, даст возможность проводить анализ качества погрузки. Так мы выявляем проблемные участки на складах, нарушения технологии погрузки, что влияет на качество перевозки грузов.

- Оцениваете ли финансовый эффект от внедренных решений?

Если верить словам наших операционных руководителей, то эффект измеряется сотнями миллионов рублей. Это как минимум говорит о том, что деньги в аналитике точно не зря тратятся.

- Как новые технологии влияют на сотрудников?

Даже неквалифицированные сотрудники получают возможность работы с данными, оценки своей работы с помощью метрик, выявления своих проблемных зон. В целом происходит повышение общего уровня знаний о возможностях «цифры» и ИИ, распространяется их использование в повседневной работе и жизни.

- Куда дальше будет двигаться ваша аналитика?

В первую очередь, это снижение задержек загрузки данных — мы хотим, чтобы все источники обновлялись в минутных интервалах. Второе направление — продвинутый ИИ: чат-боты, виртуальные помощники, автоматизированная обработка данных.