Банк «ЦентрКредит» (Казахстан) создал решение, позволяющее выявлять клиентов, склонных к социальной инженерии, на основе фотографии. Это помогает избежать манипуляций с заемщиками и обеспечивает социально-ответственное кредитование для уязвимых слоев населения. О реализации проекта рассказывает Михаил Сикало, руководитель дирекции моделирования кредитных рисков Центра Data Science банка «ЦентрКредит» и номинант на премию Data Award.

- Что привело банк «ЦентрКредит» к необходимости решать задачу по выявлению среди клиентов людей, склонных к социальной инженерии? Насколько велик масштаб проблемы?

Мы столкнулись с необходимостью решения этой задачи из-за роста случаев мошенничества и киберугроз. Только в онлайн-канале продаж на долю социальной инженерии приходятся более 80% от всех фродовых кейсов. Это говорит о существенной проблеме в данном сегменте.

- Почему именно по фото? Неужели при всем многообразии больших данных нет других возможностей?

Антифрод-стратегии используют различные данные, как внутренние – продуктовая и транзакционная активность, расходы и доходы, цифровой след, так и внешние – данные из государственных баз, кредитные бюро, телеком-скоринг и антифишинговые сервисы. Это покрывает большую часть мошеннических схем.

Но ввиду того, что в основном социальной инженерии подвержен пул клиентов с достаточно хорошей кредитной историей и положительной оценкой с точки зрения рисков, эмоциональное состояние человека может быть единственным маркером для определения психологического давления. Данные фото клиентов использовались в качестве эксперимента для обогащения моделей, разработанных на стандартных табличных данных, и в результате получили хороший эффект от модели выявления клиентов, подверженных социальной инженерии.

- Откуда брали данные для обучения моделей? Хватает ли количества фото обманутых граждан?

Использовались фотографии из приложения, сделанные во время заведения заявки на кредит, так как 100% выдач в онлайн-канале требуют прохождения проверки по фото. Ввиду большой доли социальной инженерии во фродовых кейсах, данных оказалось достаточно для построения модели и выделения контрольной группы для независимой оценки качества полученного решения.

- Как к такой постановке вопроса относятся люди?

Так как основной целью банка является сохранение социально-ответственного кредитования, по решению модели не будет формироваться отказов в выдаче кредита. Происходит лишь дополнительная проверка со стороны верификации, негатива со стороны клиентов не формируется.

- Что «под капотом»? Какой математический аппарат использован?

Модель является частью большой мультимодальной системы по борьбе с мошенничеством, к которой относятся антифрод-стратегия на основе данных цифрового следа, ML-модели с применением нейронных сетей, дополнительные проверки с использованием данных мониторинга первого кредитного бюро и т.д. Для разработки использовалась предобученная модель с дальнейшим дообучением на наших фотографиях с использованием линейных классификаторов.

- Что в ходе проекта было самым сложным?

Наиболее сложным в проекте является внедрение его в текущий бизнес-процесс, а также проработка дополнительных проверок на предмет наличия мошенничества. Внедрение данного подхода требует пересмотра графика коммуникации со стороны верификации. Кроме того, возможна пролонгация принятия решения для предодобренных заявок и дополнительная нагрузка на сервера.

- Какова точность модели? Она достаточна для практического применения?

На отложенной выборке модель показала достаточно хорошее качество для ее дальнейшего запуска в промышленный ресурс. Показатель FalsePositive составляет 1,5% ввиду общего большого количества выдач и относительной небольшой доли социальной инженерии, а FalseNegative 48%.

- Можете ли похвастаться конкретными результатами применения модели в «ЦентрКредите»?

На данный момент реализован MVP проекта, с прогнозируемым снижением социальной инженерии на 30%. Внедрение проекта запланировано на третий квартал 2025 года.

- Каковы вообще сценарии использования модели? В каких процессах она может использоваться?

На первых этапах при пилотировании подразумевается использовать решение для дополнительной верификации клиента. Будет проводиться коммуникация с клиентами на предмет уточнения цели взятия кредита, тестовые вопросы на склонность к социальной инженерии и т.п.

- Проект реализован для внутреннего потребления, или для внешнего рынка тоже?

На первом этапе подразумевается использование решения для внутреннего пользования. В дальнейшем будем проводить расширение функционала модели для офлайн-выдач. Следующим шагом действительно может стать вывод данного решения на внешний рынок, что позволит адаптировать его для использования в других банках, а также дообучать модель на счет партнерских данных.

- Каковы направления и перспективы развития этого проекта?

Первоочередная задача – тестирование и масштабирование решения на выдачу офлайн-продуктов, так как качество и контур фото в отделениях существенно отличается от фото в приложении. Возможно, будет необходимо разрабатывать раздельные модели для онлайн- и офлайн-выдач. Также можно будет протестировать решение для применения в классическом скоринге.