В большинстве отраслей не заметно роста эффективности от использования накапливаемых сведений. Зачастую причина в том, что компании имеют неверное представление о ценности различных источников данных. Действительно, не все данные одинаково полезны. Компании по-прежнему склонны оценивать то, что клиент сам сообщает о себе, а не ориентироваться на его поведение. Поэтому системы, использующие источники данных нового типа для повышения эффективности бизнеса, все еще редки.
«Уже несколько лет мы экспериментируем с различного рода источниками данных и давно убедились в том, что не всегда “больше данных” означает “больше денег”», – подчеркнул Максим Савченко, руководитель разработки моделей в Центре компетенций исследований и разработки моделей компании «Сбербанк-Технологии», в своем выступлении на конференции «Технологии Больших Данных», организованной издательством «Открытые системы». Ключевым моментом является то, что если говорить о конечных потребителях технологий, то их целью не является игра с данными или моделями – им нужен финансовый эффект. Между тем сам сбор данных и их хранение не приносят компании денег – как раз наоборот. Создание моделей тоже обходится недешево, но модель представляет собой лишь отчет, а отчеты сами по себе денег компании тоже не приносят. О какой-либо выгоде можно говорить только после внедрения моделей в операционный контур.
В любом случае людей, которые имеют опыт построения моделей, гораздо больше, чем тех, кто имеет опыт их внедрения. Кроме того, можно столкнуться с тем, что внедрить модель не позволяет текущая инфраструктура, либо с тем, что внедрение обходится очень недешево.
«Прежде чем начать решать ту или иную задачу, надо ответить себе на два важных вопроса: какая бизнес-польза будет получена и разрешит ли регулятор использовать полученное решение?» – рекомендует Савченко. Компаниям, разрабатывающим такие системы, например, в целях скоринга, приходится иметь дело с массой ограничений, причем в России ситуация еще не самая тяжелая. Если, начиная проект, об этом не подумать, ресурсы будут выброшены на ветер, даже если проект формально окажется успешным.
Отделить зерна от плевел
Источников данных много, но все они делятся на две категории. К первой относится огромное количество общедоступных данных, которые по сути абсолютно бесполезны для решения большинства бизнес-задач. Очевидно, что, например, попытки на основе сообщений на форуме оценить кредитный риск или эффективность человека как руководителя ни к чему хорошему не приведут. В этом случае при построении моделей придется столкнуться с их низкой эффективностью.
Вторую категорию внешних источников составляют полезные данные. Их меньше, и они более структурированы. Однако у этих внешних данных есть как минимум несколько недостатков. Во-первых, ими кто-то владеет, и за обращение к ним придется платить. Но гораздо печальнее то, что многие данные, интересные с точки зрения принятия решений, представляют собой тайну: тайну связи, коммерческую или банковскую тайну. С такими данными надо очень аккуратно работать, необходимы подходы, которые принципиально отличаются от работы с классическими источниками. Нужны схемы, позволяющие получить необходимую информацию, не нарушая законов и не ущемляя ничьих прав.
«Любопытно, что большая часть детальной информации, интерес к которой может вызывать неприятие клиентов, бизнесу и не нужна. Мы не копаем слишком глубоко, не лезем в те подробности, до которых нам нет дела», – подчеркивает Савченко. Типичным примером стал проект скоринга корпоративных клиентов, реализованный Сбербанком. В результате удалось найти определенный баланс между тем, что нужно, и тем, что можно по закону, причем так, чтобы не создавать проблем клиентам.
Требовалось найти источник данных, который был бы, во-первых, дешевым, а во-вторых, исключал перечисленные ограничения. Более того, он должен был быть не заявочным, а поведенческим, отражающим реальное состояние клиента. Таким источником оказались транзакционные данные компаний.
Актуальность и объективность
Максим Савченко, руководитель разработки моделей в Центре компетенций исследований и разработки моделей компании «Сбербанк-Технологии»: «Большая часть детальной информации, интерес к которой может вызывать неприятие клиентов, бизнесу и не нужна. Поэтому мы не копаем слишком глубоко, не лезем в те подробности, до которых нам нет дела» |
Поведенческие модели, оценивающие реальное состояние клиента, а не то, что он о себе заявляет и что сотрудники компании о нем думают, существуют уже давно. Главной из них является поведенческий скоринг на основе данных кредитных систем. По сути, все модели Basel II, оценивающие экономический капитал, также строятся на основе того, как клиент платит по своим долгам, и это довольно точно характеризует связанные с ним риски.
Однако при пользовании данными кредитных систем возникает несколько проблем. Одна из них – отсутствие там интересующей организации.
«При попытке оценить клиента, впервые пришедшего за кредитом, но при этом годами пользовавшегося другими финансовыми услугами, возникает интересная ситуация: мы его знаем, но ничего сказать не можем», – говорит Савченко. Более того, по наиболее интересным клиентам информации может оказаться меньше всего. Как известно, обеспеченные люди нечасто прибегают к кредитным услугам.
Вторая проблема – устаревание данных. Ситуация на момент нового обращения может измениться. И именно транзакционные данные являются источником, постоянно сохраняющим актуальность.
Место для алгоритма
По мнению Савченко, важно не только то, какие задачи решаются и какие при этом методы используются. «Если мы хотим механически заменить человека каким-либо алгоритмом, ничего не получится: сильного искусственного интеллекта пока нет, и, несмотря на все заявления, в его появление в ближайшее время верится слабо. Однако от процессов, где человек пока незаменим и где его использование оправданно, вполне можно уйти к тем процессам, где машина уже чувствует себя прекрасно», – подчеркивает он.
Машины доверчивы, как дети, их легко обмануть, предоставив неверную информацию, и на основе этого будут сделаны неверные оценки. Человек же в этом случае вполне может почувствовать неладное, основываясь на своем опыте.
Но ситуация радикально изменяется, если построить модель на основе объективных данных, не требующих ни предоставления каких-либо сведений о себе, ни экспертных суждений.
«Раньше при оценке бизнеса мы смотрели на оценки, полученные экспертами, и предоставленную компаниями отчетность. Это долго и недостоверно. Однако, если посмотреть на поведение бизнеса (изменение числа контрагентов, дебиторскую задолженность, поток платежей и т. п.), можно провести его детальную диагностику», – отмечает Савченко. Таким образом, происходит не замена оценивающего бизнес эксперта на робота, а встраивание алгоритма совсем в другом месте – там, где данных много, где их невозможно подделать, а сами данные точно характеризуют происходящее.
После того как новые методики оценки были внедрены в конце прошлого года для кредитования малого бизнеса, удалось за полгода нарастить портфель кредитов на 10% без ухудшения его качества. С учетом масштабов Сбербанка и непростой экономики, это очень неплохой результат.
Выяснилось, что банк вполне может отказаться от традиционной оценки клиентов. Слово «традиционный» в данном контексте вовсе не несет негативной оценки. Но если банк действительно может обойтись без ставших ненужными справок, этой возможностью нужно пользоваться. В нынешней ситуации это имеет большое значение, ведь самое ценное в любом бизнесе – клиенты, и если совершать действия, неприятные им, ничем хорошим это не закончится.