Для любой технологии рано или поздно наступает этап консьюмеризации, когда она становится доступной широкому кругу потребителей. Похожее должно было произойти и с Большими Данными. Технологии, до сих пор воспринимавшиеся как элитарные из-за высокой стоимости «входного билета» и потребности в экспертах высочайшего класса, начали появляться на рынке в качестве услуги.
Сам рынок средств Больших Данных состоит из трех сегментов: инфраструктуры, программных решений и услуг. Каждый из сегментов, согласно прогнозам IDC, в ближайшие годы будет расти на 22-26%. Однако динамичность этих сегментов существенно различается. Инфраструктурный сегмент представлен известнейшими компаниями, и особых изменений в нем не происходит, сегмент же приложений гораздо разнообразнее и «живее» в плане новых имен. Это вполне естественно: так или иначе, хранение цифровых данных – задача, которая решается уже десятки лет. А вот аналитика Больших Данных – задача относительно новая. Этот сегмент наполнен молодыми, но уже достаточно большими и известными компаниями, а также новыми подразделениями больших корпораций.
Несмотря на явную положительную динамику рынка Больших Данных, растущая стоимость программных решений может сыграть негативную роль и задержать его рост. Как полагает Кирилл Чистов, директор по развитию Data-Centric Alliance, такое происходит по причине созревания рынка – клиенты лучше понимают, что и зачем им нужно и сколько они готовы платить, а поставщики решений, видя сформировавшуюся потребность, осознают сложность поставленных задач и повышают цены.
Еще более интересная ситуация складывается на рынке услуг, где к интеграторам присоединяются компании, создающие дополнительную ценность из Больших Данных. Здесь также присутствуют как уже давно существующие компании, создавшие специальные подразделения, так и новые игроки, фокусирующиеся на какой-то нише (чаще всего по бизнес-вертикалям).
Формирование рынка
По итогам 2015 года на российском рынке Больших Данных можно выделить три основные тенденции.
Во-первых, на рынок вышли крупные агрегаторы данных и начали оказывать услуги для B2B-аудитории. Это и большие интернет-игроки, такие как «Яндекс», открывший еще в декабре 2014 года Yandex Data Factory, или Mail.ru, и телеком-операторы – например, «ВымпелКом», сделавший на эту тему много громких заявлений.
«Появление крупных, уважаемых игроков ознаменовало определенное созревание рынка: услуги в области Больших Данных начали стандартизироваться», – говорит Чистов. Большие и малые компании принимают единые стандарты того, как работать с Большими Данными, как оказывать услуги, как их продавать, по каким критериям оценивать. Более того, на рынке появляются специализированные компании, которые ничем другим не занимаются – лишь собирают данные и предоставляют их в удобном для использования бизнесом виде.
Именно выход операторов связи на рынок услуг Больших Данных способствовал формированию открытой экономики данных с понятными механизмами ценообразования
Именно выход операторов связи на рынок услуг Больших Данных способствовал формированию открытой экономики данных с понятными механизмами ценообразования, очерченными ролями игроков, прозрачными процессами, измеряемыми результатами. Эти операторы обладают огромным массивом поведенческой информации о своих абонентах и ресурсами, достаточными, чтобы «активировать» данные, в том числе в интересах третьих лиц. Они обеспечивают для своих партнеров самые разные решения, начиная с геолокационных сервисов и заканчивая предсказанием транспортной загрузки.
По мнению Чистова, именно появление открытого рынка обезличенных данных стало важнейшим событием на российском рынке Больших Данных в 2015 году. Компании в зависимости от потребностей могут их как приобретать, интегрируя в свои маркетинговые программы, так и – наоборот – монетизировать имеющиеся данные, продавая их вовне.
Таким образом, можно говорить о том, что сформировался рынок активной торговли данными, где практически любая организация имеет возможность покупать данные с нужной ей нарезкой и заточенные под интересующую ее бизнес-цель – например, для проведения маркетинговых кампаний или дополнительного анализа различных сегментов своей целевой аудитории. Если в 2014 году купить такие данные было сложно – существовало буквально два-три поставщика, то сейчас поставщиков около дюжины и сложностей с выбором нет. Проблемы другие – реализовать проект как можно быстрее, оперативно «научив» данные работать для достижения нужных целей.
Вторая заметная тенденция на стагнирующем рынке – значимые поглощения, которые поддерживают венчурный рынок и стимулируют талантливые команды специалистов развивать инновации и технологии в области работы с данными. Две сделки можно отметить смело. В начале года Сбербанк приобрел Segmento – игрока рынка Больших Данных, поставляющего решения в области алгоритмического управления маркетинговыми кампаниями. В конце 2015 года «Ростелеком», приняв решение о развитии собственных сервисов и решений Больших Данных, поглотил компанию IQ’Men.
«Такие поглощения – серьезный знак бизнес-сообществу: технологии настолько готовы, что их можно просто купить. Кроме того, столь значительные инвестиции в проекты-команды со стороны грандов показывают их стратегическую готовность перейти к новому технологическому укладу», – считает Чистов.
Третья важнейшая для развития рынка тенденция – образовательная составляющая: произошла повсеместная популяризация образования в области Больших Данных. Наблюдался бурный рост курсов, платных и бесплатных направлений в лидирующих вузах (МГУ, ВШЭ, МФТИ и др.) при поддержке крупных поставщиков. Значимый пример – Школа анализа данных «Яндекса». Это явный лидер по широте покрытия тематики и числу слушателей курсов.
Именно третья тенденция наиболее «практична». Много лет подряд бизнес говорил о том, что ему катастрофически не хватает сотрудников для работы с данными. Это и тормозило рост рынка, и разогревало зарплатные ожидания специалистов. При этом времени на адаптацию системы образования не было, и бизнес сам занялся подготовкой кадров.
Телеком – главный поставщик данных
Важность выхода на рынок Больших Данных телеком-операторов отмечает и Евгений Уткин, старший консультант по развитию бизнеса Ericsson в России. До недавних пор они занимались реализацией исключительно внутренних проектов и никак не влияли на рынок.
«Крупные телеком-операторы, как и интернет-компании, имеют широкий доступ к ряду уникальных данных: например, о месторасположении клиента, его социальных связях, его поведении. Причем их данные гораздо шире и распространяются не только на интернет-активность, но и на значительную часть обыденной жизни», – подчеркивает Уткин.
Чтобы эти данные как-то капитализировать, извлечь из них ценность для бизнеса, операторы делают три важных шага. Во-первых, они трансформируют свою организационную структуру – выделяют отдельный блок или департамент, занимающийся Большими Данными, а иногда – даже отдельную дочернюю организацию. Во-вторых, создают технический функционал Больших Данных – как архитектуры, так и компетенции, позволяющие реализовать потенциал данных. Третий шаг – массовые поглощения нишевых игроков, пока больше заметные на глобальном рынке.
Например, телеком-операторы поглощают игроков рынка интернет-рекламы, чтобы приобрести клиентов и уже имеющиеся данные. На бизнес операторов связи это оказывает подстегивающий эффект: от повышения эффективности их традиционного бизнеса с точки зрения доходов и издержек до развития новых услуг и выхода на новые рынки.
Если говорить о внутреннем применении Больших Данных, то такие проекты красной нитью проходят через все процессы оператора. Они затрагивают доходную часть в плане привлечения абонентов, прогнозирования их оттока и удержания. Что касается сокращения издержек, то наиболее важны процессы управления сетью: оптимизация размещения вышек, идентификация проблем, управление трафиком.
Достигнув заметных успехов на внутренних проектах, операторы начали предлагать консалтинговые услуги, основанные на анализе данных, внешним потребителям.
В качестве примера можно привести оценку бизнес-привлекательности локаций с использованием агрегированных данных о потоках абонентов. Основными потребителями становятся предприятия розничной торговли, а также структуры, занимающиеся рекламой и недвижимостью. Кроме того, практически все компании, работающие в потребительском сегменте, волнует определение предпочтений клиентов, их поведение в Интернете и стиль жизни. Эти данные могут предоставлять и маркетинговые агентства, но данные мобильных операторов оказываются более достоверными, охватывая более широкую выборку. Если же говорить об анализе поведенческих факторов, то все более заметным становится «умное» страхование, как правило, осуществляемое именно в партнерстве с телеком-операторами.
В России большинство направлений использования Больших Данных находится в зачаточном состоянии – пока что мало компаний, ведущих такие проекты. Чуть ли не единственное исключение – финансовая сфера.
Банки в роли ледокола
«Если ключевыми поставщиками Больших Данных на сегодня остаются телеком-операторы, то ключевыми потребителями – банки», – считает Чистов. В 2014 году использование внешних данных для уточнения скоринговых моделей еще было инновационной диковинкой, но в 2015 году уже стало общепринятой практикой – стандартом для всех банков, активно занимающихся выдачей кредитов.
Сейчас очень мало кто обходится без дополнительных данных или по крайней мере не интересуется ими на этапе «холодного старта» – в самом начале отношений, когда банк ничего не знает о заемщике. Он хочет узнать как можно больше, чтобы на раннем этапе принять верное решение: по какой цепочке согласований отправить кредитную заявку, какие задать вопросы, чтобы снизить риски. При этом важно не перегнуть палку и не упустить добросовестных заемщиков.
«Большие Данные в банках используются в основном для того, чтобы получить извне дополнительную информацию о клиентах и улучшить работу с ними», – согласен Андрей Свирщевский, руководитель направлений аналитики и гарантирования доходов SAS в России и СНГ. Например, анализ текстовых данных из социальных сетей – типичный пример информации, используемой банками и имеющей доказанный эффект в виде повышения отклика при маркетинговых кампаниях на 15-30%.
Из прочих источников можно выделить поисковые запросы и данные о взаимосвязях между людьми, используемые в целях обогащения анкетных данных и уточнения скоринговых моделей.
«Не менее важно для любой организации уметь определять категории людей, с которыми вообще не следует работать», – отмечает Свирщевский.
Еще в 2010 году банки начали собирать на своих сайтах заявки на потребительские кредиты. Интернет – самый недорогой канал получения новых заемщиков, но он и самый неэффективный в плане качества клиентов. Банки очень скоро столкнулись с тем, что существующие системы оценки рисков часто отбраковывают такие заявки, увеличивая нагрузку на контакт-центр, а также число недовольных клиентов, получивших отказ без объяснения причин.
«Мы даем банкам возможность на базе внешних данных – например, о посещаемых сайтах и действиях в соцсетях – насыщать новыми знаниями модель принятия решений», – говорит Чистов. Это позволяет повысить процент выдачи кредитов с проходящего через сайт трафика, удерживая в разумных пределах процент рискованных кредитов.
Решение по скорингу на основе поведения клиентов в Интернете стало типичным проектом прошлого года. Очень многие банки онлайн-скоринг и быструю обработку заявок на кредиты пытаются перенести на свою площадку, но понимают, что заниматься агрегацией данных выгоднее с помощью специализированных компаний. Важно, что приобретаемые услуги включают в себя не только поставку «сырья», но и доработку моделей аналитиками, а также построение алгоритмов, которые учатся искать нужную банку аудиторию – с хорошей покупательской мощью, но склонную откликнуться на предложение о кредите.
Доступность Больших Данных широкому рынку порождает интерес к ним, и скоринг начинают использовать не только финансовые организации. Им стали заниматься ретейлеры, туристические и фармацевтические компании. Для всех актуальны сокращение нецелевой аудитории, оценка склонности людей к совершению покупок, определение фазы, на которой находится принятие решения о покупке, а также возможной ценности клиента. Однако именно банки стали ледоколом, проложившим Большим Данным дорогу к решению этой практической задачи. В 2016 году, вероятно, появится больше интересных проектов по тиражированию этого опыта производителями потребительских товаров – например, для программ лояльности. Пока это делают очень немногие компании, обладающие необходимыми данными и умеющие их быстро «упаковывать» в формат, с которым можно удобно работать – например, планировать рекламные кампании.
Пока без правил
На развитие рынка данных в будущем будут влиять три основных фактора: экономическая обстановка, наличие публичных проектов и внимание со стороны регулирующих органов.
Очевидно, если у компаний не будет денег на развитие, это будет тормозить и растущие сегменты рынка. Экономическая обстановка разделит компании на две части: будет стимулировать одних активнее переходить на интеллектуальные подходы к ведению бизнеса, а других заставит сконцентрироваться на решении краткосрочных задач. Первая группа уже, по сути, находится в процессе поиска и внедрения средств Больших Данных, а значит, в 2016 году должны появиться примеры успешного применения технологий анализа данных. Вполне зрелые решения уже существуют, их может использовать практически любая компания, имеющая хотя бы одного специалиста по анализу данных.
Как любой новый и быстрорастущий рынок, рынок данных рано или поздно привлечет внимание регулирующих органов. В этом случае отрасли необходимо четко представлять, какие сферы деятельности регулирование оздоровит и стимулирует, а какие не требуют поддержки извне.
«Что касается правового регулирования Больших Данных, то всё пока сводится к тому, что никакого специального регулирования нет, как это до определенных пор было с Интернетом», – говорит Андрей Середа, ведущий юрист DCA. По большей части все юридические вопросы, связанные с Большими Данными, находятся в зоне действия законов, регулирующих другие сферы деятельности. Прежде всего это закон об информации, который гарантирует свободу поиска и распространения информации и говорит, что информация – объект правовых отношений: ее можно покупать и продавать. Он же содержит набор ограничений и требований относительно того, как обладатель информации может ею распоряжаться, а что с информацией делать нельзя.
Естественным образом встает вопрос этики использования Больших Данных. Этика использования – это то, что возможно сделать технически и что допустимо с точки зрения закона. Пока в этой области нет никакого «кодекса чести», равно как и отсутствуют попытки его создать. Компаниям приходится действовать, руководствуясь своими понятиями о добре и зле.