Задача бизнеса и государства в конечном итоге состоит в удовлетворении потребностей своих клиентов и граждан, а если это удается плохо, то люди уходят к другим компаниям или государствам. Предлагая различные программы лояльности или скидки постоянным покупателям, бизнес пытается удержать клиентов. Например, часто летающим авиапассажирам предлагаются бонусы. Однако на популярных направлениях бонусных билетов обычно нет, что негативно сказывается на лояльности пассажиров, особенно если после отказа им в оплате билета премиальными милями они получают массовую рассылку с предложениями разного рода скидок на билеты того же направления. Скорее всего, к этому моменту клиент уже воспользовался услугами другого авиаперевозчика. Всего этого можно избежать, если, как отмечается в статье Михаила Ганюшкина, бизнес осознает, что Большие Данные наряду с деньгами уже стали экономическим инструментом, позволяющим, например, составлять индивидуальные предложения для каждого клиента.
Ежедневно во всем мире генерируется 2,5 квинтиллиона байт данных, перегружающих информацией CIO и руководителей компаний, которые оказываются неспособны в рамках имеющихся бюджетов оперативно решать бизнес-задачи или обеспечивать соблюдение нормативных требований. Хранение устаревших, ненужных данных увеличивает затраты на ИТ-инфраструктуры, негативно отражается на эффективности компании, в то время как ценная информация оказывается невостребованной. Как следует из статьи «Большую аналитику в массы» этого номера журнала, посвященного технологиям Больших Данных, без простых и понятных инструментов работы с огромными массивами разнородных сведений общество (да и предприятия) не получит всех выгод от использования всей имеющейся информации при принятии бизнес-решений, управлении рисками, координации программ поддержки клиентов, распознавании фактов мошенничества и т. п.
Как считает Денис Серов, Большие Данные могут стать аналогом Больших Денег, причем даже в политике, что подтверждает, например, недавняя предвыборная кампания в США. Победа демократов стала возможной, в частности, благодаря усилиям аналитиков, использовавших решения на базе Hadoop, Vertica и KXEN для исследования результатов опросов общественного мнения, данных разного рода агентств, социальных сетей и изучения других источников неструктурированных данных. Сделанные средствами предиктивной аналитики выводы стали одним из решающих факторов в противоборстве с командой республиканцев, которые не смогли быстро перейти на более умеренные позиции и распознать, что избирателям не нравится их нигилизм «партии рассерженных белых людей». Но, оставив политику в стороне, авторы этого выпуска отмечают,что Большие Данные — это не только благо, но и комфортная среда для злоумышленников.
Леонид Черняк обращает внимание на то, что существующие системы информационной безопасности уже морально устарели: радикально изменились не только оружие и цели агрессии, но и состав нападающих — сегодня это команды профессионалов, а на смену вирусам, червям и пр. пришли целевые долговременные атаки класса Advanced Persistent Threat. Последние способны целенаправленно, прикрываясь валом данных, искать потенциально слабые места в обороне целевого объекта, адаптируясь к атакуемой среде и не оставляя следов в логах и журналах. Все это приводит к тому, отмечает Сергей Парфенов, что жертвами злоумышленников становятся даже компании, профессионально занимающиеся информационной безопасностью.
Вместе с тем против черных хакеров и разного рода мошенников начинает действовать закон больших чисел. Расправу с жуликами из сферы финансовых услуг можно, например, подготовить, анализируя всю доступную информацию по транзакциям и журналам активности, фиксирующим манипуляции с кредитными картами и счетами, а страховщики могут выявлять ложные утверждения, отслеживая социальные данные и поведение злоумышленника. Объединение баз данных провайдеров телекоммуникационных услуг, провайдеров почтовых сервисов, регистраторов доменов, данных платежных систем и т. п. позволяет создать среду для пресечения на корню каких-либо противоправных действий в Сети, причем даже не на уровне домена, а на уровне конкретного аккаунта. Правда, для консолидации и обработки всех этих сведений нужны новые решения — нельзя ждать, пока данные будут обработаны традиционными медлительными средствами бизнес-аналитики. Сегодня требуются скорости, близкие к реальному времени, но доступных инструментов, как отмечают авторы журнала, пока нет. «Брак, заключенный в эфире» — так аналитики называют союз Больших Данных, облаков и социальных сетей — потребует огромных вычислительных мощностей, однако авторы статьи «Машинное обучение в «Яндексе»» считают, что справиться с ситуацией можно и с помощью уже имеющихся и давно известных алгоритмов.
Судя по еще небольшому числу проектов по Большим Данным в России, до реализации серьезных программ лояльности отечественным компаниям еще далеко. Как отмечается в статье «Оценка технологий Больших Данных», у нас пока отсутствует доступный инструментарий, мало квалифицированных специалистов по исследованиям данных, а процесс распространения сервисов и продуктов на базе, например, Hadoop будет продолжительным, поскольку он не в последнюю очередь связан с необходимостью структурных изменений в организации управления бизнесом.