Отношение бизнес-сообщества к Большим Данным постепенно меняется, и это хорошо заметно на ежегодных конференциях по тематике Big Data, организуемых издательством «Открытые системы». Если участников первого форума волновал вопрос «Что такое Большие Данные?», то через год им хотелось знать, как на практике реализовать проект. Сейчас же, по мнению участников форума «Big Data 2014: взгляните на данные как на большие», прошедшего 20 марта, компании все больше интересуются появившимся опытом, чтобы избежать собственных ошибок.
Основной темой практически всех выступлений на форуме стал анализ данных в реальном времени. Это отнюдь не случайно: именно данная концепция является актуальной для многих отраслей, позволяя решить массу задач — от взаимодействия с клиентами до повышения операционной эффективности.
«Представьте себе, что через лобовое стекло машины вы видите дорожную ситуацию, актуальную несколько часов назад. Страшно? А ведь именно так мы привыкли управлять бизнесом», — подчеркнул Ринат Гимранов, начальник управления ИТ «Сургутнефтегаза». Как известно, в традиционных СУБД существует узкое место: обмен между приложением и базой данных. Именно на этом этапе возникают проблемы, связанные с производительностью управленческих систем. Обойтись без этого этапа позволяют технологии обработки данных в оперативной памяти. Не случайно нефтяники из Сургута в 2012 году одними из первых рискнули перейти на новую платформу SAP HANA.
В «Сургутнефтегазе» данные из ERP в реальном времени передаются в СУБД HANA. Это стало реальной инновацией, благодаря которой удалось на порядки сократить основные параметры обработки информации и попутно упростить архитектуру информационных систем. Как уточнил Гимранов, в компании функционирует 29 приложений SAP, и появление резидентных технологий позволило обслуживать их с помощью единой СУБД.
«В обозримом будущем системы, работающие с Большими Данными, будут сосуществовать в корпоративном ландшафте с традиционными решениями», — констатировал Илья Гершанов, руководитель направления «Большие Данные» компании Informatica. Таким образом, отказываться от созданной инфраструктуры и делать ставку только на Большие Данные не стоит.
Технологии, собирающиеся под брендом Big Data, переживают этапы жизненного цикла, традиционные для всех ИТ-решений. Уже есть многочисленные поставщики и первые успешные проекты. В ближайшем же будущем ожидается консолидация рынка, появление разочарованных заказчиков и негативных публикаций; при этом технология будет внедрена у 5% потенциальных пользователей. Лишь за этим пойдет планомерное развитие рынка. Основные проблемы будущих проектов, по мнению Гершанова, будут связаны с недооценкой рисков.
«Зачем нужна аналитика в реальном времени? В первую очередь это сокращение рисков в условиях быстро меняющегося рынка и повышение адекватности принимаемых решений», — заявил Сергей Знаменский, ведущий консультант по продуктам HP. Он отметил, что в ряде случаев платформа HP Vertica выигрывает в производительности по сравнению с более раскрученной SAP HANA.
Сейчас уже успело накопиться довольно много примеров эффективного использования заказчиками таких систем. Например, разработчик сетевых игр Zynga анализирует буквально каждый клик, сделанный клиентами, выясняя их предпочтения, BitBank использует систему обнаружения мошенничества, а Yota анализирует использование сетевых ресурсов.
Про обработку данных в реальном времени говорил и Шон Оуэн, директор по Data Science компании Cloudera. Для успеха подобных проектов крайне важно интегрировать технологии Больших Данных в операционную деятельность компаний. По мнению Оуэна, уже в 2014 году в реализуемых проектах произойдет переход «от лабораторий к заводам». Анализ данных станет осуществляться в промышленных масштабах, и операционная аналитика будет вплетена в деятельность организаций.
Разумеется, при встраивании процессов аналитики в повседневную деятельность компаний крайне важен отраслевой опыт интегратора. «Придя к заказчику, мы стараемся показать свою экспертизу в предметной области, а по возможности — и уже имеющиеся наработки, например, отраслевые модели», — рассказал Сергей Кузнецов, директор по технологиям Дивизиона данных IBS. Справедливости ради следует уточнить, что в большинстве случаев отраслевая модель для конкретной компании не подходит. На рынке по-прежнему доминируют уникальные разработки.