Вряд ли можно безопасно управлять автомобилем, через лобовое стекло которого водитель видит картинку с задержкой хотя бы в несколько секунд, однако именно так сегодня работают предприятия, управляемые информационными системами вчерашнего дня. Сегодня для принятия взвешенных решений требуется уметь в реальном времени обрабатывать все имеющиеся данные. Как построить и использовать такие системы на базе технологий Больших Данных, узнали участники Третьего международного форума Big Data 2014, проведенного издательством «Открытые системы».

Реагировать на события, как отметил в своем докладе Ринат Гимранов, начальник управления ИТ компании «Сургутнефтегаз», в момент его возникновения — именно в этом суть концепции Real Time Enterprisee 2.0. Менеджеры должны использовать унифицированное решение для всех режимов работы и типов данных, а если еще и скорость обработки меняется на порядки, то приходится говорить уже о качественных изменениях в стиле управления. Однако далеко не все управленцы, пусть даже вооруженные мощными технологиями извлечения полезных сведений из сырых данных, готовы сегодня работать не числом, а умением.

Форум реальных проектов

 

Как отметил Илья Гершанов из компании Informatica, если предыдущие форумы Big Data были посвящены выяснению понятия «Большие Данные» и обзору соответствующих технологий, то нынешний — форум реальных проектов. Среди примеров таких проектов на форуме были представлены доклады о возможностях и проблемах обработки Больших Данных в медицине; о применении технологий Больших Данных для защиты интернет-магазинов от мошенничества; о способах повышения качества контента торговой площадки Avito.ru; о мониторинге параметров качества предоставления сервисов для биллинга реального времени. Как показывают исследования, до 80% усилий в проектах Больших Данных расходуется на сбор, интеграцию и очистку данных, поэтому, прежде чем бросаться внедрять какие-то технологии, следует сначала включить мозги, а потом заниматься повышением качества данных. Для эффективного выполнения таких проектов сегодня требуются специалисты, обладающие инженерными знаниями, а не только разбирающиеся в статистике или аналитике. Кроме того, такие специалисты должны уметь строить системы и, главное, формулировать цели. Сергей Золотарев, глава представительства в России EMC/Pivotal, отметил, что цикл «приложения — аналитики — данные» должен выполняться в реальном времени, однако сегодня большинство аналитических систем работает с данными, когда их ценность наиболее низка (от 1 дня до 1 года). В бизнес-среде считается, что данные надо обрабатывать либо сразу после совершения событий, либо спустя продолжительное время для выявления скрытых тенденций.

По мнению Сергея Лихарева, руководителя по развитию бизнеса IBM Big Data, именно данные будут определять подход и способ обработки, а не наоборот, как было до сих пор, — предприятиям сейчас требуется минимизировать усилия по сбору данных на фоне увеличения их объемов. При этом надо помнить, что стоимость сбора, хранения и анализа данных может быть больше, чем выгода от результата их учета.