В течение года IBM проводит пять международных форумов, посвященных ПО. Их тематика соответствует пяти основным брендам программных продуктов IBM, однако в последние годы корпорация старательно смещает акценты с собственно программных технологий того или иного семейства на те бизнес-задачи, которые эти технологии призваны решать. Для широкого спектра продуктов IBM по управлению информацией на первый план выходит потребность современного бизнеса не просто справляться с обработкой колоссальных массивов накапливаемых данных, но извлекать из них реальную ценность для своей конкурентоспособности и развития. Поэтому ключевыми темами прошедшей в Лас-Вегасе конференции IBM Information on Demand были Большие Данные и бизнес-аналитика. Форум собрал более 10 тыс. участников и оказался самым масштабным мероприятием IBM в 2011 году.
Стив Миллз, старший вице-президент IBM Software & Systems Group, поделился несколькими цифрами. Утверждается, что 90% накопленных на сегодняшний день цифровых данных были созданы за последние два года, в ближайшее десятилетие их объем увеличится в 44 раза, и львиную долю будут составлять неструктурированные данные: тексты, аудио, видео и т. п. Проблему усугубляет то, подчеркнул Миллз, что сегодня мы имеем дело не только с данными «в покое», но и во все большем количестве — с данными в динамике, которые поставляют различные сенсоры, системы мониторинга, RFID-устройства. Для них требуется анализ практически в реальном времени. В отсутствие эффективных инструментов работы с данными мы начинаем в них захлебываться — 60% участников традиционного международного опроса топ-менеджеров IBM CEO Study сообщили, что количество накапливаемой в организации информации превышает возможности ее использования.
Колоссальные объемы, разнообразие источников и типов, скорость поступления и обработки данных становятся повседневной реальностью для многих отраслей, от финансов и телекоммуникаций до ретейла и медицины. Потому IBM считает принципиальным органическое включение технологий Больших Данных в единую платформу управления информацией. Большие Данные не должны стать очередным технологическим «силосом» в организации. Чтобы этого не произошло, IBM реализует механизмы интеграции своих решений в области Больших Данных с другими компонентами платформы управления информацией. Эта платформа объединяет весь спектр решений IBM для работы с данными, от старейшей СУБД для мэйнфреймов IMS, 12-я версия которой была анонсирована на конференции, от традиционных СУБД DB2 и Informix и хранилищ данных до средств управления контентом предприятия, управления мастер-данными и бизнес-аналитики. Ядром платформы являются механизмы интеграции и централизованного контроля данных Infosphere Information Server. Теперь система поддерживает и интеграцию с двумя основными продуктами, которые IBM предлагает для Больших Данных, — Infosphere BigInsights и Infosphere Streams.
BigInsights — решение на базе открытого фреймворка Apache Hadoop, добавляющее к нему инструменты, необходимые для управления данными в корпоративной среде, а также встроенные аналитические возможности, основанные на разработках IBM Researсh. Продукт Streams предназначен для анализа поступающих в реальном времени потоков структурированных и неструктурированных данных. На конференции были анонсированы новые версии решений Infosphere BigInsights 1.3 и Infosphere Streams 2.0, а также объявлено о доступности BigInsights в облачной среде IBM SmartCloud Enterprise.
Средства работы с Большими Данными в облаке помогут расширить круг их пользователей, поскольку отпадает необходимость в квалифицированном владении такими сложными технологиями, как Hadoop.