В опубликованном недавно докладе Forrester Research выражается убеждение, что внедрение Hadoop является «обязательным» для любой организации, в которой хотят выполнять сложную аналитику и извлекать полезные сведения из имеющихся данных.
На сегодня от 60 до 73% данных, к которым есть доступ на предприятиях, все еще не используются для нужд бизнес-аналитики, и это неприемлемо в эпоху, когда наличие глубоких аналитических знаний о заказчиках и не только — просто обязательное условие участия в конкурентной борьбе, пишут аналитики Forrester Майк Гуалтьери и Ноэль Юханна в докладе, посвященном дистрибутивам Hadoop. Специалисты по разработке и доставке приложений осваивают Hadoop «в массовом порядке», утверждают аналитики, прогнозируя, что в конечном счете платформу возьмут на вооружение абсолютно все крупные предприятия.
При этом в Forrester отмечают, что ввиду сложности рыночного ландшафта выбрать поставщика дистрибутивов непросто. Абсолютного победителя здесь нет, но есть ряд достойных претендентов, каждый — со своими сильными сторонами. Есть также второй уровень дистрибьюторов, у которых тоже имеются свои плюсы.
По версии Forrester, верхний уровень занимают Cloudera, Hortonworks и MapR, а завершают пятерку лучших дистрибьюторов Hadoop компании IBM и Pivotal. Все они, как отмечают аналитики, хорошо проработали в своих продуктах важнейшие для предприятий характеристики — безопасность, масштабирование, интеграцию, руководство и быстродействие. Все пять дистрибутивов можно развертывать локально, в частном облаке или в публичном, но управлением ПО занимается заказчик. В докладе не учитывались дистрибутивы Hadoop, предоставляемые по принципу SaaS, такие как Elastic MapReduce от Amazon Web Services или Microsoft Azure HDInsight, поскольку это чисто облачные продукты, которые заказчики не могут запускать на собственном оборудовании.
Cloudera, основанная в 2008 году, названа в докладе лидером, — компания получила высший балл в категориях «нынешний продукт» и «охват рынка», а всего в Forrester сравнивали поставщиков по 30 критериям. В Cloudera вносят в открытый код Hadoop определенные проприетарные изменения в целях укрепления безопасности, повышения готовности, а также улучшения руководства и администрирования, отмечают аналитики.
Hortonworks — пожалуй, самый сильный конкурент Cloudera, — по показателю «охват рынка» занимает второе место. Но в Hortonworks предлагают полностью открытый дистрибутив Hadoop. Все его компоненты имеют открытый код, что дает заказчикам большую свободу выбора на случай, если они захотят перейти на какой-то другой продукт; правда, эта гибкость достается за счет отсутствия некоторых функций. Если у Cloudera по показателю «нынешний продукт» результат 4,53 балла (по пятибалльной шкале), то у Hortonworks — только 3,82.
MapR — еще один лидер. Компания получила второй балл в категории «нынешний продукт» — 4,34. По словам Гуалтьери и Юханна, в MapR стараются обеспечить оптимальный баланс между быстродействием и стабильностью, добиваясь при этом максимальной простоты использования.
IBM — сильное предложение, особенно привлекательное для тех, кто уже является клиентаи корпорации и хотел бы дополнить существующие системы аналитики платформой Hadoop.
Pivotal — еще один поставщик, достойный рассмотрения, но в категории «нынешний продукт» и «рыночный охват» компания получила самые низкие оценки. Дистрибутив Hadoop от Pivotal хорошо интегрируется с системами тех заказчиков, которые уже пользуются продуктами и сервисами компании для управления данными и разработки приложений, такими как PaaS-платформа Cloud Foundry и программное обеспечение Greenplum.
Между тем, пока что пользовательская база Hadoop недостаточно велика. В прошлом году аналитик Gartner Мерв Адриан, выражая скепсис по поводу шумихи вокруг Hadoop, сообщил, что среди участников опроса, который провели в компании, до 54% вообще не планировали внедрять Hadoop в предстоящие годы.