Сравнивать коммерческие системы обработки Больших Данных на основе Hadoop теперь станет несколько проще благодаря появлению нового теста TPCx-HS, разработанного в Transaction Processing Performance Council. В TPC надеются, что поставщики Hadoop будут пользоваться новым тестом для оценки быстройдействия своих систем, что поможет потенциальным покупателям сравнивать соотношение цена-производительность для различных решений.
Новый тестовый комплект можно загрузить на сайте TPC. В него входят спецификации и руководство пользователя, а также скрипты для выполнения кода теста и Java-приложение, имитирующее рабочую нагрузку. Сам тест определяет, насколько быстро система на базе Apache Hadoop перестраивает данные с помощью широко используемого алгоритма сортировки. Производители могут оптимизировать свои системы программным способом либо указывать результаты тестирования на максимально быстром оборудовании. Для тестирования можно выбрать один из искусственно сгенерированных срезов данных размером от терабайта до 10 тыс. Тбайт. По результатам тестирования выдается число, указывающее общее быстродействие, и показатель соотношения цена-производительность. Предусмотрен также необязательный тест, оценивающий энергоэффективность системы.
Согласно правилам TPC, тест необходимо выполнить дважды, указав в качестве результата меньший из полученных показателей. Другие стороны могут оспорить опубликованные результаты в течение 60 дней. Как и в случае с остальными своими тестами, в TPC требуют, чтобы официальное тестирование проводилось третьей стороной.