С помощью системы High Performance Analytic Server компании SAS Institute теперь можно анализировать неструктурированные данные, хранящиеся в кластерной СУБД Hadoop и распределенной файловой системе Hadoop Distributed File System.
Аналитический сервер использует технологию доступа к данным SAS/Access Interface for Hadoop. Все данные, загруженные в сервер SAS из Hadoop, будут представлены в его собственном формате, так что составлять запросы к базе данных на SQL или каком-нибудь другом языке не потребуется, обещают в компании.
Пакет High Performance Analytic Server был выпущен компанией SAS в прошлом году. Он предназначен для быстрого анализа терабайтных объемов структурированных и неструктурированных данных. До сих пор пакет поддерживал только работу с данными, хранящимися в комплексах Teradata и EMC Greenplum. Кроме интерфейса к Hadoop, в новой версии появился инструмент для классификации данных Text Rule Builder. Он позволяет использовать для классификации лингвистические и статистические методы.
Для непрерывного анализа потоков данных — щелчков по веб-страницам, рыночных котировок и других — SAS предлагает технологию DataFlux Event Stream Processing Engine.