Большие Данные — расхожий в последнее время термин, означающий гигантские объемы данных, которые, помимо традиционных корпоративных приложений, генерируются веб-сайтами, сетями датчиков и иными источниками.
Как сообщают в Oracle, в состав новой системы включен дистрибутив системы распределенной обработки данных Hadoop, инструменты Oracle Data Integrator Application Adapter for Hadoop и Oracle Loader for Hadoop, а также среда статистического анализа с открытым кодом R и NoSQL-СУБД Oracle.
Как поясняет аналитик Monash Research Курт Монаш, термином NoSQL обозначают растущее семейство технологий баз данных, которые можно определить по отсутствующим у них свойствам: поддержка SQL, операции соединения и встроенные механизмы обеспечения целостности данных. «NoSQL также нет равных в аналитических возможностях, и такие СУБД обычно горизонтально масштабируются в широких пределах», — добавляет аналитик.
По утверждению Мендельсона, в Oracle понимают, что далеко не все сисадмины и разработчики сегодня знакомы с новыми моделями программирования вроде Hadoop: «На сегодня Hadoop является довольно нишевой технологией. Все о ней говорят, но мало кто из клиентов Oracle знает, как ею пользоваться». Смягчить эту проблему призваны дополнительные программные компоненты Big Data Appliance — адаптер для интеграции данных и загрузчик Hadoop.
По мнению аналитика Forrester Джеймса Кобьелуса, новый комплекс — не первая «машина Больших Данных» Oracle, если определять большие данные как «три V»: volume («объем» — петабайты хранимых данных), velocity («скорость» — получение данных, преобразование, загрузка, анализ и опрос в реальном времени) и variety («разнообразие» — обработка структурированных и полуструктурированных данных различных типов).
«Все перечисленные свойства есть у Exadata, а эта система уже оптимизирована для смешанных рабочих нагрузок: она поддерживает возможности анализа хранимых в базах данных и их массово-параллельной обработки при помощи обширной библиотеки высокоразвитых аналитических алгоритмов и моделей», — полагает аналитик.
По мнению Кобьелуса, Oracle, вероятно, купит кого-то из разработчиков специализированных реализаций Hadoop, чтобы расширить свой арсенал соответствующих инструментов.