Большие Данные возвращают администраторам баз данных

Новый инструментарий может работать в любой среде Hadoop или Spark
Источник: Oracle

Сегодня, когда многие предприятия осознали ценность анализа Больших Данных, самое время привлечь к этому процессу администраторов баз данных и хранилищ данных.

Корпорация Oracle представила расширение своего связующего программного обеспечения Oracle Data Integrator, которое дает администраторам баз данных и специалистам по хранилищам данных возможность рассматривать репозитории Больших Данных как еще один источник данных наряду со структурированными базами и хранилищами данных.

«Oracle Data Integrator for Big Data позволяет разработчику, не имеющему навыков работы с технологиями Hadoop, получить присущую Hadoop эффективность, — пояснил вице-президент Oracle по управлению продуктами Джефф Поллок. — Платформы Больших Данных, такие как Hadoop и Spark, в которых используются языки Java и Python, изначально больше ориентированы на программистов, чем на администраторов баз данных. А между тем в традиционном анализе корпоративных данных основная роль отводится администраторам и специалистам по инструментам интеграции данных наподобие ETL (Extract, Transform, Load — ‘извлечение, преобразование, загрузка’), использующим SQL и визуальные интерфейсы».

Data Integrator for Big Data расширяет возможности Oracle ODI в части управления источниками Больших Данных.

ODI обеспечивает организациям возможность извлекать данные, представленные в различных форматах и в разных источниках, в частности в реляционных СУБД IBM и Microsoft или в хранилищах данных Teradata. С этой точки зрения подключение репозиториев Больших Данных к ODI представляется вполне естественным.

Благодаря новому расширению компаниям не придется направлять администраторов баз данных на переобучение, чтобы овладеть инструментами вроде Hive for Hadoop.

Новый инструментарий может работать в любой среде Hadoop или Spark, не требуя установки каких-либо дополнительных средств на узлах данных. Опираясь на мощь распределенных вычислительных сред, Data Integrator for Big Data обращается к узлам, где хранятся данные, и выполняет там все требуемые операции.

Системы сбора данных в реальном времени, такие как Oracle GoldenGate 12c, могут перемещать транзакционные данные в кластер Hadoop, где будет проходить подготовка к последующему анализу их с помощью ODI.

В своих попытках объединить новые инструменты Больших Данных с традиционным программным обеспечением анализа данных Oracle не одинока. Недавно компания Hewlett-Packard выпустила программный пакет, позволяющий клиентам интегрировать аналитическую СУБД HP Vertica с платформой HP Autonomy IDOL (Intelligent Data Operating Layer), тем самым организации обретают возможность ускорить анализ больших объемов неструктурированных данных.