Oracle возвращает Большие Данные администраторам баз данных

Oracle Data Integrator for Big Data позволяет специалистам, не имеющим навыков работы с технологиями Больших Данных, мгновенно получить присущую Hadoop эффективность

14:30 13.04.2015 | 3405 | Джоаб Джексон | Служба новостей IDG, Нью-Йорк

Рубрика Технологии

Сегодня, когда многие предприятия осознали ценность анализа Больших Данных, самое время привлечь к этому процессу администраторов баз данных и хранилищ данных.

Корпорация Oracle представила расширение своего связующего программного обеспечения Oracle Data Integrator, которое дает администраторам баз данных и специалистам по хранилищам данных возможность рассматривать репозитории Больших Данных как еще один источник данных наряду со структурированными базами и хранилищами данных.

«Oracle Data Integrator for Big Data позволяет разработчику, не имеющему навыков работы с технологиями Hadoop, получить присущую Hadoop эффективность, – пояснил вице-президент Oracle по управлению продуктами Джефф Поллок. – Платформы Больших Данных, такие как Hadoop и Spark, в которых используются языки Java и Python, изначально больше ориентированы на программистов, чем на администраторов баз данных. А между тем в традиционном анализе корпоративных данных основная роль отводится администраторам и специалистам по инструментам интеграции данных наподобие ETL (Extract, Transform, Load — 'извлечение, преобразование, загрузка'), использующим SQL и визуальные интерфейсы».

Data Integrator for Big Data расширяет возможности Oracle ODI в части управления источниками Больших Данных.

ODI обеспечивает организациям возможность извлекать данные, представленные в различных форматах и в разных источниках, в частности в реляционных СУБД IBM и Microsoft или в хранилищах данных Teradata. С этой точки зрения подключение репозиториев Больших Данных к ODI представляется вполне естественным.

Благодаря новому расширению компаниям не придется направлять администраторов баз данных на переобучение, чтобы овладеть инструментами вроде Hive for Hadoop. Им предлагается уже знакомый набор инструментов. Администратор получает привычную концепцию сущностей и отношений, а также средства отображения потоков данных 4GL. «Data Integrator for Big Data автоматически генерирует необходимый для выполнения поставленных задач код на нужном языке», – пояснил Поллок.

Новый инструментарий может работать в любой среде Hadoop или Spark, не требуя установки каких-либо дополнительных средств на узлах данных. Опираясь на мощь распределенных вычислительных сред, Data Integrator for Big Data обращается к узлам, где хранятся данные, и выполняет там все требуемые операции.

Системы сбора данных в реальном времени, такие как Oracle GoldenGate 12c, могут перемещать транзакционные данные в кластер Hadoop, где будет проходить подготовка к последующему анализу их с помощью ODI.

В своих попытках объединить новые инструменты Больших Данных с традиционным программным обеспечением анализа данных Oracle не одинока. Недавно компания Hewlett-Packard выпустила программный пакет, позволяющий клиентам интегрировать аналитическую СУБД HP Vertica с платформой HP Autonomy IDOL (Intelligent Data Operating Layer), тем самым организации обретают возможность ускорить анализ больших объемов неструктурированных данных.

Теги:

Программное обеспечение

Большие данные

Oracle

Hadoop

Apache Spark

На ту же тему:

Talend: открытый код — новая норма для систем обработки Больших Данных

Благодаря приверженности идеям Open Source, экосистема Hadoop и Apache Spark, важнейших на сегодня технологий в мире Больших Данных, развивается быстрее, чем если бы технология принадлежала только одному разработчику.

Oracle выпускает средства графового и пространственного анализа для Hadoop

Компания ранее уже предлагала аналогичные инструменты для своей собственной СУБД, а вариант для Hadoop позволит уменьшить потребности в переносе информации и анализировать более разнообразные срезы данных.

СУБД для эпохи геопространственных данных

Системы вроде Hadoop и Spark справляются с управлением огромными объемами информации, но инструментов для ее разбора и анализа пока не хватает. Компания SpaceCurve, стартап всего с двухлетней историей, выпустила новую СУБД, обеспечивающую возможность оперативного анализа географических данных по мере их поступления.

BIG DATA 2016: Большие Данные для практических задач

В Oracle считают, что использование технологий Больших Данных на крупных российских предприятиях входит в стадию зрелости.

Опубликован стандарт на состав ядра Hadoop — ODPi Runtime Specification

ODPi была учреждена в прошлом году в целях сдерживания фрагментации рынка Hadoop. В рамках инициативы планировалось подготовить стандарт, включив в него проверенные технологии из числа проектов Apache Software Foundation.

SAP HANA Vora прокладывает мост между традиционными хранилищами данных и Hadoop

Особенность Vora — возможность использования традиционных методов оперативной аналитической обработки и языков программирования для анализа всех доступных на предприятии данных.