EMC реализовала в платформе Greenplum анализ неструктурированных данных большого объема

10:45 23.09.2011 |   1286



В подразделении EMC Greenplum  создан новый программно-аппаратный комплекс Modular Data Computing Appliance, который предоставляет  возможность работать одновременно со структурированными и неструктурированными данными большого объема, используя как реляционные методы обработки, реализованные в параллельной СУБД Greenplum, так и функции платформы с открытым кодом Apache Hadoop.  Новые устройства Modular DCA будут иметь в своем составе высокопроизводительные модули,  в которых работает пакет  In-Memory Analytics компании  SAS Institute, выполняющий параллельную обработку данных в оперативной памяти. Использование программ SAS позволяет размещать как структурированные, так и неструктурированные данные одновременно на нескольких узлах кластера. Именно возможность параллельной обработки в компании считают основным преимуществом комплексов Greenplum. Модули сейчас проходят тестирование, а в продажу должны поступить к концу года. EMC представила также тестовый кластер Greenplum Analytics Workbench, состоящий из более чем 1000 узлов и предназначенный для проведения интеграционного тестирования программ Apache Hadoop.


Теги: Программное обеспечение