Активная аналитика




Предлагаемые Teradata активные хранилища данных позволяют снабдить данными всех участников процесса управления предприятием

10:33 26.04.2010   |   1478 |  Леонид Черняк |  «Открытые системы»

Рубрика Предприятие



Скотт Ноу: " Oracle Exadata 2 -- это машина баз данных, а Teradata Extreme Performance Server 4555 -- машина хранилищ данных"Современные системы управления должны иметь в своем составе технологии, обеспечивающие анализ тактической и стратегической информации. Вследствие этого в последние годы резко вырос интерес к технологиям бизнес-аналитики (Business Intelligence, BI) и хранилищам данных (Data Warehousing, DW) и заметно увеличилось число компаний, проявляющих активность в этом сегменте рынка. Теперь, помимо Teradata, которую можно назвать ветераном рынка хранилищ данных, на нем работают и именитые поставщики корпоративных систем наподобие IBM, Oracle, Microsoft, SAS, Sybase, и молодые игроки, такие как Netezza и Greenplum, а также интернет-компании во главе с Google и Yahoo.

Однако расширение списка участников рынка, по данным аналитиков, не повлияло на лидирующую позицию Teradata. Подтвердила это и прошедшая в середине апреля в Берлине ежегодная европейская конференция компании.

Новый термин и консервативность клиентов

Для обозначения роли и места хранилищ данных в нынешних условиях в Teradata используют термин "активные хранилища данных" (Active Data Warehouse, ADW), понимая под ним такие реализации хранилищ, которые, поддерживая работу в реальном времени или близком к нему режиме, способны обрабатывать потоки стимулированных событиями (event-driven) запросов, поступающих от пользователей или из приложений. Преимущество ADW по сравнению с классическими средствами остоит в том, что этот вид технологий обеспечивает данными не только аналитиков и составителей отчетов, но и сотрудников на "передней линий", осуществляющих оперативное управление. Активные хранилища позволяют создавать бизнес-аналитику нового поколения, которую называют "вездесущим BI" (Pervasive BI), "операционным BI" (Operational BI) или "BI реального времени" (Real-time BI). В Teradata используют и собственный термин - Active Enterprise Intelligence.

Оценивая продукты и решения Teradata, следует учитывать, что компания с момента своего основания ориентируется на узкую прослойку клиентов, состоящую из 3 тыс. крупнейших компаний мира, и учитывает особенности именно их спроса. Например, для крупных компаний критична масштабируемость предлагаемых решений и менее важна стоимость специализированного оборудования и программ. На производственную политику Teradata влияет и то, что ее потребители склонны к технологическому консерватизму и не увлекаются модными тенденциями, такими как "облака" или SaaS.

Исходя из этого Teradata в первую очередь совершенствует свои классические решения. Самое существенное из актуального сейчас, по словам технического директора компании Стивена Бробста, связано не с отдельными технологиями, а с глобальной организацией процедур работы с данными. Он подчеркнул в своем выступлении, что намечается общий отраслевой сдвиг от проектного или продуктно-ориентированного подхода к программному. Отмеченный сдвиг стимулирован явлением, которое Бробст назвал "кризисом BI". У данного кризиса несколько причин, в том числе: разрастающийся объем данных, увеличение числа людей, вовлеченных в анализ, необходимость более оперативно принимать решения. Чтобы преодолеть перечисленные сложности и использовать корпоративную информацию для получения конкурентного преимущества, необходимы объединенные усилия представителей трех служб предприятия -- бизнеса, аналитиков и ИТ. Трехсторонними усилиями должны быть созданы "центры компетенции BI", в задачу которых входит разработка трех-пятилетних планов по стратегическому управлению данными. Бробст полагает, что такого рода управление является задачей бизнес-подразделений, а не администраторов баз данных. И суть всех разговоров о возрастающей роли информации сводится к тому, что предприятия постепенно выстраивают настоящие системы управления в лучших кибернетических традициях и нуждаются в подсистемах сбора и анализа данных в цепи обратной связи.

Техническое совершенствование

Из технических новинок, показанных в Берлине, наибольшее внимание привлекло решение Extreme Performance Server 4555, его производительность достаточна для систем ADW. Непосредственным конкурентом этой "машины хранилищ данных" является "машина баз данных" Oracle Exadata 2. Между ними много общего, но следует принять во внимание, что первая специализирована именно на хранилищах.

Общим для той и другой является то, что высокая производительность обеспечивается широким использованием твердотельных накопителей, однако в силу разного предназначения эти накопители используются по-разному. Как отмечают в Teradata, во входящем в состав Exadata 2 массиве Storage F5100 Flash Array твердотельные накопители служат для создания еще одного уровня кэша, они в большей степени ориентированы на повышение скорости выполняемых онлайновых транзакций, чем на решение задач, специфичных для хранилищ данных. Скотт Ноу, занимающий пост директора по разработкам и руководителя Teradata Labs, заявил, что использование технологий SSD в Exadata 2 не обеспечивает радикального ускорения работы собственно хранилища, поскольку служит ускорению отдельных процессов, а согласованием данных и другими работами, связанными с СУБД, по-прежнему управляет Real Application Clusters. Он признал, что Exadata 2 хорошо масштабируется, но имеет заметные ограничения по скорости выполнения запросов при решении задач по добыче данных (data mining). И, напротив, в решениях, реализованных в Teradata Extreme Performance Appliance, высокая скорость работы твердотельных накопителей дает возможность получать аналитические данные мгновенно и не задерживать принятие решений. "А это, - заявил Ноу, - позволяет распространить преимущества хранилищ данных на такие приложения, как электронная коммерция, производство и логистика, туристическая индустрия и транспортерные задачи, задачи, связанные с телекоммуникациями".

В облачном направлении Teradata предлагает набор продуктов и сервисов Agile Analytics Cloud, позволяющий создавать виртуализованные витрины данных в частных облаках, расположенных внутри охраняемого периметра предприятий. Для разработки экспериментальных приложений Teradata предлагает свободно распространяемую версию программного обеспечения Teradata Express для облака Amazon Elastic Compute Cloud с использованием VMware Player. По словам Бробста, компания пошла на этот шаг, поскольку хотела упростить процедуры разработки аналитических приложений на платформе Teradata и сделать их доступными для небольших компаний, не имеющих средств на закупку специализированного оборудования. 


Теги: