Данные плюс метаданные




Концепцию IBM Information on Demand можно раскрыть, лишь объяснив переход от данных к информации

11:11 27.02.2008   |   1450 |  Леонид Черняк |

Рубрика Технологии



Брайан Хаан: "Эффективность использования имеющейся информации невелика, а потому повышение ценности информационных активов является одной из важнейших задач" Впечатление от недавнего семинара «Информация по требованию: как повысить ценность информационных активов», проведенного корпорацией IBM, стоит уподобить посещению авангардистского концерта: кто смог постигнуть смысл, тому было чрезвычайно интересно, а непосвященным. Между тем, заявленная тема была и увлекательна, и чрезвычайно актуальна. Семинар оказался первым из мероприятий, специально посвященных проблемам управления контентом.

Учитывая значимость мероприятия, в Москву для представления концепции "Информация по требованию" (Information On Demand, IOD), нового программного продукта IBM Information Server и расширенных возможностей СУБД IBM DB2 приехали штатные "евангелисты" корпорации Брайан Хаан и Кейси Пакстон. Совместно они сделали четыре презентации, сопровождаемые большим количеством практических примеров. И тем не менее, для многих присутствующих, если судить по разговорам в кулуарах, предмет семинара остался не раскрыт. Скорее всего, причина в том, что содержание IOD рассматривалось без достаточного объяснения сущности перехода от данных к информации.

Суть перехода от данных к информации и обостренное внимание к этому вопросу оправдано. Прежде, до появления сервис-ориентированных архитектур (Service-Oriented Architecture, SOA) и до того, как люди стали активно включаться в контур управления бизнесом, различия между данными и информацией усмотреть было невозможно - эти понятия оправданно использовались как синонимы. Источник данных и потребитель работали в жесткой связке, они были объединены одним контекстом. Сейчас же условия изменились, Модули в среде SOA являются слабосвязанными, они автономны, а потому кроме непосредственных данных им требуются вспомогательные данные, так или иначе описывающие основные - так называемые "метаданные", то есть данные о данных. Предельно упрощая определение информации, можно сказать: «Информация – это данные плюс метаданные». Язык XML приобрел свою популярность именно потому, что на нем можно представлять не просто данные, а информацию, сочетая данные с метаданными. Если принять это определение и предложенный подход к информации, то остальное окажется удивительно простым.

Именно поэтому отдельным пунктом на семинаре рассматривалась новая версия DB2 Pure XML. Если не сравнивать модель данных XML с реляционной моделью, а сразу согласиться с тем, что DB2 Pure XML - это не база данных, а еще и база информации, причем хранимой непосредственно в XML, тогда многое становится яснее. Например, то, зачем нужен язык запросов XQuery, чем он отличается от SQL, почему хранение информации в чистом виде (как в DB2 Pure XML) удобнее, и почему с использованием XQuery повышается эффективность программистов. То же самое можно сказать и о сервере IBM Information Server. Он играет примерно ту же роль по отношению к данным, что серверы приложений по отношению к приложениям, являясь консолидированной платформой, собирающей в себе весь необходимый инструментарий для работы как с данными, так и с информацией. Его составляющие вполне традиционны. Один из компонентов - Federation Server - вполне можно сравнить с программным обеспечением промежуточного слоя, этот сервер обеспечивает универсальный доступ к различным СУБД. Напротив, WebSphere Information Analyzer, как следует из названия, ориентирован на выделение содержания из данных. Примерно тем же целям служит WebSphere Business Glossary, а инструментарий IBM Metadata Workbench служит для непосредственной работы с метаданными.

Прошедший семинар стал одной из многочисленных просветительных акций, проводимых IBM по всему миру в рамках программы developerWorks Live! Briefings. Будем надеяться, что этим представление идей IOD не ограничится, и нас ожидает продолжение.


Теги: