научная статья по теме КОНЦЕПТУАЛЬНОЕ И ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ИНФОРМАЦИОННЫХ СИСТЕМАХ Математика

Текст научной статьи на тему «КОНЦЕПТУАЛЬНОЕ И ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ИНФОРМАЦИОННЫХ СИСТЕМАХ»

БАЗЫ ДАННЫХ -

УДК 004.92+004.94

КОНЦЕПТУАЛЬНОЕ И ОНТОЛОГИЧЕСКОЕ МОДЕЛИРОВАНИЕ В ИНФОРМАЦИОННЫХ СИСТЕМАХ*

© 2009 г. М. Р. Когаловский*, JI. А. Калиниченко**

* Институт проблем рынка РАН 117418 Москва, Нахимовский проспект, 47 **Институт проблем информатики РАН 119333 Москва, ул. Вавилова, д. 44, корп. 2 E-mail: kogalov@cemi.rssi.ru, leonidk@synth.ipi.ac.ru Поступила в редакцию 08.11.2008 г.

Важным этапом проектирования информационных систем является концептуальное моделирование предметной области, в результате которого синтезируется ее концептуальная модель. В последние годы значительное внимание при разработке информационных систем уделяется также повторному использованию информационных ресурсов и обеспечению доступа к ним на семантическом уровне. Активно развиваются методы и технологии онтологического моделирования. В данной работе обсуждаются задачи и предпосылки развития концептуального моделирования предметной области в технологиях баз данных и информационных систем. Обсуждаются известные подходы к концептуальному моделированию, поддерживающие их языки концептуального моделирования и соответствующие инструментальные средства, рассматриваются различные трактовки роли концептуальной модели предметной области, оценивается состояние инструментальных средств концептуального моделирования, выпускаемых индустрией программного обеспечения. Анализируется соотношение между концептуальными схемами предметной области и онтологи-ями, характеризуются их сходства и различия. Рассматриваются некоторые терминологические проблемы, а также актуальные направления исследований в области концептуального и онтологического моделирования. Приводится обширная библиография.

1. ВВЕДЕНИЕ

Первые системы баз данных появились в начале 1960-х годов, когда вычислительные машины стали оснащаться устройствами внешней памяти прямого доступа. Большинство этих систем замышлялось как инструмент программиста - разработчика приложений. Интерфейсы создаваемых в это время СУБД представляли собой, главным образом, интерфейсы прикладного программирования.

Привлекательность систем баз данных для разработчиков приложений заключалась в том,

* Работа выполнена при финансовой поддержке РГНФ

(проект 06-02-12205-в), РФФИ (проект 06-07-89188-а) и программы ОНИТ РАН "Фундаментальные основы информационных технологий и систем" (проект 1-10).

что они избавляли от необходимости вновь программировать для каждого приложения операции, которые обеспечивают управление данными, хранимыми во внешней памяти. Кроме того, по сравнению с файловыми системами СУБД предоставляли функциональные возможности более высокого уровня для оперирования хранимыми данными, доступ к данным с меньшей гранулярностью и с учетом их "тонкой" структуры. Разработчик приложений избавлялся также от заботы о защите целостности и безопасности данных, об обеспечении параллельного доступа приложений к хранимым данным.

В таких условиях, естественно, доминировал взгляд на базу данных как на один из технологических элементов приложений, а не как на информационную модель предметной области.

На этой ранней стадии развития технологий баз данных проектирование баз данных осуществлялось на основе интуитивных, не выраженных в явном виде представлений разработчика о предметной области. Эти его представления мысленно трансформировались в неформализованное описание предполагаемой структуры базы данных, воплощаемое, как правило, в графическом виде. Это могло быть сделано, например, в форме диаграмм Ч. Бахмана [1] или диаграмм иерархической древовидной структуры, в зависимости от модели данных, которую поддерживала СУБД, выбранная для реализации системы. Построенные диаграммы отображались далее в среду используемой СУБД и материализовались в виде схемы базы данных на языке описания данных этой системы. Такого рода диаграммы можно рассматривать как прообраз современных языков визуального проектирования. Подход к проектированию баз данных, который использовался в этот период, детально рассмотрен в монографии В.В. Бойко и В.М. Савинкова [2].

Таким образом, на этой стадии развития технологий баз данных не использовались какие-либо явно представленные в системе и поддерживаемые системными механизмами модели предметной области, процесс проектирования баз данных реализовывался с помощью интуитивных неформализованных процедур. В таких условиях какие-либо теоретические основы и обоснованные методологии проектирования систем баз данных не могли быть сформированы.

Позднее рождение индустриального производства СУБД, быстрый рост числа их установок и расширение сферы применения технологий баз данных стимулировали активизацию исследований и разработок, направленных на создание научно обоснованной методологии проектирования баз данных. Ключевую роль в этой области играли исследования архитектурных аспектов систем баз данных, проблем моделирования предметной области и моделирования данных.

К середине 1970-х годов в сообществе специалистов в области баз данных созрели представления о том, что в системах баз данных должна в явном виде поддерживаться целостная кон-

цептуальная модель предметной области, воплощаемая в концептуальной схеме базы данных, единая для всех приложений данной системы, независимая от ее "видения" отдельными приложениями и от организации хранения базы данных. Эти идеи впервые были сформулированы в получившем широкую известность промежуточном отчете Рабочей группы по базам данных Комитета по планированию стандартов АК81/ХЗ/8РА11С [3], который был опубликован в 1975 г. и стал источником цитирования для многочисленных публикаций, поток которых продолжается до настоящего времени.

В отчете предлагался подход к архитектуре системы баз данных как к иерархии абстракций данных, обеспечивающей многоуровневое представление базы данных. При этом акцентировалась роль концептуального моделирования предметной области при проектировании базы данных. Подчеркивалась необходимость явного представления в системе результата концептуального моделирования (концептуальной схемы базы данных) и поддержки его механизмами СУБД. Такой подход и введенная в отчете терминология (концептуальная схема, концептуальная модель данных, концептуальная база данных) акцентировали внимание на иной роли систем баз данных. По существу, в отчете подчеркивалась функция системы базы данных не только как технологического компонента приложений, но и как информационной модели предметной области. Под влиянием отчета АК81/ХЗ/8РА11С концептуальное моделирование предметной области стало рассматриваться как необходимый этап проектирования баз данных.

Рождающиеся в этот период САЭЕ-техно-логии, связанные с проектированием баз данных, стали предусматривать инструментальную поддержку этого этапа разработки систем баз данных. Соответствующие функции стали включать в свои программные продукты производители инструментов САЯЕ, предназначенных для поддержки разработок сложных систем программного обеспечения.

Обсуждению различных аспектов концептуального моделирования в технологиях баз данных и информационных систем посвящена обширная литература, публиковавшаяся на про-

тяжении трех последних десятилетий. Представить ее детальный анализ в рамках отдельной статьи вряд ли возможно. Мы ограничимся в данной работе рассмотрением ключевых направлений и результатов, полученных в этой области.

Необходимо отметить, что проблемы концептуального моделирования предметной области имеют отношение не только к технологиям баз данных и информационных систем. Хорошо известно, что эта сфера имеет также прямое отношение к области языков программирования и к инженерии знаний. Такая ее "универсальность" активно обсуждалась еще в начале 1980-х годов [4, 5]. В последнее десятилетие эти проблемы стали актуальными в рамках технологий Всемирной паутины в связи с разработками технологий Семантического Веба. Здесь одним из важных направлений является онтологическое моделирование предметной области. Благодаря усилиям консорциума \УЗС, активно формирующего новую технологическую платформу Всемирной паутины, созданы спецификации формального языка описания онтологий, имеющего статус рекомендации (стандарта) консорциума. Уже существует ряд свободно распространяемых и коммерческих программных средств для создания, поддержки и использования онтологий. Многими исследовательскими коллективами разрабатываются онтологии для различных предметных областей.

В рамках этой деятельности среди специалистов в области баз данных и информационных систем, равно как и среди специалистов по инженерии знаний, пока еще не сложилось единого четкого понимания соотношения между концептуальными схемами баз данных и онтология-ми. Обсуждение связанных с этим вопросов -одна из главных целей данной работы.

Остальная часть работы организована следующим образом. Прежде всего, в разделе 2 рассматриваются принципы многоуровневой архитектуры систем баз данных и трех-схемной технологии, предложенной в отчете АК81/ХЗ/8РА11С, в рамках которой отводится место концептуальной схеме базы данных, обсуждаются основные связанные с нею понятия. В разделе 3 рассматривается концептуальное моделирование предметной области как общая за-

дача для инженерии знаний, технологии программирования, технологий баз данных и информационных систем. Хотя далее в данной работе она рассматривается чаще всего в контексте технологий баз данных, концептуальное моделирование предметной области следует понимать именно как задачу такого более общего характера. Известные подходы к концептуальному моделированию предметной области и основанные на них инструментальные средства рассматриваются в разделе 4. Далее, в разделе 5 обсуждаются различные трактовки роли концептуальной модели предметной области и подходы к ее использованию в системах баз данных, в том числе в системах, основанных на индустриальных технологиях. В разделе 6 анализируется соотношение между концептуальным и онтологическим моделированием предметной области, между концептуальной схемой базы данных и онтологией, обсуждаются их сходства и различия. Раздел 7 посвящен обсуждению некоторых те

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком