научная статья по теме СОВМЕСТНОЕ ИСПОЛЬЗОВАНИЕ ОНТОЛОГИЧЕСКОЙ И ОБЪЕКТНОЙ МОДЕЛЕЙ ПРИ ПРОЕКТИРОВАНИИ И РЕАЛИЗАЦИИ ИНФОРМАЦИОННЫХ WEB-СИСТЕМ Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «СОВМЕСТНОЕ ИСПОЛЬЗОВАНИЕ ОНТОЛОГИЧЕСКОЙ И ОБЪЕКТНОЙ МОДЕЛЕЙ ПРИ ПРОЕКТИРОВАНИИ И РЕАЛИЗАЦИИ ИНФОРМАЦИОННЫХ WEB-СИСТЕМ»

Грегер С.Э., доцент Нижнетагильского технологического института Уральского федерального университета им. первого Президента России Б.Н. Ельцина

Поршнев С.В., доктор технических наук, профессор, зав. кафедрой Уральского федерального университета им. первого Президента России Б.Н. Ельцина

СОВМЕСТНОЕ ИСПОЛЬЗОВАНИЕ ОНТОЛОГИЧЕСКОЙ И ОБЪЕКТНОЙ МОДЕЛЕЙ ПРИ ПРОЕКТИРОВАНИИ И РЕАЛИЗАЦИИ ИНФОРМАЦИОННЫХ WEB-СИСТЕМ

В статье предложен подход проектирования информационных систем основанный на совместном использовании онтологических и объектных моделей, при этом общая онтологическая модель информационной системы преобразуется в объектно-ориентированной модель, хранимую в объектной базе данных и применяемую в качестве промежуточной модели. Данный подход позволяет трансформировать общую онтологическую модель в модели, специфичные для выбранного способа хранения знаний.

Ключевые слова: онтология, информационная система, объектная база данных.

SHARING THE ONTOLOGICAL MODEL AND OBJECT MODEL FOR THE DESIGN AND IMPLEMENTATION OF WEB INFORMATION SYSTEMS

In the article proposes an approach for designing information systems based on shared ontology and object models, with an overall ontological model of information system is transformed into an object-oriented model that is stored in the object database and is used as an intermediate model. This approach allows us to transform a common ontological model to model specific to the chosen method of storing knowledge.

Keywords: ontology, information system, an object database.

Введение

Одним из главных факторов, влияющих на состояние и развитие современного общества, являются информационные технологии, в особенности, «Всемирная паутина» - World Wide Web (WWW), получившая широчайшее распространение и ставшая основным источником оперативной и достоверной информации для сотен миллионов людей. В условиях непрерывного роста объемов информационных потоков оказываются востребованными крупные информационные системы (ИС) - корпоративные порталы, электронные библиотеки и т. п. [1, 2]. При создании подобных ИС одной из актуальных задач оказывается задача публикации информации, хранящейся в ИС, и организации доступа к ней. Как показывает опыт эксплуатации подобных систем, при больших объемах накопленной в них информации управление и обеспечение доступа к ней представляют существенные трудности. В этих условиях процесс разработки ИС требует больших трудозатрат.

В настоящее время одной из популярных технологий разработки обсуждаемых ИС является технология, основанная на использовании моделей предметной области. В соответствие с данной технологией в ходе разработки WWW ИС создается ряд моделей, учитывающих отношения в предметной области, спецификацию функциональных требований и алгоритмов их реализаций, с последующим их преобразованием в конкретную структуру ИС и ее интерфейса пользователя. Отметим, что одним из существенных недостатков такого подхода является необходимость повторной разработки WWW ИС (например, сайта) при модификации используемой модели предметной области, изменений требований к функциональности или

добавлении новой предметной области. В этой ситуации понятно, что для повышения эффективности разработки и сопровождения WWW ИС разработчикам требуются инструменты для автоматизированного создания и поддержания чёткой информационной и навигационной структуры WWW ИС.

В статье предложен подход построения требующегося для разработчиков WWW ИС инструментария, основанный на совместном использовании онтологических и объектных моделей.

Технологии создания WWW ИС, основанные на онтологических моделях

Один из подходов к построению обсуждаемого инструментария разработчика WWW ИС основан на использовании семантических моделей, построенных на базе онтологий [3]. Примером WWW ИС, разработанных с использованием подобного подхода, является семантический портал. Отметим, что подходы, предложенные для разработки семантических порталов [4], базируются на создании онтологии предметной области, использовании логической машины запросов к онтологии и автоматической генерации интерфейса пользователя на основе результатов запросов. При этом онтология, построенная для определенной предметной области, может быть основой для целого ряда WWW ИС, что позволяет в несколько раз сократить количество информации и, в известной мере, избежать ее дублирования. Вводя формальные описания понятий предметной области в виде классов объектов и отношений между ними, онтология WWW ИС задает структуры для представления реальных объектов и связей между ними. При этом данные в ИС представляются множеством разнотипных информационных объектов и связей между ними, которые в совокупности образуют информационное содержание WWW ИС. Обычно, описание онтологической модели производится на одном из XML-подобных языков, традиционно используемых для описания онтологий, таких как RDFS[5] и OWL [6]. При этом в качестве инструмента реализации обычно выбирают средства, предоставляемые платформой Java.

Отметим, что организация систематизированного хранения информационных объектов и структуры, определяющей связи между ними, требует разработки методов проектирования схем данных и определения релевантных этим задачам способов хранения онтологий знаний и данных. Сегодня известны два основных способа хранения онтологий.

1. Хранение онтологий в файловой системе, соответствующей OWL-формату. (Его основной недостаток заключается в трудностях, возникающих при расширении и масштабировании онтологий).

2. Использование для хранения онтологий различного вида БД. (К его основным недостаткам следует отнести множество существующих технологических решений с различными, зачастую несовместимыми моделями данных и способами физической реализации хранилищ данных.)

В настоящее время большинство коммерческих систем, использующих базы знаний, применяют реляционное представление данных, используя представления базы знаний с в нотации нотаций языка RDF. Для представления знаний с использованием языка OWL более естественным является использование объектной модели, характерной для OWL.

Онтология может быть как базой знаний, предоставляющей структуру знаний некоторой предметной области так и хранилищем ее актуальных объектов [7]. Изменения структуры знаний, связанные с изменениями в предметной области, усложняют процесс проектирования реляционных БД, которые должны быть устойчивыми к возможным изменениям структуры данных.

Проблемы совместного использования онтологических и объектных моделей

Необходимо отметить, что существует определенное противоречие между объектной моделью, используемой для представления общей концептуальной модели (онтологии знаний)

и объектной моделью онтологии данных. Для хранения онтологии знаний необходимо иметь унифицированные формальные описания метаданных. Это, в свою очередь, с точки зрения унификации представления знаний определяет необходимость оптимизации объектной модели, используемой для реализации подобной схемы хранения данных. (Отметим, что подобная унификация реализована в известных системах хранения онтологий на основе использования триплетов - triples, в которых унифицированной информационной единицей выбран триплет, а основным формализмом является язык RDF [8]). С другой стороны, объектная модель прикладного приложения, как правило, «заточена» под конкретную предметную область, под используемые алгоритмы обработки и связи с внешними системами обработки. В этих условиях использование для хранения одной схемы данных приводит к большому числу преобразований в процессе объектно-реляционного отображения и, соответственно, усложнения каждого из соответствующих слоев обработки информации (сервера приложений).

Основная причина, ограничивающая применение объектной базы, является высокая сложность адекватного отображения семантической модели в ее объектно-ориентированное представление. Отметим, что известны ограничения на использование объектных баз данных для хранения онтологий, выделенные другими авторами. Так, отмечается [7], что широкому использованию объектных БД для хранения онтологий препятствует известные отличия их математических моделей, а также несовершенство языков запросов к объектным БД. Это обусловлено тем, что, как семантическое моделирование, так и объектно-ориентированного моделирование используют для описания моделей хотя и близкие, но все же различные концептуальные схемы [8]. Например, в то время как в моделях объектно-ориентированные классы считаются типами, в OWL классы рассматривается как множества, отвечающие некоторым ограничениям [9]. С другой стороны, известно [10], что объектно-ориентированные БД позволяют эффективно хранить объекты, представляющие различные концепты предметной области, и управлять ими. Однако, только немногие современные программные приложения позволяют использовать эти возможности.

Концепция совместного использования онтологических и объектных моделей

С нашей точки зрения, несмотря на существующие противоречия, представляется перспективным использование объектно-ориентированной модели в качестве промежуточной модели, позволяющей трансформировать общую онтологическую модель в модели, специфичные для выбранного способа хранения знаний.

Представление онтологии с помощью объектно-ориентированной модели означает описание онтологии методами объектно-ориентированного моделирования и организацию хранения онтологии в виде набора объектов и управление онтологией, реализованное как управление объектно-ориентированной моделью. Действительно, между объектами объектно-ориентированной модели, также как и в онтологии, существуют различные связи. При этом отличие между онтологиями и объектно-ориентированными моделями обусловлены способами определения значений онтологических свойств. В объектно-ориентированном подходе присваивается значение соответствующему атрибуту объекта, в то время как для онтологии требуется знать всю схему взаимоотношений объектов. Однако, в действительности, такое знание необходимо только в некоторых случаях, например, при использовании машины логического вывода или при комм

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком