научная статья по теме ОСОБЕННОСТИ РЕАЛИЗАЦИИ ИНФОРМАЦИОННОЙ СРЕДЫ ВУЗА ПО ТЕХНОЛОГИИ SEMANTIC WEB Математика

Текст научной статьи на тему «ОСОБЕННОСТИ РЕАЛИЗАЦИИ ИНФОРМАЦИОННОЙ СРЕДЫ ВУЗА ПО ТЕХНОЛОГИИ SEMANTIC WEB»

РАСПРЕДЕЛЕННЫЕ СИСТЕМЫ

УДК 004.75

ОСОБЕННОСТИ РЕАЛИЗАЦИИ ИНФОРМАЦИОННОЙ СРЕДЫ ВУЗА ПО ТЕХНОЛОГИИ SEMANTIC WEB

© 2011 г. Э.А. Гаврилова

Абхазский государственный университет 384900 Республика Абхазия, г. Сухум, ул. Университетская, 1 E-mail: elvira.gavrilova@gmail.com Поступила в редакцию 12.07.2010

В настоящей статье описана реализация информационно-поисковой системы высшего учебного заведения по технологии Semantic Web. Портал спроектирован на основе платформы «Научный институт». Описаны разработанная автором онтология предметной области, архитектура системы, ее ресурсы и сервисы.

1. ВВЕДЕНИЕ

Сравнительный анализ технологий, которыми пользуются при проектировании и реализации информационных систем (ИС) вузов, показал, что в настоящее время ни в России, ни за ее пределами нет существенных разработок информационно-образовательных порталов вузов по технологии Semantic Web. Между тем, известно, что данная технология дает следующие преимущества:

- классификация Web-ресурсов;

- многомерный поиск и навигация;

- поддержание ИС путем агрегирования децентрализованных источников;

- возможность интеграции для автоматизированного обмена данными с другими системами;

- возможность эволюции и расширения структуры информации.

Одним из ключевых понятий в концепции Semantic Web является онтология, представляющая собой развитую форму метаданных и позволяющая описывать модель предметной области в виде ориентированного графа, вершинами которого являются отобранные сущности, а дугами - их свойства и связи между ними. В состав

онтологии также могут входить условные выражения и логические правила, что позволяет системам обеспечивать аргументацию.

В последние годы в рамках программ по развитию электронной информационной образовательной среды в России сделаны значительные шаги в направлении представления и интеграции электронных ресурсов сферы образования. Были созданы сети порталов образовательных учреждений, образовательные порталы, системы дистанционного обучения, электронный документооборот органов управления образованием, система библиотек образовательных учреждений, система архивных фондов образовательных учреждений и органов управления образованием. Разработан набор метаданных для описания образовательных ресурсов RUS_LOM и его представление в формате XML.

Однако современные средства разработки информационных порталов вузов базируются, как правило, на использовании некоторых платформ. Это, в основном, коммерческие продукты, позволяющие наращивать функциональные возможности. Большинство современных порталов вузов проектируется на базе Microsoft SharePoint Portal Server и IBM WebSphere Portal Server. Одним из недостатков этих платформ является неудобный и неточный поиск ресурсов, - в них реализован контекстный (без учета семантики) поиск, причем отсутствует поддержка морфологии русского языка [1].

67

5*

Онтологии служат для адекватной трактовки значения информации о ресурсах и сервисах информационных систем. Поэтому средства поиска на основе онтологий являются более эффективными и точными. Помимо этого, реализация принципов Semantic Web позволяет интегрировать многие независимые информационные системы, формировать масштабную распределённую среду и обеспечить уровень семантической интероперабельности, при которой взаимодействующие системы, поисковые агенты и другие интеллектуальные сервисы «понимают» смысл данных.

На данном этапе, как в России, так и за ее пределами, имеется опыт построения и реализации ИС по принципам Semantic Web. Примером может служить семантический портал SEAL (SEmantic PortAL), как один из первых образовательных порталов, построенный на основе технологий Semantic Web. Основу портала SEAL составляют хранилище знаний и система Onto-broker - основной механизм вывода. Хранилище знаний содержит онтологию и базу знаний, представленные утверждениями фреймовой логики [2].

В качестве основы для построения портала вуза была выбрана платформа «Научный ите-титут», которая является универсальной платформой для создания информационных систем разнообразного назначения с Web-интерфейсом. Эта платформа разрабатывалась в течение нескольких лет в Вычислительном центре РАН как информационно-справочная система, представляющая деятельность научной организации [3]. В отличие от, например, семантического образовательного портала SEAL, который хранит в БД любые RDF-утверждения и, по сути, более приближен к системам баз знаний, проект «Научный институт» относится к классу цифровых библиотек и ориентирован на хранение больших объёмов объектных данных. Система реализует принципы Semantic Web и поэтому позволяет, в частности, интегрировать порталы в единую информационную среду.

Предшествующей версией этой платформы являлась Интегрированная система информационных ресурсов (ИСИР). На основе платформы ИСИР было реализовано множество ИС, среди которых сайт Российской Академии Наук [4], порталы, электронные библиотеки и каталоги институтов РАН, портал «Научное наследие РАН» [5], портал «Россия: ключевые проблемы и

решения» [6], Общероссийский математический портал MathNET [7], сайт Библиотеки по естественным наукам (БЕН РАН) [8], портал Интегральной аналитической геоинформационной системы ГеоМета [9] и др. Многие из них сегодня объединены в Единое Научное Информационное Пространство (ЕНИП) [10].

2. О ПРОЕКТЕ «НАУЧНЫЙ ИНСТИТУТ»

Система «Научный институт» - открытая система, т.к. она реализует открытые спецификации на интерфейсы, службы и форматы данных с целью обеспечить возможность расширения и настройки системы под нужды конкретного института. Средства публикации информации и построения отчётов применяют механизмы XSLT и поддерживают широкий спектр целевых форматов. Система является многоязычной.

2.1. Архитектура системы

Архитектура информационной системы института имеет многоуровневую модульную организацию, что обеспечивает возможность расширения структуры информации и наращивания функциональных возможностей.

Для обеспечения семантической интеропера-бельности данные первично описываются в форме онтологии на языке OWL [11]. В систему заложен аппарат логического вывода утверждений о ресурсах, хранимых в системе.

Для облегчения интеграции с Semantic Web и XML-технологиями данные далее представляются в объектно-ориентированном виде (java-классы). Такой подход к представлению данных унифицирует модель хранимых данных (на платформах Java, .NET), позволяет разработчикам прикладных приложений абстрагироваться от ненужных деталей и сконцентрировать своё внимание собственно на логике приложения [12].

Генератор Java-классов позволяет по OWL-описанию получить исходный код bean-подобных «хранимых классов». В эти классы вручную может быть заложена любая бизнес-логика, заменяющая или дополняющая исходное поведение. При изменении схемы (например, добавлении свойств) будет произведена инкрементная перегенерация классов, - внесённые в код изменения будут сохранены. Таким образом, не ограничивая функциональных возможностей системы, OWL-схема позволяет автоматизировать

большинство операций. Ядро и сервисы ИС па-раметрируются объектной схемой и способны работать с любой нужной предметной областью.

Генератор реляционной БД позволяет получить по заложенному программистом описанию объектно-реляционного отображения (SQL-скрипту) набор таблиц, в которых будут храниться данные. Далее приложения ИС фактически работают с объектной базой данных, надстроенной над реальным хранилищем, используя механизм отображения объектной модели данных в реляционную модель данных хранилища (см. рисунок 1).

Вся функциональность ядра обеспечивается специальными компонентами, называемыми сервисами. Каждый сервис отвечает конкретным функциональным потребностям - хранение объектов, наблюдение за хранимыми объектами, аутентификация пользователей, авторизация доступа и пр. Сервисы ядра используют функциональные возможности друг друга. Реализация сервисов заменяемая, такая организация обеспечивает модульность программной среды [13].

Основные сервисы системы:

- атрибутный (семантический) поиск информации о ресурсах на основе метаданных по различным видам запросов;

- поиск по контексту;

- выдача информации в различных форматах;

- средства ввода и сопровождения информации.

Сервисная архитектура порталов удовлетворяет принципам Semantic Web и решает поставленную задачу интеграции информационных ресурсов [14]. Это означает, что в рамках распределенной среды информационные системы порталов, независимо от моделей хранения данных в каждой конкретной системе, взаимодействуют на следующих уровнях:

- осуществляют обмен данными, т.е. имеют встроенные средства, облегчающие и автоматизирующие импорт и экспорт данных;

- обеспечивают совместный поиск, что подразумевает наличие средств маршрутизации поисковых запросов, обслуживания их результатов, предоставления информации о способах доступа к найденным ресурсам;

- поддерживают единообразный доступ к найденным ресурсам, вне зависимости от конкретных хранилищ, в которых они располагаются, и базовых протоколов доступа, используемых внутри этих хранилищ.

2.2. Ресурсы системы Научный институт

Выделяются и поддерживаются несколько типов взаимосвязанных ресурсов (информационных сущностей):

- ресурс Организация отражает организационно-структурное деление организации, позволяет получить информацию об ее структурных подразделениях и обеспечивает доступ к информационным ресурсам этих подразделений. Система «Научный институт» включает президиум РАН, отделения, научные центры и другие организации РАН;

- ресурс Подразделение систематизирует информацию о подразделениях организаций;

- ресурсу Персона сопоставлены данные о сотрудниках, их научной деятельности;

- ресурс Проект поддерживает сведения о проектах;

- ресурс Публикация представляет данные о публикациях и научной деятельности.

Информация о ресурсах визуально представляется в виде страницы ресурса. Страница ресурса представляет собой обычную ИТМЬ-страницу, содержащую всю имеющуюся информацию о выбранном ресурсе. Каждому типу ресурса соответствует свой тип страницы рес

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком