научная статья по теме МОДЕЛИ ПРЕДСТАВЛЕНИЯ КОНЦЕПТУАЛЬНОЙ ИНФОРМАЦИИ В ОРГАНИЗАЦИИ ЭЛЕКТРОННЫХ АРХИВОВ Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «МОДЕЛИ ПРЕДСТАВЛЕНИЯ КОНЦЕПТУАЛЬНОЙ ИНФОРМАЦИИ В ОРГАНИЗАЦИИ ЭЛЕКТРОННЫХ АРХИВОВ»

Естественные и технические науки, № 6, 2013

Максимов А.И., кандидат технических наук, доцент Российского государственного гуманитарного университета, старший научный сотрудник Научно-исследовательского института скорой помощи имени Н.В. Скли-фосовского

Тимушев А.Г., доктор технических наук, профессор

МОДЕЛИ ПРЕДСТАВЛЕНИЯ КОНЦЕПТУАЛЬНОЙ ИНФОРМАЦИИ В ОРГАНИЗАЦИИ ЭЛЕКТРОННЫХ АРХИВОВ

В работе рассматриваются онтологии как средства концептуального моделирования в связи с вопросами организации электронных архивов.

Ключевые слова: онтология, электронные архивы.

CONCEPTUAL INFORMATION REPRESENTATION MODELS IN THE ORGANIZATION OF ELECTRONIC ARCHIVES

In this article were the ontologies as a means of conceptual modeling in connection with the issues of organization of electronic archives.

Keywords: ontology, electronic archives.

Эффективность организации электронных архивов в значительной степени определяется эффективностью доступа к архивным документам, эффективностью функций информационного поиска. Основу эффективной реализации функций информационного поиска составляют средства концептуализации предметной области, модели представления концептуальной информации. Одним из наиболее перспективных средств концептуального моделирования являются онтологии.

Онтологии как средства концептуального моделирования можно укрупнено разделить на два класса - онтологии предметной области (прикладные онтологии) и онтологии языка (лингвистические онтологии). Спектр существующих предметных онтологий достаточно обширен. В качестве примера онтологии данного класса можно назвать CIDOC CRM - онтологию в области документации в сфере культурного наследия. В числе наиболее известных лингвистических онтологий следует указать онтологии семейства WordNet. К менее известным, но достаточно интересным и перспективным информационным ресурсам данного класса, относится компьютерный семантический словарь В. А. Тузова [1]. Строение семантического словаря включает три уровня организации: фундаментальный, включающий 1500 иерархических классов и набора базисных функций; вариативный, включающий 23000 классов, тесно связанных с фундаментальным уровнем, являющихся вариациями фундаментальных понятий и описывающихся на основе понятий фундаментального уровня; описательный, в рамках которого слова и понятия, имеющие смысл, выходящий за рамки фундаментального и вариативного, описываются на основе понятий первого и второго уровней [1]. Первый и второй уровень семантического словаря можно рассматривать как лингвистическую онтологию. Эффективная организация электронного архива, эффективные механизмы управления архивной информацией, включающие функции поиска актуальной информации, должны иметь в основе концептуально-полную систему знаний, представленную согласованной совокупностью лингвистических и предметных онтологий. При этом лингвистическая онтология играет роль связующего звена между множеством текстовых документов электронного архива и теми или иными форматами представления знаний в предметных он-тологиях. Согласованное функционирование двух видов онтологий может осуществляться на

Естественные и технические науки, № 6, 2013

основе некоторого набора эвристик, составляющих ядро экспертной системы, в правилах которой учтены основные языковые и предметные аспекты архивной информации. Организация рассматриваемого лингвистического ресурса позволяет реализовать составление подобных правил с помощью простых формализованных процедур. Суть правил, посредством которых осуществляется согласование лингвистической и предметной онтологий заключается в реализации представления любого понятия предметной онтологии конструкциями онтологии языка, базовыми элементами которой являются выражения семантического словаря. Таким образом, задачу согласования предметной и лингвистической онтологий можно свести к задаче идентификации понятий, один из способов решения которой для рассматриваемого варианта лингвистической онтологии представлен в [2].

ЛИТЕРАТУРА

1. Тузов В.А. Компьютерная семантика русского языка. - СПб.: Изд-во С. -Петерб. ун-та, 2004.

2. Максимов А.И. Модели и методы компьютерной семантики в задачах автоматической обработки текстов. - Информационные ресурсы России, № 5, 2013.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком