научная статья по теме ПРИНЦИПЫ РАЗРАБОТКИ ИНТЕРАКТИВНОЙ СИСТЕМЫ СМЫСЛОВОЙ ОБРАБОТКИ НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ ПО ХИМИЧЕСКОЙ ТЕХНОЛОГИИ РЕАКТИВОВ И ОСОБО ЧИСТЫХ ВЕЩЕСТВ Химическая технология. Химическая промышленность

Текст научной статьи на тему «ПРИНЦИПЫ РАЗРАБОТКИ ИНТЕРАКТИВНОЙ СИСТЕМЫ СМЫСЛОВОЙ ОБРАБОТКИ НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ ПО ХИМИЧЕСКОЙ ТЕХНОЛОГИИ РЕАКТИВОВ И ОСОБО ЧИСТЫХ ВЕЩЕСТВ»

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ХИМИЧЕСКОЙ ТЕХНОЛОГИИ, 2015, том 49, № 4, с. 442-446

УДК 661.1:004.89

ПРИНЦИПЫ РАЗРАБОТКИ ИНТЕРАКТИВНОЙ СИСТЕМЫ СМЫСЛОВОЙ ОБРАБОТКИ НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ ПО ХИМИЧЕСКОЙ ТЕХНОЛОГИИ РЕАКТИВОВ И ОСОБО ЧИСТЫХ ВЕЩЕСТВ © 2015 г. В. П. Мешалкин, Е. А. Панина, Р. С. Быков

Российский химико-технологический университет имени Д.И. Менделеева, Москва

vpmeshalkin@gmail.com Поступила в редакцию 27.10.2014 г.

Изложены принципы разработки и функционирования диалоговой системы смысловой обработки, т.е. понимания смысла, научно-технических текстов по химической технологии реактивов и особо чистых веществ. Понимание смысла научно-технических текстов реализуется благодаря разработке специального интеллектуального обеспечения диалоговой системы, которое включает семантико-топологические модели представления знаний, а также специальные языки автоматизированной генерации смысла, т.е. понимания основных терминов, понятий и фраз ограниченного естественного языка проблемной области в виде языка внутреннего представления знаний и языка управляющих директив.

Ключевые слова: интеллектуальное обеспечение; модели представления знаний; ограниченный естественный язык; предметная область; система общения; система смысловой обработки текста; язык внутреннего представления знаний; язык управляющих директив; фрейм; семиотическая система; реактивы и особо чистые вещества; химико-технологическая система; малотоннажные химические продукты; химико-технологический процесс.

БО1: 10.7868/80040357115040107

ВВЕДЕНИЕ

При автоматизированном поиске оптимальных смысловых, или инженерно-технологических, решений неформализованных задач синтеза ресурсо-энергосберегающих совмещенных многоассортиментных химико- технологических систем (ХТС) производства реактивов и особо чистых веществ, а также при автоматизированном составлении текстов технико-экономического обоснования и бизнес-планов производства инновационных малотоннажных химических продуктов требуется переработка, анализ и осмысление огромного объема декларативных и процедурных знаний, представляющих собой смысловую (семантическую) информации о существующих химических способах и технологиях производства химических продуктов [1—4]. Источником такой информации на ограниченном естественном (русском) языке (ОЕЯ) являются научно-технические тексты в виде научных статей и технологической документации (технологических регламентов, производственных или лабораторных методик получения продукта) [1, 5, 6].

Автоматизированную обработку, анализ, понимание и генерацию смыслов научно-технических текстов осуществляют диалоговые интеллектуальные системы общения на ограниченном

естественном языке, или системы смысловой обработки текстов (СОЕЯ), разрабатываемые на основе использования теории искусственного интеллекта [1, 5—7].

Указанные СОЕЯ осуществляют автоматизировано в режиме диалога с пользователем (химиком-технологом), так называемую смысловую обработку текста, т.е. анализ и генерацию смысла выбранного текста на основе использования специальных семантико-топологических моделей фраз ОЕЯ [1—4, 8—10]. Семантико-топологиче-ские модели СОЕЯ представляют собой структурно-классифицированное детальное описание на ОЕЯ [1, 2, 7] химического способа получения продукта, всех параметров технологического режима, а также вспомогательных технологических операций, инженерно-аппаратурного оформления и технологических связей между аппаратами некоторой ХТС [8, 9].

Необходимо отметить, что процедуры функционирования СОЕЯ для понимания смысла научных, технических и инженерно-технологических текстов по химической технологии в общем случае превосходят по сложности процедуры, выполняемые системами общения на ОЕЯ других классов, таких как системы общения с базами данных, экспертными системами и вопросно-от-

ветными системами, так как в рассматриваемых СОЕЯ описываются динамически сложные, слабо структурированные и размытые понятия процессов, явлений и объектов, множество которых достаточно велико на СОЕЯ, ограниченном семантически лишь разделом науки или химической технологии, т.е. предметной областью [3, 4, 7].

Структурно-когнитивными особенностями информационного обеспечения всех подобных интеллектуальных интерактивных систем обработки текстов являются обязательное наличие знаний о модели собственно языка — в виде модели языка внутреннего представления знаний и знаний о предмете (проблеме) понимания и общения из определенной предметной области.

ОПИСАНИЕ АРХИТЕКТУРЫ СОЕЯ

Обобщенная архитектура предлагаемой авторами СОЕЯ должна содержать:

знания о предметной области — химических технологиях производства тоннажных химических продуктов, без которых невозможен диалог с пользователем [1—10];

знания о языке, на котором модели текстов предметной области представлены в памяти компьютера;

метазнания ОЕЯ, необходимые для управления процедурой анализа смысла текста предметной области в диалоговом режиме [1, 10, 11].

Все упомянутые виды знаний входят в интеллектуальное обеспечение (ИО), в отличие от традиционного программно-математического обеспечения СОЕЯ.

В соответствии с вышеизложенным, принципы построения интеллектуально обеспечения СОЕЯ должны описывать общие методы представления, организации и пополнения знаний СОЕЯ, а также доступ к моделям представления этих знаний; методы организации управления процедурой осуществления "осмысленного", или "интеллектуального" диалога с пользователем при анализе смысла, т.е. понимании конкретного текста предметной области.

Авторами сформулированы пять основных принципов разработки ИО для создаваемых СОЕЯ: универсальность моделей представления знаний предметной области; открытость, или развитие и наращивание, ИО, т.е. возможность пополнения новыми знаниями и новыми функциями СОЕЯ; независимость интеллектуального обеспечения СОЕЯ от традиционного программно-математического обеспечения (ПМО) гибридных экспертных систем [1, 8, 10, 11]; блочность (модульность) построения ИО; максимальная "интеллектуальная" способность СОЕЯ, т.е. способность самих систем к логическому выводу на основе текущих знаний и конкретной ситуации, описываемой в

анализируемом научно-техническом тексте предметной области.

Изложим сущность методики формализации и практической программной реализации в СОЕЯ каждого из указанных выше принципов. Первый принцип естественен, так как в СОЕЯ должна быть модель "устройства" ОЕЯ для отображения любых терминов и понятий, т.е. сущностей (ситуаций, явлений, объектов, процессов), встречающихся в научно-технологических текстах.

Второй принцип также необходим для того, чтобы СОЕЯ система могла пополняться новыми знаниями, полученными из текстов, а также пополняться новыми функциями и операциями.

Со вторым принципом неразрывно связан третий принцип, который означает, что никакие знания ни о ОЕЯ, ни о предметной области, не должны входить в ПМО, тогда любые изменения в интеллектуальное обеспечение, не повлекут за собой необходимость изменять ПМО, а это, в свою очередь, упростит процесс накопления знаний и развития СОЕЯ

Отсюда вытекает четвертый принцип, т.е. необходимость блочного построения ИО, что позволяет, вводить новые блоки — модули знаний в ИО, не меняя при этом уже существующие как ИО, так и ПМО

Пятый принцип предполагает ориентацию практического применения СОЕЯ на непрофессионального в области искусственного интеллекта и программирования пользователя — технолога, не знакомого с устройством СОЕЯ, и, по возможности, на максимальную простоту работы пользователя с компьютером.

Первый принцип универсальности представления знаний в СОЕЯ авторами реализован в результате разработки модели языка текстов — языка внутреннего представления знаний (ЯВтП) системы смысловой обработки текстов [1, 10]. ЯВтП — это семиотическая (знаковая) система, в которой каждый знак рассматривается в трех аспектах: синтаксическом, семантическом и прагматическом [1, 5, 10]. Формализованная модель ЯВтП представляет собой кортеж:

М = (Т,Р,И,К),

где Т — множество знаков (смысловых единиц) ЯВтП; Р — множество грамматических правил, позволяющих строить из знаков множества Т синтаксически правильных выражений, а также расширять множество Т; и — множество базовых терминов и понятий в ПО, слова и сочетания из множества Т; К — множество знаний в ПО, интерпретирующее смысл множеств и и Т.

В качестве знаков множества Т нами выбраны следующие базовые слова ОЕЯ из ПО — технологии производства химических реактивов и особо чистых веществ, такие как: "СИНТЕЗ", "РАЗГОНКА", "АППАРАТ", "ЖЕЛЕЗО", "БЕНЗОЙНО-КИСЛАЯ КИСЛОТА", "ГАЗ", "ЖИДКОСТЬ",

444

МЕШАЛКИН и др.

"ЦВЕТ", "ДАВЛЕНИЕ", "ВЕС", "ТЕМПЕРАТУРА", "ПЛОТНОСТЬ", "АГРЕГАТНОЕ СОСТОЯНИЕ" и ряд других. Множество Т расширяемо по мере накопления знаний, а смысл знаков (сущностей, или понятий) определяется по принадлежности к тематике или базовым понятиям СОЕЯ. Множество Р — это синтаксис ЯВтП знаний формально описано с помощью синтаксическо-мор-фологических графов, или цепей, и деревьев синтаксического подчинения [1, 10].

Для определения базовых понятий предметной области — множество и нами использованы принципы иерархической декомпозиции, классификации и структуризации знаний, применяемые ко всем сложным понятиям химической технологии, описываемым в текстах предметной области [1, 5, 8, 10, 11].

В результате проведенного интеллектуального анализа сущности понятий о структуре описываемых в научно-технических текстах о химико-технологических системах (ХТС) [1—5, 8—11] авторами выделены типовые стадии (отделения, или технологические операции) ХТС получения специальных продуктов, — реактивов и особо чистых веществ такие как "СИНТЕЗ", "РАЗГОНКА", "КРИСТАЛЛИЗАЦИЯ", "ПЕРЕКРИСТАЛЛИЗАЦИЯ", "ПРОМЫВКА", "СУШКА", а также вспомогательные технологические операции (ВТО), такие как "ЗАГРУЗКА", "ДОЗИРОВАНИЕ", "ВЫДЕРЖКА", "НАГРЕВ", "ОХЛАЖДЕНИЕ".

Выделение ВТО позволило представлять каждую конкретную стадию (отделение) ХТС в виде строго определенной последовательности типовых химико-технологических процессов (ХТП), реализующих выполнение ВТО. Каждая ХТС и ХТП имеют входн

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком