научная статья по теме АЛГОРИТМ ПОВЫШЕНИЯ СЕМАНТИЧЕСКОЙ ТОЧНОСТИ ИНСТРУКТИВНЫХ ТЕКСТОВ Общественные науки в целом

Текст научной статьи на тему «АЛГОРИТМ ПОВЫШЕНИЯ СЕМАНТИЧЕСКОЙ ТОЧНОСТИ ИНСТРУКТИВНЫХ ТЕКСТОВ»

Прикладная и математическая лингвистика

Борисочкин Д.А., кандидат экономических наук Финансового университета при Правительстве Российской Федерации

АЛГОРИТМ ПОВЫШЕНИЯ СЕМАНТИЧЕСКОЙ ТОЧНОСТИ ИНСТРУКТИВНЫХ ТЕКСТОВ

Рассмотрим следующее предложение: «Петя показал Васе книгу, которая ему понравилась». В этом предложении, слово «ему» может с равным успехом относиться как к Пете, так и к Васе. Более того, понять, понравилась книга до или после того, как она была показана изначально также невозможно. Нам лишь интуитивно понятно, что, скорее всего, речь идет о том, что книга понравилась Пете, причем настолько, что после этого он ее решил показать Васе.

В повседневной речи точность является вещью необязательной, более того, не всегда желаемой: семантический люфт, небольшая двусмысленность в трактовке часто и является как раз тем, что ищут люди, общаясь друг с другом.

Этот факт нельзя воспринимать как плохой или хороший, он является частью человеческой натуры, испокон веков несколько двуличной. («Американский президент прибежал предпоследним, а Леонид Ильич занял почетное второе место»).

Негативно можно оценивать лишь отдельные проявления двусмысленности человеческого языка. Например, для того, чтобы давать друг другу четкие указания, люди все равно продолжают использовать обычную человеческую речь, полную уготованных за долгие века развития ловушек и логических уловок.

Выходом из затруднительной ситуации может быть переход на формальный язык. Вместе с тем, такой переход сам по себе может вызывать затруднения. Компромиссом может являться обычный человеческий язык, допускающий только конечное количество языковых штампов, максимально освобожденных от возможных логических ловушек: идеальный канцелярский язык. На родине бюрократизма, в Германии, уже почти 100 лет существует справочник рекомендуемых к употреблению оборотов, выходить за пределы которых чиновник не должен (Ментруп, 1984). Аналогичные рекомендации существуют и в других европейских государствах.

Возникает, однако, вопрос, что делать с текстами, содержавшими в себе нормативные и инструктивные предписания, но написанным на «живом» языке. Безусловно, эти тексты всегда будут таить в себе угрозу неверной интерпретации. Вместе с тем, существует, на наш взгляд, достаточно действенный способ минимизировать риски и, по крайней мере, их здраво осмыслить. Для этого мы предлагаем трехступенчатый алгоритм: на первом этапе обычный текст переводится на формальный метаязык, на втором этапе записанное на метаязыке выражение обрабатывается и нормализуется, на третьем - переводится на точный русский язык.

Рассмотрим по порядку все три этапа.

Первый этап: перевод на метаязык. Чтобы его понять, необходимо описать синтаксис метаязыка.

Каждая клауза (простое предложение или часть сложного), будет представлять собой отдельную запись со своим уникальным идентификатором. Другие предикации тоже могут представлять собой отдельную запись. Далее необходимо учесть такие сущности как основные участники, их роли, описание ситуации, ее характеристики. Для описания ролей основных участников мы далее будем, с небольшими оговорками, использовать терминологию семантических падежей Ч. Филлмора (Fillmore, 1968).

Для каждой записи необходимыми считаем следующие поля: ¡ё записи, агентив, датив, инструменталис, фактив, сама ситуация, время, место, условие, модальность.

Запишем следующий пример: "если загорится зеленый свет, можно переходить дорогу".

На метаязыке предложение выглядит следующим образом:

1 пешеход х х х начинать идти когда_2 через_дорога если_2 иметь право

2 х зеленый свет х х начинать гореть А на_светофор то_1 иметь свойство

Сделаем несколько групп замечаний-комментариев:

1. Относительно самих полей:

Первые 4 смысловые поля представляют собой семантические падежи. Агентив - для инициатора действия, датив - для объекта действия, инструменталис для инструмента действия (в том числе его невольного виновника: ветром сорвало крышу), фактив - для результата действия.

Помимо самой ситуации необходимо дать описание ее пространственно-временных характеристик, а также модальной характеристики, т.е. описать отношение высказывания к реальности.

2. Относительно возможных значений этих полей:

Кроме последних 4 полей все остальные могут принимать только значение конкретного слова (обязательно проиндексированного, если есть риск омонимии) или заплатки х или А, соответствующие невозможности наличия какого-либо значения или возможности подстановки любого значения соответственно. Сама ситуация должна быть не только обозначена инфинитивом, но и охарактеризована с аспектуальной точки зрения.

Временная локализация ситуации - либо четко заданный временной интервал либо ссылка на другую ситуацию с указанием временной зависимости. В данном случае - это слово "когда", соединенное со ссылкой на следующий ¡ё.

Пространственная локализация строится по тому же принципу, но направляющие предлоги здесь будут не временные, а пространственные.

Условие частично коррелирует с временной локализацией в первом случае и выражается специфическим «то» во втором, косвенно указывающим на ограниченную реальность второго предложения. Говорящий никак не указывает на его истинность или ложность.

Модальность характеризуется выражениями: имеет право, обязан, имеет свойство, а также аналогичные выражения с отрицаниями на обоих концах выражений: «не имеет права», «имеет права не», «не имеет права не».

3. Относительно проведенных при переводе на метаязык преобразованиях текста:

Перевод на метаязык - это помимо всего прочего еще и способ проверить состоятельность предложения с формальной точки зрения. С содержательной стороны проверка возможна только на следующем этапе.

Так даже в этом случае мы должны были ввести ряд уточнений, полученных исключительно из синтаксической структуры метаязыка. Два наиболее существенных уточнения, на наш взгляд, следующие: зеленый свет не вообще, а на светофоре, переходит улицу не кто попало, а пешеход.

Второй этап: Обработка выражений на метаязыке

Указанные выше трансформации имеют синтаксическую природу. Значительный интерес представляют также формально-логические трансформации, которые, вообще говоря, возможны и до перевода на метаязык, но с использованием метаязыка становятся более четко формализуемыми.

Например, воспроизведем ситуацию со светофором. Помимо приведенного выше предложения, добавим в текст еще одно: «зеленый свет загорается раз в 4 минуты». На метаязыке это утверждение будет выглядеть так:

3 х зеленый свет х х начинать гореть каждые 4 минуты на_светофор х иметь свойство

Объединим указанные утверждения в единых текст на метаязыке:

1 пешеход х х х начинать идти когда_2 через_дорога если_2 иметь право

2 х зеленый свет х х начинать гореть А на_светофор то_1 иметь свойство

3 х зеленый свет х х начинать гореть каждые 4 минуты на_светофор А иметь свойство

Первые 5 смысловых полей у 2-й и 3-й клаузы тождественны, что позволяет, выполнив

несколько логических операций прийти к утверждению, что пешеход имеет право стоять на переходе менее 4 минут:

Во-первых, сочетание «то» и «х» приводит к «х», иными словами введение в состав текста факта приводит к признанию реальности первой клаузы.

Во-вторых, реальность получается не столь всеобъемлющей, сколь исходное условие. Это нормально: множество реальных миров по определению не шире множества возможных миров. На множество возможных миров, неограниченно распространенных во времени налагается ограничение по времени «каждые 4 минуты».

Получаем преобразованную первую клаузу в следующем виде:

1 пешеход х х х начинать идти каждые 4 минуты через_дорога х иметь право

Что и требовалось доказать.

В более затруднительной, но не мене поучительной ситуации оказались бы мы, если бы попытались соединить два утверждения: что пешеход имеет право стоять на переходе менее 4 минут и что пешеход имеет право переходить дорогу на зеленый свет (без утверждения, что зеленый свет действительно загорается каждые 4 минуты). Мы бы в таком случае получили классическое мифическое "некто", против которого борется точный русский.

Третий этап: перевод на точный русский язык

У этого языка нет специальных правил орфографии или пунктуации, которые противоречили бы правилам орфографии и пунктуации обычного русского языка. Единственная лексикологическая особенность: не допускается возникновение омонимии, вследствие чего используются ранее упомянутые нами индексы. Неверно, однако, обратное: не все правила русского языка будут соответствовать точному русскому. Ему будут соответствовать только некоторые из них, так как точный русский - это прямой и дословный перевод с метаязыка на русский.

ЛИТЕРАТУРА

1. Ментруп В. К проблеме лексикографического описания общенародного языка и профессиональных языков//Новое в зарубежной лингвистике, Вып. XIV, с. 301-334.

2. Fillmore C. The case for case // Universals in linguistic theory, Bach & Harms, NY, 1968.

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком