научная статья по теме КАЧЕСТВО ПРЕДМЕТИЗАЦИИ: ЭФФЕКТИВНОСТЬ ПРЕДМЕТИЗАЦИИ И АДЕКВАТНОСТЬ ОТРАЖЕНИЯ СОДЕРЖАНИЯ ДОКУМЕНТА Культура. Культурология

Текст научной статьи на тему «КАЧЕСТВО ПРЕДМЕТИЗАЦИИ: ЭФФЕКТИВНОСТЬ ПРЕДМЕТИЗАЦИИ И АДЕКВАТНОСТЬ ОТРАЖЕНИЯ СОДЕРЖАНИЯ ДОКУМЕНТА»

ОЛЬГА ЖЛОБИНСКАЯ, ЮЛИЯ СЕЛИВАНОВА, НАДЕЖДА НИКОЛЬЦЕВА, ГАЛИНА ВАСИЛЬЕВА

Качество предметизации:

эффективность предметизации и адекватность

отражения содержания документа

КАЧЕСТВО предметизации определяется тем, в какой степени предметные рубрики (ПР), присвоенные индексатором, отражают содержание документа. Это требование отражено в ГОСТ 7.59-2003: «При индексировании следует представлять с необходимой и достаточной полнотой и точностью в поисковом образе документа в виде терминов индексирования основное содержание документа».

Данное положение нельзя признать в достаточной степени формализованным, так как остается неясным, что означает «необходимая и достаточная полнота и точность». Однако именно полнота и точность (наряду с точностью используются близкие по значе нию тер ми ны «спе ци фич ность», «детальность») являются в настоящее время основными характеристиками индексирования (и предметизации в том числе).* ГОСТ 7.74-96 Информационно-поисковые языки. Термины и определения содержит следующие определения:

Полнота индексирования - степень отражения в поисковом образе аспектов содержания документа и (или) запроса.

Примечание. Определяется как отношение числа специфических терминов и фактографических сведений, включенных в поисковый образ, к числу таковых терминов и сведений в тексте документа или запроса.

Специфичность индексирования - характеристика качества индексирования, определяемая отношением числа фактографических сведений и специфических терминов, отражающих содержание документа, к числу неспецифических общенаучных терминов в поисковом образе.

Полноту предметизации можно условно оценить «количеством понятий, выделенных из содержания документа и представленных в виде ПР»1; понятие специфичнос-

ти связано со смысловой близостью содержания документа и набора предметных рубрик, отражающих это содержание, т. е. поискового образа документа (ПОД). Необходимо заметить, что и полнота, и специфичность предметизации являются понятиями относительными, так как, во-первых, их нельзя измерить в абсолютных величинах, и, во-вторых, боль шое значе ние для оп ре де -ления необходимой полноты и точности имеют объем и тематический характер поискового массива.**

Для обес пече ния не обходи мой точ ности предметизации название предмета в формулировке ПР должно соответствовать предмету документа по объему понятия о предмете. Такое соответствие в предметизации связывается с понятиями «адекватность» и «адекватная ПР». В теории информационного поиска под адекватностью понимается наиболее полное и точное отражение содержания документа одной или набором предметных рубрик, образующих ПОД.

В зависимости от степени конкретизации предмета и его аспектов различают адекватные и обобщающие ПР (ранее в теории предметизации использовались термины «узкие» и «широкие» ПР).

ГОСТ 7.74-96 определяет:

Адекватная предметная рубрика - предметная рубрика, формулировка которой выражает объем понятия, наиболее точно соответствующий объему понятия о предмете документа.

Обобщающая предметная рубрика -

предметная рубрика, выражающая объем понятия, существенно более широкий, чем объем понятия о предмете документа.

Из приведенных определений следует, что адекватность - понятие относительное и должно рассматриваться применительно к конкретным условиям.

Успешность поиска необходимой информации во многом определяет качество предметизации. Проблемы выбора и определения критериев для точного и полного отражения содержания документов -произведений печати -приобретают в этой связи первостепенное значение.

Ольга Николаевна Жлобинская, старший научный сотрудник Службы поддержки форматов РНБ

Юлия Геннадьевна Селиванова, заведующая сектором Отдела обработки и каталогов РНБ, кандидат педагогических наук

Надежда Петровна Никольцева, председатель комиссии по предметизации и предметному каталогу Отдела обработки и каталогов РНБ

Галина Николаевна Васильева, главный библиотекарь отдела обработки и каталогов

1. Адекватность с точки зрения индексируемого документа. Соотношение по объему между ПР и предметом документа не зависит от объема самого понятия - понятие о предмете может быть узким или широким, частным или общим. Адекватность ПР рассматривается в связи с конкретным документом, а не в связи с местом ПР в структуре языка предметизации. Одна и та же ПР может быть обобщающей для одного документа и адекватной для другого. Например, ПР Зоология является обобщающей, если она приписана документу о кошках. Однако для документа о зоологии ПР Зоология становится такой же адекватной, как ПР Кошки - для документа о кошках. С другой стороны, ПР Кошки является обобщающей для документа о сиамских котах. В этом контексте адекватная ПР - та, которая соответствует понятию о предмете документа, в то время как обобщающая ПР представляет класс, к которому принадлежит предмет документа. Одна или набор предметных рубрик должны точно покрывать предмет индексируемого документа, не будучи ни шире, ни уже этого предмета. Поскольку адекватность - это не свойство отдельного термина или ПР, она определяется именно отношением между ПР и документом. Например, обобщающая ПР Экономика является адекватной, когда она применяется к документу общего характера об экономике.

2. Адекватность с точки зрения иерархической структуры языка индексирования. Определяя адекватность как свойство ПР по отношению к документу, нельзя забывать об отношениях в системе ПР. В этом контексте считается, что ПР на нижнем уровне иерархической цепочки является более адекватной, чем ПР на более высоком уровне. Так, ПР Кошки является более адекватной, чем ПР Млекопитающие, которая, в свою очередь, является более адекватной, чем ПР Позвоночные.

Как правило, при сопоставлении адекватной и обобщающей ПР адекватность указывает на то, что в одной из сопоставляемых ПР есть дополнительный подзаголовок, либо на то, что одна из лексических единиц (ЛЕ) в составе данной ПР стоит ниже другой в родовидовой иерархии в системе ПР. Такого рода отношения фиксируются с помощью ссылок «см. также», позволяющих увеличить полноту поиска.2

В двухмерной иерархической цепочке, содержащей простые термины, определить адекватность ПР несложно, однако в полииерархических цепочках возникают проб-

лемы. Например, можно определить, что ПР Желудок является более адекватной, чем ПР Органы пищеварения, и что ПР Язвенная болезнь - более адекватная, чем ПР Болезни. Однако, скажем, не очевидно, какая из ПР является более адекватной: Желудок - Болезни или Органы пищеварения -Язвенная болезнь.

Стремление к созданию максимально адекватной ПР и преимущественному отражению специфики документа может привести к значительному росту числа рубрик в системе ПР, что существенно затруднит организацию процесса поиска, увеличит трудоемкость и затраты. Кроме того, для универсальных систем большого объема чрезмерное отражение специфики документа нерационально. С другой стороны, стремление к созданию обобщающей ПР и преимущественному отражению типовых характеристик документа может привести к противоположному результату - сокращению числа рубрик в системе ПР, что резко уменьшит «разрешающую способность» системы, приведет к значительному увеличению «шума» при поиске и затруднит определение специфичности того или иного документа. Адекватность или обобщенность ПР зависит не только от специфики документа, но и от объема массива документов, степени детализации ИПЯ типа

К тому же адекватность отражения содержания применительно к конкретному документу всегда относительна: любая, даже самая адекватная ПР передает предмет в сжатой, и потому обобщенной форме относительно определения (раскрытия) этого предмета в исходном развернутом тексте документа. Строго говоря, понятие «адекватное отражение содержания документа» является достаточно условным, поскольку соответствовать ему может только текст всего документа.2

3. Адекватность с точки зрения полноты (глубины) индексирования. Индексирование может осуществляться на уровне документа, когда ПР отражают содержание документа в целом, или на более глубоком уровне (разделов или глав), когда выбранные ПР отражают отдельные компоненты документа. «Глубокое» индексирование приводит к увеличению числа предметных рубрик. Количество приписываемых ПР зависит прежде всего от методики индексирования, а не от характера ИПЯ. Один и тот же список ПР может использоваться в разных случаях по-разному, в зависимости от требований пользователей и/или доступных ресурсов и кадров.

Проблема выбора ПР по объему понятия,

которое оно отражает (адекватной ПР или набора ПР), является одной из наиболее сложных в практике предметизации. Исследованием этой проблемы в той или иной мере занимались все ведущие специалисты в области предметизации - Я. П. Гребенщиков, Б. Р. Зельцле, В. П. Кругликова, С. К. Ви-ленская, Э. Л. Призмент, Л. В. Сахарный. Среди основных условий, определяющих выбор ПР по объему понятия, выделяются следующие: научная и/или практическая значимость предмета; значимость самого документа по характеру, объему материала и т. д.; профиль библиотеки и основная категория пользователей; количество документов, посвященных данному предмету.

На практике стремление к полной адекватности отражения в ПР предмета в комплексе с его аспектами может привести к излишней детализации. В результате близкие по тематике документы могут быть разбросаны по различным рубрикам, не обеспечивающим комплексирование документов. Поэтому в отдельных случаях может допускаться использование более обобщающих формулировок ПР. Это определяется конкретной методикой индексирования. Большое значение имеет характер предметизации (универсальная или отраслевая). В универсальной библиотеке, как правило, не должен применяться дифференцированный подход к отражению литературы любой тематики, поскольку читателями библиотеки могут быть специалисты всех отраслей знания.

Электронная каталогизация, сохраняя основные принципы содержательной обработки документа, создает более широкие возможности для раскрытия его содержания. Традиционная предметизация опиралась на принцип целостного

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком