научная статья по теме Поиск реферативной информации в области нефти и газа Геофизика

Текст научной статьи на тему «Поиск реферативной информации в области нефти и газа»

УДК 631.3:622.276

© М.П.Гинзбург, В.В.Верниковский, Н.П.Птицина, 1998

М.П.Гинзбург, В.В.Верниковский, и газа Н.П.Птицина (ОАО «ВНИИОЭНГ»)

Поиск реферативной информации в области нефти

M.P.Ginzburg, V.V.Vernikovskiy, N.P.Ptitsina (Joint Stock Association "VNIIOENG")

Searching for reported information in oil and gas sphere

Reviewed are subjects of data bank of automated documentary information searching system (ADIPS) "Neft-5". Mining section composition of ADIPS "Neft-5" data bank is reviewed. Requirements, considered during system development, are presented.

процессе своего становления нефтяные

компании заняты поиском оптимальных систем управления, разработкой бюджетной политики, расширением и обновлением производственного потенциала, выходом на международный рынок, оптимизацией инвестиционных проектов. Такая деятельность акционерных обществ должна быть надежно обеспечена актуальной информацией.

Особое значение в управлении нефтяных компаний приобретает инновационная деятельность [1]. Ее особенность заключается в том, что она все больше специализируется, отделяясь от производственных функций компании.

Надежной основой инновационных процессов являются формирование научно-технических концепций, организация разработки, производства и внедрения новых видов техники, технологий, решение важнейших научно-технических и производственных проблем. Вместе с этим важнейшим фактором научно-технического развития становится единый информационный банк данных по новейшим достижениям науки и техники в нефтяной и нефтегазопе-рерабатывающей промышленности [1].

Создание эффективных информационных систем позволяет специалистам значительно уменьшить расходы рабочего времени на информационную работу. Основное содержание этой работы - поиск документов (статей, отчетов, описаний к патентам, книг и др.), содержащих нужную информацию. Значительную экономию времени обеспечивают автоматизированные документальные информационно-поисковые системы (АДИПС). В них хранятся классифицированные сведения о первоисточниках

научно-техническои информации

(НТИ) - книгах, статьях, патентах, описаниях изобретениИ, докладах и т. п.

АДИПС "Нефть-5М" (пятая программная реализация со времени начала эксплуатации - 1972 г.) была разработана во ВНИИОЭНГе для сбора, хранения, поиска и выдачи потребителям информации о всех публикациях в мировой и отечественной отраслевой печати по проблемам нефти и газа. В настоящее время объем базы данных составляет 190 тыс. документов. Каждый документ состоит из достаточно информативного реферата и библиографического описания первоисточника информации. В основу формирования банка данных системы положены отбор рефератов из общегосударственных баз данных ВИНИТИ, ВНТИЦентра, ЦНТИ г. Волгоград, а также собственная информация. Эта информация берется из 120 отраслевых журналов по нефтегазовой тематике, публикаций патентной информации, отчетов, сообщений международных форумов, таких как Offshore Technology Conference, мировых газового и нефтяного конгрессов, научно-практических конференций.

Укрупненно тематика банка данных системы охватывает следующие направления: геофизические методы исследования и моделирования; общая геология;

геологические и геохимические методы поисков нефти и газа; месторождения горючих полезных ископаемых;

техника геолого-разведочных работ; разработка нефтяных и газовых месторождений;

горное и нефтепромысловое машиностроение;

приборостроение;

общие вопросы энергетики, энергетический баланс; трубопроводный транспорт; переработка нефти и газа; экономика.

Информационная база системы рассчитана на удовлетворение потребностей всех отраслей науки и производства в области нефти и газа. Система объективно располагает уникальной возможностью оперативного создания информационного продукта по любой необходимой потребителю тематической направленности, проблеме и т.д.

Главным источником пополнения банка данных системы являются базы данных научно-технической информации ВИНИТИ - головного органа НТИ в России. Он является национальным информационным центром по точным, техническим и естественным наукам. На основе тематических баз данных он публикует реферативные журналы.

Используя данные, приведенные в работе [2], проанализируем состав банка данных АДИПС "Нефть-5М" по разделу "Горное дело". Он формируется по следующим рубрикам Государственного рубрикатора НТИ 52.01.37 Стандартизация.

52.47.00 Разработка нефтяных и газовых месторождений.

52.47.01 Общие вопросы

52.47.15 Бурение и заканчивание нефтяных и газовых скважин.

52.47.17 Исследование нефтяных и газовых пластов и скважин.

52.47.19 Разработка нефтяных, газовых и газоконденсатных месторождений.

52.47.21 Разработка морских и шель-фовых месторождений нефти

12/1998 33

Книги Статьи Патенты Отчеты

7050 (отеч.) 59030 (отеч.) 13857 (отеч.) 10560 (отеч.)

1798 (заруб.) 48616 (заруб.) 20471 (заруб.) 767 (заруб.)

Всего

8848 107646 34328 11327

52.47.23 Разработка месторождений нефтеносных сланцев, битумов, асфальтов и озокерита.

52.47.25 Эксплуатация и ремонт нефтяных и газовых скважин.

52.47.27 Методы повышения отдачи нефтяных и газовых пластов.

52.47.29 Сбор, первичная обработка, транспортирование и хранение нефти на промыслах.

52.47.31 Использование нефтяного газа.

52.47.33 Сбор, очистка, транспортирование и хранение газа на промыслах.

52.47.97 Коррозия газонефтяного оборудования.

В банке данных системы рефераты, относящиеся к этому разделу, занимают 40 % общего числа рефератов, т.е. около 76 тыс. рефератов с ретроспективой в 14 лет. Эта информация берется (в основном) из обрабатываемых журналов в ВИНИТИ. Общее число журналов, обрабатываемых в ВИНИТИ при подготовке рефератов по разделу "Горное дело", составляет 1300. Это журналы из 65 стран на 29 языках. Статьи из журналов и других стабильных изданий составляют 57 %, статьи из сборников трудов и сообщений конференций - 19 %. Патентные документы составляют около 20 %. Публикации России составляют 39 %, США - 18 %, Великобритании - 18 %.

Анализ динамики информационного потока в 1992-1996 гг. по разделу "Разработка нефтяных и газовых месторождений" показал интенсивный рост публикаций, что является отражением направлений развития в области техники и технологии. Это касается деятельности в области коррозии нефтегазового оборудования, процессов строительства скважин. Большой рост числа публикаций отмечен в вопросах инвестиций, приватизации, акционирования, прибыли, налогов.

Общее состояние банка данных АДИПС "Нефть-5М" показано в таблице. Проанализированы текущие поступления 1997 г. и ретроспективный фонд за 14 лет. Следует отметить, что в банке данных системы хранится информация более ранних лет, но она выведена в архив.

АДИПС "Нефть-5М" является средством автоматизации информационного поиска - фундаментального понятия информатики [3]. Она решает два вида информационно-поисковых задач: ретроспективного поиска(РП) и избирательного распределения информации (ИРИ). При ретроспективном поиске отыскиваются документы, в которых содержатся сведения по определенному вопросу (запросу пользователя) на заданную глубину ретроспективы. В режиме ИРИ происходит адресное рас-

пределение новых поступлений информации в соответствии с постоянным информационным запросом (профилем интересов). Поисковый массив образуют документы (рефераты первоисточников), собранные в банке данных системы. Каждый документ состоит из его поискового образа и собственно текста документа. Формирование поискового образа при вводе документов в банк данных выполняется специальной системой автоматического индексирования.

АДИПС "Нефть-5М" эксплуатируется как в обычном для систем такого типа режиме, так и в режиме гипертекста. При ее разработке учтены следующие технические требования.

Возможность отыскания релевантных документов на любой запрос пользователя независимо от уровня его сложности и специфичности. При эксплуатации в гипертекстовом режиме в качестве такого гипертекста может использоваться как вся база данных АДИПС, так и некоторая ее часть, заведомо покрывающая информационную потребность данного пользователя (или группы пользователей).

Реализация системы на персональных компьютерах типа IBM PC или совместимых с ними ПЭВМ. Пользовательский интерфейс системы обеспечивает технологичность процедуры проведения поиска, удобство управления системой и наглядность получаемых в процессе поиска результатов. При этом каждый пользователь в зависимости от уровня своей подготовленности может ограничиваться тем набором средств поискового аппарата системы, который ему знаком. Вместе с тем это не должно существенно отражаться на поисковых характеристиках системы. Программное обеспечение системы включает развитую систему подсказок, описывающих все действия пользователя, допускаемые в конкретном режиме работы. Система обеспечивает максимальную компактность базы данных и высокую скорость поиска информации.

Поисковый аппарат системы включает как лингвистические средства, используемые для описания смыслов документа и запроса на информационно-поисковом языке(ИПЯ), так и программную реализацию сопоставления этих смыслов в процессе поиска документов.

Основой лингвистического обеспечения системы является тезаурус, в указателях которого концентрируется лексика информационно-поискового языка и фиксируются необходимые для качественного проведения поиска смысловые отношения между его лексическими единицами.

Лексический состав ИПЯ отображается не только отдельными терминами естественного языка, но и словосочетаниями. Лексические единицы группируются в классы условной синонимии, между ними устанавливаются как иерархические, так ассоциативные отношения.

Работа по установлению смысловых соотношений между дескрипторами и составление тезауруса была выполнена при участи высококвалифицированных специалистов нефтяной и газовой промышленности, геологов, специалистов по строительству предприятий нефтяной и газовой промышленности как России, так и стран бывшего СЭВ.

Доступ к тезаурусу осуществляется через два словаря:

алфавитный указатель дескриптор-ных статей и

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком