научная статья по теме ИСПОЛЬЗОВАНИЕ ОБУЧАЮЩИХСЯ АЛГОРИТМОВ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ ГИС Геофизика

Текст научной статьи на тему «ИСПОЛЬЗОВАНИЕ ОБУЧАЮЩИХСЯ АЛГОРИТМОВ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ ГИС»

ИСПОЛЬЗОВАНИЕ ОБУЧАЮЩИХСЯ АЛГОРИТМОВ ДЛЯ ИНТЕРПРЕТАЦИИ ДАННЫХ ГИС

К ПАКЛИК, BaseGroup Labs Р. МУХАМАДИЕВ, НПУ «Казаньгеофизика»

Как известно, геологическая интерпретация данных комплекса геофизических исследований скважин (ГИС) представляет собой сложную задачу, имеющую важнейшее практическое значение для поисков и разведки месторождений полезных ископаемых, относящуюся к классу обратных задач геофизики и решаемую экспертом-геофизиком в условиях неполной информации. Основы теории и практики геологической интерпретации данных ГИС сформировались в 30—70 гг прошлого столетия. Интерпретация ГИС базируется на математическом и физическом моделировании изучаемых процессов (решение прямых задач геофизики), решении систем нелинейных петрофизических уравнений (обратная задача геофизики) и некоторых линейно-статистических методах. Однако зависимости каротажных сигналов от расчетных физико-геологических параметров чаще всего имеют сложный нелинейный характер. Кроме того, геофизику необходимо учитывать величину погрешности измерений, специфику территории и т. д. Все это позволяет сделать предположение об эффективности применения методов интеллектуальной обработки данных (Data Mining) для решения геофизических задач, т. к. эти методы обладают свойством адаптивности, обобщения, извлечения знаний и моделирования сложных нелинейных зависимостей.

Для решения задач классификации, прогноза и выявления скрытых

закономерностей в последнее десятилетие широко используются следующие алгоритмы Data Mining [1].

■ Искусственные нейронные сети, основанные на принципе обучения «с учителем» и решающие задачи прогнозирования и регрессии. Позволяют эффективно моделировать нелинейные зависимости без построения точной математической модели исследуемого процесса.

■ Самоорганизующиеся карты Кохонена. Представляют собой один из методов кластеризации — проецирование с сохранением топологического подобия. Обучение происходит «без учителя», в результате векторы, сходные в пространстве признаков, оказываются близкими на результирующей карте кластеров.

■ Деревья решений — эффективный метод автоматического анализа данных. Результатом работы алгоритма является иерархический список решающих правил вида «если — то», образующих «дерево».

Несмотря на стремительное развитие компьютерных технологий (в том числе методов машинного обучения), большинство геофизиков редко использует данные методы, полагаясь в сложных ситуациях на свой опыт и интуицию. Вместе с тем, актуальность применения новых, высокоэффективных способов геологической интерпретации геофизических данных сейчас возрастает. Это связа-

но, по меньшей мере, с двумя факторами.

■ Экономический. В РФ остро стоит проблема открытия новых месторождений полезных ископаемых, в особенности залежей нефти и газа. Разведанные к настоящему времени запасы углеводородов в ближайшие годы будут исчерпаны. Для получения новых запасов нефтяным компаниям необходимо вкладывать значительные средства, особенно если речь идет об открытии и освоении месторождений в труднодоступных районах. Цена ошибки при оценке запасов в этих условиях становится весьма значительной.

■ Временной. Методы Data Mining позволяют оптимизировать интерпретацию каротажных диаграмм. Другими словами, появляется возможность проводить быстрый, эмпирически обоснованный экспресс-анализ каротажных данных по новым скважинам [2].

Многие отечественные геофизики уже оценили высокую эффективность применения интеллектуальных алгоритмов интерпретации геофизических и геохимических данных. Так, в Центре опытно-производственных работ НПУ «Казань-геофизика» (АО «Татнефтегеофи-зика») для распознавания нефте-перспективных зон по комплексу геофизических и геохимических параметров (комплекс ГГХМ) используется аппарат искусственных нейронных сетей [3]. Результаты исследований показали, что искусственная нейронная сеть (многослойный персептрон) обеспечивает корректное решение нефте-поисковых задач с вероятностью более 98% (против 54% при классификации методом линейно-статистического анализа с помощью дискриминантных функций).

Специалистами НПУ «Казаньгеофизика» и компании BaseGroup Labs (г. Рязань) проведены экспериментальные исследования возможности решения ряда задач промысловой геофизики, в числе которых — расчленение геологического разреза с выделением пластов-коллекторов,

- ЕСЛИ (По результату)

[^д В К < 1.8635 ТОГДА Туре = коллектор - ВК>= 1.8635

- [^Д GR <: 3.617

- NGR < 1.Э525

NGR < 1.587 ТОГДА Туре = коллектор - (=] NGR>= 1.587

- f^SI GR < 2.3115

[^ЗД В К < 2.7695 ТОГДА Туре = коллектор - ВК >= 2.76Э5

l^™ DT < 184.17 ТОГДА Туре = не коллектор DT >=184.17 ТОГДА Туре = коллектор f^SI GR >= 2.3115 Т 0 Г ДА Type = не коллектор N G R >= 1.9525 Т 0 Г ДА Туре = не коллектор GR >= 3.G17 ТОГДА Туре = не коллектор

Рис. 1

1Е! 18! .'I?] 220.42 273.33 [сЦ 1 2

Рис. 2

а также идентификация продуктивных коллекторов (водонасыщенные, нефтеводонасыщенные, нефтенасы-щенные) с использованием самообучающихся алгоритмов. Обучающая выборка сформирована на основе данных ГИС, включающих в себя набор стандартных каротажей: BK (боковой), DT (акустический), GR (гамма-каротаж), NGR (нейтронный гамма-каротаж), DS (кавернометрия).

Для проведения исследований использовалась отечественная разработка — аналитическая платформа Deductor компании BaseGroup Labs [4]. Это позволило в кратчайшие сроки построить эффективное аналитическое решение благодаря следующим уникальным особенностям платформы Deductor:

• импорт данных из большинства известных источников данных;

• наличие полного набора инструментов: предобработка данных, нейронные сети, деревья решений и др.;

• развитые механизмы визуализации полученных результатов.

Используя полученную от геофизика-интерпретатора информацию о выделенных по нескольким скважинам исследуемой территории пластах, интеллектуальная аналитическая система на основе алгоритмов Data Mining позволяет выявить закономерности между данными ГИС и коллек-торскими свойствами (а также продуктивностью) пластов и в дальнейшем производить геологическую экспресс-интерпретацию каротажных диаграмм новых скважин.

Для выделения в геологическом разрезе пластов-коллекторов была

сформирована обучающая выборка, включающая 2300 точек, часть которых резервировалась для тестирования полученных решающих правил.

Построенное по данным двух скважин дерево решений содержит 8 решающих правил (рис. 1). Результаты тестирования показали, что для новой скважины модель обеспечивает точность классификации (выделения границ пластов-коллекторов) на уровне 75%.

Для прогнозирования продуктивности выделенных коллекторов, которые могут принадлежать к одному из трех классов (нефтенасыщенный, во-

донасыщенный и нефтеводонасы-щенный), использовались данные ГИС по 8 скважинам. Обучающая выборка включала 278 точек. Для кластеризации использовались самоорганизующиеся карты Кохонена. Полученные карты для трех каротажей и карта кластеров представлены на рис. 2.

Анализ карт различных признаков показывает, что определяющей для разделения коллекторов на водоносные и нефтеносные является величина удельного электрического сопротивления по данным бокового каротажа ВК. Несмотря на то, что обучение проходило «без учителя», алгоритм Кохонена сгруппировал большинство нефтеносных пластов в отдельный кластер (кластер 0), в котором усредненная по пласту величина ВК имеет средние и высокие значения. Кластер под № 2 принадлежит водонасыщенным коллекторам. Ему соответствуют средние и высокие показания кавернометрии ОБ и акустического каротажа ОТ. Наконец, в кластер под № 1 вошли неф-теводонасыщенные коллекторы, для которых характерны низкие значения величин ВК и ОБ.

Эта же задача решалась дополнительно с использованием эмпирических решающих правил (деревьев решений). В обучающей выборке теперь присутствовал выходной столбец с известным насыщением пласта (т. н. обучение «с учителем»). Информация о насыщении коллекторов предоставлялась экспертом-геофизи-

-

-

-

-

ЕСЛИ (По результату) ВК < 24.025

- [^Ш ВК <9.8174

- GR < 1.548 - GR < 1.5358

NGR < 2.8324 ТОГДА Lit = вода NGR >= 2.8324 ТОГДА Lit = вода+нефть GR >=1.5358 ТОГДА Lit = вода+нефть GR >= 1.548 ТОГДА Lit = вода ВК>= 8.8174

NGR < 1.717 ТОГДА Lit = вода NGR >=1.717

GR < 2.2GG2

I—I DT < 214.33 ТОГДА Lit = вода

DT >=214.33 ТОГДА Lit = нефть GR >= 2.2GG2 ТОГДА Lit = вода+нефть

ВК>= 24.025 l^g NGR < 1.6118 ТОГДА Lit = вода

- 1=Ц NGR >=1.6118

- DT < 201.43 DT < 188.83 ТОГДА Lit = нефть DT >=189.83 ТОГДА Lit = вода

DT >= 201.43 ТОГДА Lit = нефть

-

-

Рис. 3

ком. Модель сгенерировала 12 решающих правил.

Так же, как и самоорганизующаяся карта, модель «дерево решений» извлекла два правила, согласно которым при средних и высоких значениях ВК однозначно идентифицируется нефтенасыщенный коллектор. Полное дерево решений для классификации типа насыщения приведено на рис. 3.

Результаты классификации сравнивались по таблицам сопряженности (табл. 1, 2).

Из сравнения таблиц сопряженности видно, что водонасыщенные пласты распознаются моделями практически в 100% случаев. Обе модели отнесли четыре нефтеносных коллектора к типу «водонасыщенные». Скорее всего, при интерпретации ГИС для этих пластов геофизик привлекал априорную дополнительную информацию, которая не содержится в имеющихся обучающих данных, не исключена и возможность ошибки геофизика-интерпретатора. Основные проблемы возникают при классификации нефтеводо-насыщенных пластов. Поскольку они занимают промежуточное положение между типами «вода» и «нефть», построенная самоорганизующаяся карта и де-

рево решении относят часть таких пластов к разным типам. Тем не менее, и здесь можно говорить о выделении группы нефтеносных пластов с вероятностью, близкой к 90%.

Изложенный подход может служить основой для создания интеллектуальных систем экспресс-анализа данных ГИС. Пример отчета, генерируемого такой системой, представлен на рис. 4, где отмечается высокая степень сходства результатов интерпретации экспертом-геофизиком и искусственной нейронной сетью, которая предварительно обучалась на данных ГИ

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком