научная статья по теме АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ПРИМЕНИТЕЛЬНО К РЕШЕНИЮ ЗАДАЧИ РАСПОЗНАВАНИЯ ТИПА ПОРОДЫ ПО СОВОКУПНОСТИ ПЕТРОФИЗИЧЕСКИХ СВОЙСТВ Геофизика

Текст научной статьи на тему «АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ПРИМЕНИТЕЛЬНО К РЕШЕНИЮ ЗАДАЧИ РАСПОЗНАВАНИЯ ТИПА ПОРОДЫ ПО СОВОКУПНОСТИ ПЕТРОФИЗИЧЕСКИХ СВОЙСТВ»

ФИЗИКА ЗЕМЛИ, 2015, № 4, с. 51-57

УДК 550.384

АНАЛИЗ МЕТОДОВ КЛАССИФИКАЦИИ ПРИМЕНИТЕЛЬНО К РЕШЕНИЮ ЗАДАЧИ РАСПОЗНАВАНИЯ ТИПА ПОРОДЫ ПО СОВОКУПНОСТИ ПЕТРОФИЗИЧЕСКИХ СВОЙСТВ

© 2015 г. П. А. Леляев, А. Я. Салтыковский

Институт физики Земли им. О.Ю. Шмидта РАН, г. Москва E-mail: petrleliaev@gmail.com Поступила в редакцию 18.11.2013 г.

При ограниченном количестве петрофизической информации об образцах пород региона для построения глубинной модели необходимо применять методы классификации, обеспечивающие наибольшую достоверность полученных результатов. Для существующей базы данных по Воронежскому кристаллическому массиву одним из таких методов является классификатор Байеса.

БО1: 10.7868/80002333715030102

Вероятностный прогноз вещественного состава глубоких горизонтов земной коры и верхней мантии является одной из важных задач при геологическом картировании региона. Такой прогноз может быть осуществлен на основании геофизических исследований (таких как ГСЗ, грави-разведка и т.д.). Следует отметить, что получение физических свойств глубоких горизонтов достаточно редко можно осуществить применением одного из этих методов и необходимо их комплекси-рование [Красовский, 1965], а также широкое использование априорной информации о строении исследуемого региона [Кабан, 1987]. С полученными геофизическими данными (для глубоких горизонтов это скорость распространения волны в среде ¥Р и плотность р) можно сопоставить базу соответствующих свойств образцов пород, представленных в исследуемом регионе, и на этом основании осуществить вероятностный прогноз вещественного состава. Исследуемые образцы должны быть отобраны из глубоких скважин изучаемого региона, поскольку свойства однотипных пород в разных регионах могут различаться, что впоследствии негативно может негативно сказаться на классификации. Кроме того, необходимо учитывать высокие Р7-параметры, соответствующие реальным условиям залегания пород в слоях коры и верхней мантии [Афанасьев, 1975]. К примеру, показано, что несмотря на общую тенденцию повышения УР на глубинах 5—10 км и дальнейшего ее снижения, для разных типов пород зависимость этого параметра от глубины будет различаться [Лебедев и др., 1986], таким образом, необходимо рассчитывать коэффициенты зависимости для каждого исследуемого типа и

учитывать их при классификации пород, встречающихся на соответствующих глубинах.

В работе в качестве объекта исследования рассмотрен Воронежский кристаллический массив (ВКМ), хорошо изученный геофизическими методами [Афанасьев, 1984]. Обобщенная геофизическая модель региона была получена группой исследователей по данным А.И. Дубянского и Л.И. Надежки [Леляев, 2012]. Полагая ВКМ достаточно однородной геологической структурой, можно сделать вывод о том, что изолиниям скоростей должны соответствовать изолинии плотностей [Романюк, 1985], таким образом, в литосфере массива можно выделить конечное количество глубоких горизонтов, каждый из которых представлен минимальным, максимальным и средним значениями УР и р (рис. 1). База петрофизических данных включала в себя 7 наиболее распространенных в верхах коры ВКМ пород (амфиболиты, гнейсы, габбро, диориты, кислые породы — граниты и мигматиты, сланцы, ультраосновные породы — пирок-сениты и серпентиниты) и более 2000 записей. Специфика классификации заключалась в двумерном пространстве параметров (диаграмма рассеяния в соответствующих осях приведена на рис. 2), а также достаточно ограниченном количестве записей по некоторым типам пород, вследствие чего разбиение на классы такими методами, как к-шеатз, было неосуществимо. По гистограммам распределений значений параметров (рис. 3 и рис. 4) видно, что они сильно перекрываются, таким образом, возникает необходимость в применении одного из математических методов классификации.

На базе образцов пород ВКМ были апробированы классификационные методы искусственного

51

4*

Ш//////////АК1

Щ////////ЩК.

~л-1-1-1-1-1-1-г

К

М

р, г/см3 2.6 2.8 3.0 3.2 3.4

2.5 2.7 2.9 3.1 3.3 3.5

0

5

10

15

20

25

30

35

40

45

50

55

60 Н, км

р, г/см3

2.6 2.8 3.0 3.2 3.4

2.5 2.7 2.9 3.1 3.3 3.5

0

5 10 15 20 25 30 35 40 45 50 55 60

Н, км

ЩМ

М,

0

5

10

15

20

25

30

35

40

45

50

55

60 Н, км

6.0 6.5 7.0 7.5

V, км/с 8.0 8.5

ШШК

ЩШУ/ШК,

ШШШК,

-2

М

0 5 10 15 20 25 30 35 40 45 50 55 60 Н, км 2

6.0 6.5

V, км/с 8.0 8.5

ЩМ

1

М1

р

Рис. 1. Обобщенная геофизическая модель литосферы ВКМ (по данным Надежки Л.И., Дубянского А.И.): 1 — графики изменения средних значений Ур и р для двух моделей; 2 — горизонты, к которым приурочено максимальное число отражающих границ; 3 — диапазон изменения Ур и р на различных глубинных уровнях.

интеллекта, реализованные в DEDUCTOR STUDIO ACADEMIC. Для проверки достоверности результатов классификации использовалось случайное разбиение исходного множества на два — так называемые обучающее (порядка 90—95% от количества записей) и тестовое (5—10%). На основании обучающего множества строились правила классификации, затем ее результаты экспериментально проверялись на тестовом множестве. Такие методы, как самоорганизующаяся карта Кохонена и нейро-сети, при вышеописанной проверке на тестовом множестве дали достаточно низкий уровень достоверности полученных результатов (до 50%) [Леляев и др., 2010]. Несколько лучший результат (порядка 75%) у дерева решений, однако при большом коли-

честве ветвей многие области на плоскости параметров включают в себя один или несколько образцов, что при небольшом их количестве для отдельных типов также не приводило к решению задачи. Уменьшение количества ветвей существенно снижало достоверность классификации. Таким образом, возникла необходимость реализации иного алгоритма, учитывающего специфику задачи.

Автором был предложен метод классификации, основанный на функции принадлежности точки плоскости к одному из классов [Леляев, 2011]. Функция принадлежности должна учитывать факторы, которые повлияли на низкую достоверность результатов других методов, а именно: в точках, соответствующих имеющимся образцам,

Ур, км/с 8

2.2

2.4

2.6

2.8

3.0

3.2

Амфиболит Диорит Габбро " Гнейс Кислые Сланец

Ультраосновные

3.4 3.6 р, г/см3

Рис. 2. Диаграмма рассеяния исследуемых образцов в осях параметров.

50

Амфиболит

100

50

J_I_I_1 Р77-

0

Диорит

50

1

1 1

.....1—^ Ф/. Р Ша , 1

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

Гнейс

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

Ультраосновные

ш

300 250 200 150 100 50 0

I—V7/.

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

Ур

Габбро

100

50

0 ' ' ' '

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

Кислые

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

Сланец

250 200 150 100 50 0

2.0 3.0 4.0 5.0 6.0 7.0 8.0 2.5 3.5 4.5 5.5 6.5 7.5

7

6

5

4

3

2

0

0

Рис. 3. Гистограмма распределения Ур основных типов корообразующих пород ВКМ.

Амфиболит

Диорит

Габбро

100

J_I_I_1_

100

22_!_I_1_

J_I_I_1_

200 100 0

1.8 2.2 2.6 3.0 3.4 3.8 1.8 2.2 2.6 3.0 3.4 3.8 1.8 2.2 2.6 3.0 3.4 3.8

2.0 2.4 2.8 3.2 3.6

J_I_I_1_

J_I_I_I_

2.0 2.4 2.8 3.2 3.6 Гнейс

2.0 2.4 2.8 3.2 3.6 Кислые

Сланец

300 200 100 0

1000 800 600 400 200

1111 0

J_I_I_

л_I_I_1_

500 400 300 200 100 0

1

1.8 2.2 2.6 3.0 3.4 3.8 1.8 2.2 2.6 3.0 3.4 3.8 1.8 2.2 2.6 3.0 3.4 3.8

2.0 2.4 2.8 3.2 3.6 Ультраосновные

2.0 2.4 2.8 3.2 3.6

2.0 2.4 2.8 3.2 3.6

I

_|_

1.8 2.2 2.6 3.0 3.4 3.8

2.0 2.4 2.8 3.2 3.6 р

Рис. 4. Гистограмма распределения р основных типов корообразующих пород ВКМ.

значение функции принадлежности точки множеству, характеризующему данный тип породы, должно равняться единице; в достаточно далеких от множества точках оно должна равняться нулю; скорость его убывания должна отрицательно коррелировать с дисперсией соответствующего множества. Таким требованиям удовлетворяет функ-

2

ция /(х, у, г) = е , где ц(х, у, г) — расстояние от данной точки до ближайшей точки /-го множества (в евклидовой метрике и двумерном пространстве параметров, х в данном случае соответствует плотности, а у — скорости), а г — дисперсия /-го множества, рассчитанная по формуле аг =

Х^Х - X)2 + (ук - Уг)2)

количество

элементов 1-го множества, х1 и у г — средние значения соответствующих параметров данного множества). Тип породы в каждой точке (х, у) определялся по выражению { г : г ^ тах/(х,у, г)}. Такой метод позволял сделать предположение о наиболее вероятном типе пород в слое с известными средними значениями параметров. Результат классификации базы свойств образцов ВКМ

таким методом в осях исследуемых параметров представлен на рис. 5.

Главным недостатком вышеописанного метода является отсутствие информации о других типах пород, которые также могут представлять исследуемый глубокий горизонт. Следовательно, в построенной по результатам такой классификации модели в глубоких горизонтах могут быть отражены только те породы, которые для значений параметров, присущих этому горизонту, принимали наибольшее из всех исследуемых пород значение функции принадлежности, хотя в горизонте могут содержаться и другие породы. Для решения этой проблемы использовался классификатор, основанный на теореме Байеса:

__ РЫмам 1 р(А{ )

где А — вектор параметров, Р(Нк) — априорная вероятность принадлежности наблюдения к-му классу (априорные вероятности Р(Нк) полагались равными [Леляев, 2012] вследствие отсутствия информации о соотношении площадей выхода исследуемых типов пород ВКМ на поверхность фундамента); Р(А) — вероятность попадания параметров

0

0

в?? Графическое представление

3.50

3.13

2.76

2.40

2.03

Амфиболиты 1 Ультраосновные

Гнейсы

1 Сланец

Кислые

Габбро

Диориты

2.54

Ур

3.76 4.97

Обработано 2357 образцов

6.18

7.70

1000 800 600 400 200 0

Рис. 5. Результат работы программы-классификатора, основанной на функции принадлежности.

1800 1600 1400 1200 1000 800 600 400 200 01—1-1-

2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 Ур

1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 3.6 3.8 Р

Рис. 6. Гистограммы распр

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком