научная статья по теме ИССЛЕДОВАНИЕ РУДНЫХ МЕСТОРОЖДЕНИЙ МЕТОДАМИ АНАЛИЗА ДИНАМИЧЕСКИХ СИСТЕМ. II. КЛАСТЕРИЗАЦИЯ РУДНЫХ МЕСТОРОЖДЕНИЙ И ЕЕ ИНТЕРПРЕТАЦИЯ Геофизика

Текст научной статьи на тему «ИССЛЕДОВАНИЕ РУДНЫХ МЕСТОРОЖДЕНИЙ МЕТОДАМИ АНАЛИЗА ДИНАМИЧЕСКИХ СИСТЕМ. II. КЛАСТЕРИЗАЦИЯ РУДНЫХ МЕСТОРОЖДЕНИЙ И ЕЕ ИНТЕРПРЕТАЦИЯ»

ФИЗИКА ЗЕМЛИ, 2015, № 3, с. 112-121

УДК 553.042

ИССЛЕДОВАНИЕ РУДНЫХ МЕСТОРОЖДЕНИЙ МЕТОДАМИ АНАЛИЗА ДИНАМИЧЕСКИХ СИСТЕМ. II. КЛАСТЕРИЗАЦИЯ РУДНЫХ МЕСТОРОЖДЕНИЙ И ЕЕ ИНТЕРПРЕТАЦИЯ © 2015 г. М. В. Родкин1, 2, А. Р. Шатахцян 3

Институт теории прогноза землетрясений и математической геофизики РАН, г. Москва 2Институт морской геологии и геофизики ДВО РАН, г. Южно-Сахалинск 3 Геофизический центр РАН, г. Москва E-mail: rodkin@mitp.ru Поступила в редакцию 16.04.2013 г.

Рудные месторождения являются сложными природными объектами. Каждое месторождение по-своему уникально. Но для эффективной обработки информации о большом числе месторождений и для лучшего понимания процессов рудогенеза необходима их содержательная кластеризация. Известен ряд схем кластеризации (классификации) месторождений в зависимости от набора рудных компонент и других характеристик. Авторами обсуждаются новые формальные способы кластеризации рудных месторождений на основе применения меры близости Танимото (по данным о наборе рудных компонент) и на основе значений смешанной корреляционной размерности (по данным о взаимном пространственном расположении месторождений). Показывается тесная корреляция значений взаимной близости разных типов месторождений рассчитанных на основе меры Танимото и по значениям смешанной корреляционной размерности. Обсуждается вариант кластеризации месторождений, полученный на основе меры Танимото. Предлагается предварительная интерпретация ряда формально выявленных статистических закономерностей. Некоторые результаты кластеризации можно интерпретировать как свидетельство в пользу ранее высказанной гипотезы, что формирование крупных и суперкрупных рудных месторождений является побочным продуктом преобразования масс вещества тектоносферы из одного геохимического резервуара (верхняя континентальная кора, нижняя континентальная кора, океаническая кора, верхняя мантия, иные) в другой. Энергия таких тектонических процессов и обеспечивает реализацию массированных негэн-тропийных процессов концентрации рудного вещества в месторождения.

Ключевые слова: рудные месторождения, мера близости Танимото, корреляционная размерность, кластеризация рудных месторождений.

DOI: 10.7868/S000233371503014X

ВВЕДЕНИЕ

Данная статья является продолжением статьи [Родкин, Шатахцян, 2015], где описывается применение метода расчета корреляционной фрактальной размерности к задаче анализа базы данных БД по крупным и суперкрупным рудным месторождениям мира. В данной работе на основе применения меры близости Танимото и с учетом описанного ранее метода расчета корреляционной размерности проводится кластеризация данных по крупным и суперкрупным рудным месторождениям мира и предлагается интерпретация ряда результатов такой кластеризации.

Рудные месторождения являются сложными природными объектами. Каждое месторождение по-своему уникально. Однако, для эффективной обработки информации о месторождениях и для понимания процессов рудогенеза необходимо их

объединение в группы, кластеризация и классификация. Известен ряд схем кластеризации месторождений в зависимости от различных их характеристик [Рундквист и др., 2006]. Схемы эти, однако, носят обычно качественный и не формализованный характер. Отсюда актуальна задача развития формализованных схем количественной оценки степени близости между собой месторождений разных видов и разбиения совокупности месторождений различного вида минерального сырья на группы (кластеры).

Реализация формальных количественных подходов к кластеризации рудных месторождений стала возможной только в последние годы благодаря созданию достаточно представительных баз данных по рудным месторождениям, таких, например, как используемая нами ниже ГИС "Крупные и суперкрупные месторождения мира" (ГИС КСКМ),

[Largest Mineral Deposits..., 2006]. Значительное продвижение в плане применения к этим данным методов количественного статистического анализа представлено в работах [Соболев, Рундквист, 2006; Тихоцкий, 2006]. В частности в работе [Соболев, Рундквист, 2006], виды рудного сырья были разбиты экспертным образом на некоторые группы, а потом была оценена (по средней близости пространственного расположения соответствующих месторождений) степень близости между собой этих групп месторождений. В данной работе мы предпринимаем попытку формальной кластеризации множества рудных месторождений разного вида в полном объеме, начиная от уровня месторождений по отдельным видам сырья и заканчивая слиянием всех месторождений в единый кластер.

Авторами обсуждаются методы формального количественного описания степени близости между собой разных видов рудных месторождений по набору совместно присутствующих в них рудных компонент (на основе использования меры близости Танимото—Роджерса) и на основе расчетов смешанной корреляционной фрактальной размерности. Мера близости Танимото—Роджерса, Т[Мандель, 1988; и мн. др.] является известным и весьма общим подходом, широко применяемым для оценки степени близости между собой групп объектов, описываемых некоторым набором признаков (например, набором добываемых элементов). В нашем случае мера близости Т характеризует, насколько типично сонахождение двух данных разных видов минерального сырья в одном и том же месторождении. Метод оценки степени близости, основанный на расчете смешанной корреляционной фрактальной размерности был предложен и детально обсуждался в работах [Родкин, Шатахцян, 2013; 2014]; ниже будут кратко сформулированы только основные положения и результаты применения этого метода.

РАСЧЕТ МЕРЫ БЛИЗОСТИ МЕСТОРОЖДЕНИЙ РАЗНОГО ВИДА НА ОСНОВЕ МЕРЫ ТАНИМОТО

Для работы была использована база данных (ГИС " Крупные и суперкрупные месторождения", ГИС КСКМ [Largest Mineral Deposits., 2006; Рундквист и др., 2006]), на основании которой была сформирована база данных по пространственному расположению, содержанию, запасам и концентрациям минерального сырья в крупных и суперкрупных рудных месторождениях мира. Ниже используются только виды рудного сырья с числом месторождений в базе данных не менее 39. Такой выбор обусловлен желанием включить в обработку данные по алмазам (заведомо аномально глубинный источник рудного вещества, всего 40 месторождений в БД). За группой из нескольких видов руд с числом месторождений 40 и 39 следует про-

Таблица 1. Число месторождений разного вида сырья в использованной версии БД

Вид сырья Число месторождений, N

1 Ag 272

2 Cu 269

3 Au 264

4 Fe 226

5 Zn 193

6 Pb 179

7 Mo 128

8 Sn 102

9 U 100

10 WO3 86

11 Ni 85

12 P2O5 85

13 Co 78

14 TiO2 73

15 Ta2O5 60

16 TR2O3 60

17 ZrO2 59

18 Nb2O5 54

19 AL2O3 44

20 BeO 44

21 V2O5 42

22 Алмазы 40

23 Mn 40

24 U2O 39

25 Sb 39

межуток, и следующий по числу месторождений вид сырья указан уже только в 30 месторождениях, что уже явно недостаточно для использования даже такого робастного подхода как расчет меры Танимото. Итак, рассмотрим месторождения Аи, Си, Со, Fе, Мо, N1, Р, РЬ, Sn, и, Хп, Та, Т1, ^ Zr, Ы, Мп, Sb, АЬ, №, V, редких земель (TR) и алмазов. Число месторождений для каждого из этих видов сырья указано в табл. 1.

Степень близости разных видов минерального сырья естественно охарактеризовать тем, насколько часто данные рудные компоненты встречаются в одних и тех же месторождениях. В качестве количественной меры такой близости используем широко известную меру Танимото—Роджерса, Т [Мандель, 1988], обычно определяемую как

Т (А, В) = (А п В)/( А и В), (1)

где (А п В) — число случаев пересечения признаков А и В (в нашем случае, число случаев сонахожде-ния руд А и В в одном и том же месторождении); (А и В) — объединение множеств А и В (в нашем

Таблица 2. Значения меры близости Танимото

Лё Си Ли Бе Zn РЬ Мо ЯП и N1 Р2О5 Со Алмаз

Ag 1.00 0.41 0.44 0.01 0.49 0.49 0.15 0.05 0.02 0.02 0.00 0.04 0.00

Си 1.00 0.35 0.02 0.25 0.23 0.22 0.07 0.01 0.09 0.00 0.16 0.00

Ли 1.00 0.02 0.24 0.23 0.14 0.01 0.05 0.03 0.00 0.05 0.00

Бе 1.00 0.02 0.01 0.01 0.00 0.02 0.11 0.05 0.08 0.00

Zn 1.00 0.44 0.06 0.08 0.01 0.01 0.00 0.03 0.00

РЬ 1.00 0.06 0.06 0.01 0.01 0.00 0.03 0.00

Мо 1.00 0.04 0.02 0.00 0.00 0.01 0.00

ЯП 1.00 0.00 0.00 0.00 0.00 0.00

и 1.00 0.02 0.11 0.02 0.00

N1 1.00 0.00 0.40 0.00

Р2О5 1.00 0.00 0.02

Со 1.00 0.00

Алмаз 1.00

случае, сумма числа месторождений компонентов А и В, без повторов). В случае, если компонент А всегда сопутствует компоненту В, то есть, если эти компоненты всегда встречаются вместе, очевидно имеем Г(Л, В) = 1. Если же компоненты А и В вместе ни разу не встречаются, имеем Т(Л, В) = 0.

Рассчитанные значения Т для перечисленных выше видов рудного сырья варьируют от близких к 0.5 значений для часто встречающихся вместе пар элементов, таких как Ли и Лё, РЬ и Zn, до близких к нулю и нулевых значений Т. Представляющая эти результаты симметричная матрица значений меры близости Танимото для всей совокупности 25 х 25 элементов достаточна велика, ее трудно поместить на странице. К тому же оценки меры близости, получаемые при малом числе месторождений, менее надежны. В табл. 2 представлен усеченный вариант результатов расчета меры близости Тдля 12 видов сырья (Ли, Лё, Си, Со, Fe, Мо, N1, Р, РЬ, Sn, и, Zn) и алмазов. Отобраны виды месторождений с большим числом месторождений. Ограничение только этими типами месторождениями (кроме специального случая включения месторождений алмазов, как аномально глубинных по источнику рудного вещества) позволяет получить статистически более надежные результаты.

Значения меры близости Танимото, как и следовало ожидать, оказываются наибольшими для часто встречающихся совместно видов рудного сырья, таких как РЬ и Zn, Ли и Лё, Си и №. Легко видеть и отсутствие близости между аномально глубинными алмазами и иными видами рудного сырья (ранее на определенную пространственную изолированность месторождений алмазов указы-

вается в работе [Соболев, Рундквист, 2006]). Согласно данным табл. 2, аномально мала также степень близости между месторождениями фосфора и иными анализируемыми видами рудного сырья (кроме ур

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком