научная статья по теме КАЧЕСТВО ИНФОРМАЦИИ О СОСТАВЕ ВОДЫ Геология

Текст научной статьи на тему «КАЧЕСТВО ИНФОРМАЦИИ О СОСТАВЕ ВОДЫ»

ВОДНЫЕ РЕСУРСЫ, 2015, том 42, № 4, с. 433-441

КАЧЕСТВО И ОХРАНА ВОД, ЭКОЛОГИЧЕСКИЕ АСПЕКТЫ

УДК 556;543.067;004.042

КАЧЕСТВО ИНФОРМАЦИИ О СОСТАВЕ ВОДЫ

© 2015 г. О. М. Розенталь*, Л. Н. Александровская**

*Институт водных проблем РАН 119333 Москва, ул. Губкина, 3 E-mail: orosental@rambler.ru **Московский институт электромеханики и автоматики 123298 Москва, Авиационный пер., 7 Поступила в редакцию 12.02.2014 г.

Принятие водохозяйственных решений основано на оценке показателей качества воды. Непостоянство этих показателей в пространстве и во времени приводят к необходимости использования статистических характеристик — достоверности, отражающей степень уверенности в безошибочности заключений органов водного контроля и экономической эффективности, отражающей приемлемость выбранного метода получения информации. Предложены алгоритмы определения указанных характеристик. Показано, что наряду с такими известными показателями достоверности, как ошибки первого рода и ошибки второго рода, необходимые при проверке статистических гипотез для конструктивного диалога между участниками водных отношений, полезен учет погрешности статистического решения, называемой также порогом различимости. На практических примерах продемонстрирована возможность установления экономически приемлемого уровня перечисленных характеристик качества информации путем обработки результатов лабораторных исследований.

Ключевые слова: погрешность оценки, разброс значений контролируемого показателя, достоверность водно-экологической информации, строгое ограничение контролируемого показателя, нестрогое ограничение, порог различимости, эффективность контроля.

DOI: 10.7868/S0321059615040136

Информация о составе природных, сточных, питьевых и других вод, необходимая для водопользования и управления водным фондом, имеет повышенное значение в условиях ресурсоза-тратного уклона российской экономики. Бизнес, власть и общество нуждаются в том, чтобы точно знать, соответствует ли используемая или сбрасываемая вода требованиям, установленным стандартами, регламентами, законами, договорными обязательствами. Согласно [12], "экологические данные, прямые и косвенные результаты их переработки...составляют важную часть современного информационного поля со всеми вытекающими отсюда последствиями". Однако, поскольку определить истинные количественные значения контролируемых величин невозможно, заинтересованные стороны в качестве таковых нередко принимают результаты лабораторных исследований. Вероятность же ошибочных решений о качестве воды исчисляется десятками процентов [3] вследствие вполне объективных и распространенных причин — соизмеримости среднего значения контролируемых величин с их

среднеквадратическим отклонением и с погрешностью измерения, установленной аттестованными методиками измерений на уровне 50—70% и выше. Поэтому водохозяйственные решения принимаются в условиях неопределенности, что является крупной причиной технологических нарушений, брака водоемкой продукции, нежелательных техногенных явлений и водных споров.

Ужесточение требований к водопользованию в России и в мире предполагает оценку и регулирование таких показателей качества водно-экологической информации, как ее достоверность, характеризующая степень уверенности в правильности заключений о составе воды [4], и экономическая эффективность, характеризующая приемлемость выбранного метода обработки лабораторных данных.

Отсутствует единая методика оценки указанных величин. Так, например, одни авторы рассчитывают достоверность как "величину, обратно пропорциональную вероятности ошибки", а другие — как "разность между единицей" и этой вероятностью [6, 8—10]. Подобные подходы мало-

Л4в0) 1 \ / 1 8 и—\ /—*-1 1 \ / 1 1 \ / I Улда

1 \ 1 1 в У^ 1 / 1 1 л 1 \ а 1 /^С 1

т3

т3 + 8

Рис. 1. Иллюстрация к задаче о принятии альтернативной гипотезы.

пригодны для оценки показателей качества водно-экологической информации из-за повышенной вероятности ошибок в этом случае.

Процесс получения информации о качестве воды складывается из трех этапов: планирования, выполнения измерений и обработки лабораторных данных. На этапе планирования, в зависимости от поставленной цели, выбирается уровень метрологического обеспечения поставленной задачи и периодичность измерений. Целью также может служить исследование статистических характеристик: законов распределения вероятностей контролируемых показателей, обеспеченности, надежности технологий водоподготовки и т.д. Такое исследование базируется на различных методах обработки измерительной информации, что, в свою очередь, требует проведения измерений в различных шкалах. Так, для обработки измерительной информации простейшими методами допускового контроля достаточно фиксирования попадания результата измерения в допуск. При этом используется простейшая (метрологический термин — "слабая") номинальная шкала измерений. Если же фиксируется конкретный результат измерений относительно границ допуска, это — уже более сильная шакала отношений. При обработке таких данных методом допускового контроля происходит потеря информации и результаты обработки менее достоверны. Следует искать другие методы контроля, использующие всю измерительную информацию с получением наиболее достоверных выводов.

Таким образом, план получения измерительной информации, непосредственно измерения и их обработка взаимосвязаны и составляют единую информационную систему, отдельные показатели которой (достоверность, точность оценивания статистических характеристик и пр.) определяют качество информации об объекте исследования. Основный показатель качества

информации при этом — достоверность принимаемых на ее основе решений.

Оценку достоверности информации о меняю -щемся по случайному закону составе воды можно свести к задаче проверки статистических гипотез, в простейшем случае — гипотезы о том, что математическое ожидание т нормально распределенной генеральной совокупности имеющихся данных не превышает заданное значение тз при известной дисперсии а 0. Тогда выборочная оценка (состоятельная, несмещенная, эффективная)

среднего: г =1 г (п — объем выборки, г —

п '=1

результат /-го измерения) — имеет нормальный закон распределения вероятностей с математиче-

2

- СТ О

ским ожиданием т и дисперсией —0 и соответ-

п

ствующая статистика будет иметь стандартное

нормальное распределение

г - т

^ и(0; 1). Пра-

Сто/4П

вило принятия нулевой гипотезы Н0: т < тз — запишется в следующем виде:

г - тя

ст,

Яп

< и

1-а>

(1)

где и1-а — квантиль стандартного нормального распределения уровня значимости а, равного ошибке 1-го рода (ошибочного признания несоответствия установленным требованиям). При этом граничное правило принятия альтернативной гипотезы Н1: т = тз + 8 — имеет следующий вид:

г - тз -5

= и

р>

(2)

сто/ Гп

где в — ошибка второго рода, 8 — порог различимости между нулевой и альтернативной гипотезами.

Следовательно, при принятии гипотезы т = тз с вероятностью в может быть принята гипотеза т = тз + 5 (рис. 1). Из (1) и (2) следует:

—4П = «1_а - ир.

(3)

Нетрудно видеть (рис. 2), что разность и1-а - ир соответствует вероятности 1— (а + р) — величине, которая в [1, 9] рассматривается как "интуитивно очевидный" показатель достоверности информации [1]. Ограниченность такого подхода связана с тем, что в данной постановке задачи не учитывается нелинейный характер зависимостей и1-а = /1(а), и в = / (в) и взаимосвязь а и в.

Развитая схема позволяет, в частности, оценить взаимозависимость ошибок 1-го рода (риска поставщика) и 2-го рода (риск водопотребителя), а также количественную связь этих величин с порогом различимости. Пусть, например, а = в = 0.1,

так что —л/л = и1-а - «р = 2 х 1.28 = 2.56. Для того а о

чтобы сохранить это значение и снизить риск поставщика до уровня а = 0.05 (и1-а = 1.645), необходимо принять «р = —0.915, при котором в = = 0.18. Как видно, с уменьшением значения а в 2 раза значение в возрастает в ~1.8 раз, тогда как по линейной зависимости 1 — (а + в) в должно возрасти в 1.5 раза с одновременным повышением порога различимости — л/л до 1.645 + 1.037 =

а 0

= 2.682. Если же а = 0.01 (и1-а = 2.327), то для сохранения значения —л/л необходимо принять

а 0

«р = —0.233, при котором в = 0.41, т.е. в возрастает в ~4 раза, тогда как при линейной зависимости 1 - (а + в) в возрастет только в ~2 раза. При этом

—л/л = 2.327 + 0.878 = 3.205.

ст 0

Таким образом, снижение риска поставщика приводит к повышению риска потребителя. И хотя такое повышение сравнительно невелико в случае линейного подхода к оценке достоверности информации, оно сопровождается увеличением порога различимости. Условие наименьшего значения этого порога — равенство ошибок первого и второго рода. Поэтому показателем достоверности информации, скорее нежели величина 1 — (а + в), является 8 или — л/л. И хотя этот

вывод вызывает сомнения вблизи точки—л/л = 0,

где а = в = 0.5 (при принятии решения т = тз без учета погрешности измерений), все же полезен учет порога различимости в качестве характеристики ошибки статистического решения, "разделение" которой на слагаемые можно проводить на основе сопоставления потерь, связанных с рисками а и в. Благодаря этому для регулирования достоверности информации, оцениваемой в рамках теории проверки статистических гипотез, удобно использовать вытекающее из (3) условие

с; и1-а - «в

5 = а п

. Как видно, при этом легко обос-

Рис. 2. Иллюстрация к оценке достоверности информации.

Ситуация меняется, если суждение о качестве воды выносится по результатам единичных измерений Если при этом не фиксируется разница между результатом измерения и границей поля допуска, то для принятия решения не требуются какие-либо вычисления или учет априорной информации. Для оценки достоверности в этих случаях необходимо знание закона распределения контролируемого показателя и закона распределения вероятности случайной погрешности измерений (принимается, что систематическая погрешность отсутствует). К сожалению, даже если второй закон можно считать известным, например гауссовым, первый чаще всего не опре

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком