научная статья по теме ТИПЫ ПОЧВЕННЫХ АТРИБУТИВНЫХ БАЗ ДАННЫХ Сельское и лесное хозяйство

Текст научной статьи на тему «ТИПЫ ПОЧВЕННЫХ АТРИБУТИВНЫХ БАЗ ДАННЫХ»

ПОЧВОВЕДЕНИЕ, 2013, № 10, с. 1214-1221

ГЕНЕЗИС И ГЕОГРАФИЯ ПОЧВ

УДК 631.4

ТИПЫ ПОЧВЕННЫХ АТРИБУТИВНЫХ БАЗ ДАННЫХ*

© 2013 г. Н. И. Белоусова1, Ю. Л. Мешалкина2, И. И. Васенев3

Почвенный институт им. В.В. Докучаева, 119017, Москва, Пыжевский пер., 7

e-mail: belousova.ni@mail.ru 2Факультет почвоведения МГУ им. М.В. Ломоносова, 119191, Москва, Ленинские горы

e-mail: jlmesh@list.ru 3РГАУ-МСХА им. К.А. Тимирязева, 127550, Москва, ул. Тимирязевская, 49 e-mail: vasenev@timacad.ru Поступила в редакцию 21.11.2011 г.

Рассмотрены два типа почвенных атрибутивных баз данных: "рабочий стол" и "камера хранения". Они различаются по своему основному назначению: сбор и хранение информации или решение конкретных научных (или производственных) задач; по функционированию и свойствам (объему включаемой информации, приоритетам при создании баз, продолжительности существования и др.). Обсуждаются проблемы потери информации и накопления ошибок при создании почвенных баз данных. Показано, что территория России исследована неравномерно. Предложены градации географических адресов почвенных разрезов по степени точности и полноты. Положение разреза относительно факторов почвообразования может рассматриваться как специфический, "ландшафтный" адрес. Ландшафтный адрес, кроме своего прямого назначения, позволяет расширять и уточнять географический адрес.

Ключевые слова: хранение почвенной информации, свойства баз данных, потеря информации, типы адресов.

DOI: 10.7868/S0032180X1310002X

Базы данных (БД) в отечественном почвоведении начали создавать в 60-х годах прошлого века. Их первоначальное появление и бурное развитие явилось естественной реакцией на укрепляющееся в почвенной науке представление о пространственной неоднородности и организации почвенного покрова [8, 9, 11, 26]. Развитие этих представлений требовало обширной информации. Практически сразу стали возникать атрибутивные базы данных во всех областях и направлениях почвоведения. За полувековой период развития почвенные базы данных прошли громадный путь от "случайных выборок" с объемом порядка 10— 100 разрезов до многотысячных баз (банков) данных регионального и федерального уровня, превратившись в информационное ядро геоинформационных систем [2, 10, 18, 21, 29]. История развития почвенных баз данных как составной части информационных систем и почвенной информатики в целом подробно освещена Рожковым [17] и Колесниковой [10]. Несмотря на большое число работ, посвященных созданию баз данных в почвоведении, в них не затрагивается ряд аспектов,

*Работа выполнена при финансовой поддержке гранта РФФИ 11-04-02089а, а также гранта Правительства РФ — 11.G34.31.0079.

характеризующих "содержательную" сторону собираемой информации. Для почвоведов, использующих для решения современных научных теоретических и практических проблем атрибутивные базы данных, первоначально полученных в разные исторические периоды, в разных научных школах и классификационных системах, обсуждение поставленных вопросов представит интерес.

Предлагаем обсудить следующие моменты: различия почвенных атрибутивных баз данных по назначению и целям; накопление ошибок; потеря информации при создании баз данных; точность адресов и типы адресов в базах данных.

В настоящей статье мы опираемся на опыт работы с БД Boreal [6], которую можно рассматривать как аналог больших БД по таким параметрам, как охват обширной территории и большого числа объектов, и объединение разнокачественной информации, полученной в разные периоды развития науки представителями разных почвенных школ. Почвенные БД могут быть сравниваемы по разным аспектам. Для их характеристики необходимо выработать определенные унифицированные понятия.

Назначение и цели БД. Ранее [5] все почвенные атрибутивные БД в зависимости от их

Таблица 1. Особенности двух почвенных атрибутивных БД

Параметр "Камера хранения" "Рабочий стол"

Цели создания 1. Инвентаризация накопленной информации 2. Хранение информации 3. Возможность интегрирования с международными БД Решение конкретных научных или производственных задач

Собираемые материалы Весь имеющийся материал, в том числе а) в публикациях; б) в архивах научных учреждений; в) в диссертациях; г) в отчетах заповедников, опытных станций, производственных организаций Только материалы, отвечающие поставленным задачам и удовлетворяющие определенным автором ограничениям

Объем БД Неограниченный Ограничен и определяется поставленными задачами

Время "жизни" Теоретически неограниченно, в реальности — пока существуют человеческие и финансовые ресурсы для ее поддержания Ограничено, определяется временем решения поставленных задач

Пополнение БД Теоретически неограниченно Путем снятия ограничений, связанных с изменением или развитием целей создания БД

Накопление ошибок Происходит постоянно вследствие а) наличия ошибок в исходных данных; б) субъективности экспертизы данных; г) унификации информации; г) перекодирования разрезов и др. То же; ошибки контролируются и минимизируются сформулированными требованиями

назначения были разделены нами на две большие группы и названы "камера хранения" и "рабочий стол". Их сравнительная характеристика обобщена в табл. 1. Назначение БД типа "камера хранения" — "библиотечное": сбор, хранение, систематизация и быстрый поиск нужных материалов. Часто такие БД так и называются "библиотеки" [1]. К этому типу относятся Информационная база классификации, разработанная более 20 лет назад в Почвенном институте им. В.В. Докучаева [28] и являвшаяся составной частью АИС МЕРОН [16, 27]; создаваемая в настоящее время общенациональная Почвенно-географическая БД России в масштабе 1 : 2500000 (ПГБДР) [10, 18, 29], а также многие зарубежные БД (обзор зарубежных баз данных приведен в статье Колесниковой с соавт. [10]). Часто такие БД самим фактом своего создания выполняют функцию инвентаризации существующих почвенных ресурсов, как, например, было с Глобальной почвенной БД (ISRIC WISE [30]). Помимо уже названных, одной из основных задач национальных БД, в том числе ПГБДР [29], является совместимость с существующими и разрабатываемыми международными системами.

Второй тип БД — "рабочий стол" — представляет собой тематические БД; их основная цель — решение одного или нескольких научных или практических вопросов. К этому типу относится подавляющее большинство создаваемых БД в различных областях почвоведения (например, [12—14, 20]), в том числе и БД Boreal [6].

Объем баз данных. В БД типа "камера хранения" обычно собирается весь доступный материал. Так, Шоба с соавт. [29] рекомендуют включение в ПГБД всех доступных материалов, содержащихся в публикациях, архивах научных учреждений, диссертациях, отчетах заповедников, опытных станций, производственных организаций и др.

Отличительной особенностью БД типа "рабочий стол" является сформулированные ограничения на собираемый материал, обусловленные задачами создания конкретной БД. Эти ограничения могут касаться любого аспекта: ограничиваться может географический, генетический и/или экологический набор почв и количество разрезов, отбираемых в базу данных, а также набор параметров, которыми эти разрезы описаны. Примером четкого формулирования ограничений на собираемый материал может служить создание БД Boreal [5, 6].

Другой особенностью БД "рабочий стол", имеющей отношение к количеству собираемых материалов, является рассмотренное ранее [5] поэтапное формирование базы, которое позволяет проводить научный анализ данных еще до окончательного заполнения базы материалами в полном объеме. Примером поэтапного анализа БД Boreal являются работы [3, 4, 23].

В целом БД типа "рабочий стол" имеют ограниченный объем, часто много меньший, чем базы "камера хранения". Например, Грей [7] сообщает

о том, что из всех 4382 разрезов, содержащихся в Глобальной почвенной базе данных (ISRIC WISE), только 1670 (38%) удовлетворяло сформулированным в работе требованиям.

Пополнение БД. БД обоих типов — открытые, то есть свободно могут пополняться. При этом материал "камеры хранения" обычно расширяется за счет новых объектов, реже — за счет количества признаков. Добавление новых объектов или какие-то внешние события, например, принятие новой версии классификации почв могут привести к необходимости расширения количества признаков и/или их перекодировки. Теоретически объем БД "камера хранения" может неограниченно увеличиваться.

Пополнение БД "рабочий стол" происходит преимущественно за счет частичного снятия первоначально введенных ограничений и возможно как путем дополнения объектов, так и расширения количества характеризуемых параметров. В последнем случае не целесообразно объединение в одной базе данных "рабочий стол" характеристик, резко различающихся по встречаемости в исходных источниках. Так, групповой и фракционный состав гумуса, минералогический состав всего почвенного субстрата и илистой фракции, микроморфологическое строение и многие другие свойства почв анализируются несоизмеримо реже, чем "массовые" показатели. Напротив, в специализированных работах часто отсутствуют (или присутствуют в ограниченном наборе) общепринятые и широко распространенные характеристики почв. Например, исходя из названных соображений, БД Boreal была дополнена самостоятельной подбазой "Качественный состав гумуса".

Взаимоотношение выделенных типов БД. Границы между характеризуемыми типами БД не жесткие. Расширение базы данных "рабочий стол" вряд ли может быть сколь угодно большим и бесконечным, так как добавление информации увеличивает затраты на ее верификацию и гармонизацию. При значительном увеличении объема такая БД меняет свои функции и автоматически переходит в тип "камера хранения". С другой стороны, БД "рабочий стол" может быть сформирована путем извлечения материала, удовлетворяющего определенным условиям, из более общей БД "камера хранения". Так используются в настоящее время БД "камера хранения" гидрологических свойств европейских почв HYPRES [34] или Глобальная почвенная БД (ISRIC WISE). Например, извлеченная из последней БД информация была оформлена в самостоятельные БД (типа "рабочий стол"), одна из кот

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком