научная статья по теме ГЕОДАННЫЕ КАК СИСТЕМНЫЙ ИНФОРМАЦИОННЫЙ РЕСУРС Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «ГЕОДАННЫЕ КАК СИСТЕМНЫЙ ИНФОРМАЦИОННЫЙ РЕСУРС»

ВЕСТНИК РОССИЙСКОЙ АКАДЕМИИ НАУК, 2014, том 84, № 9, с. 826-829

ОБОЗРЕНИЕ

Б01: 10.7868/80869587314090278

Геоданные отражают свойства объектов, явлений и процессов, происходящих на нашей планете. Они содержат пространственно-временные характеристики территории, предметов, построек, что даёт возможность, сопоставляя их, добывать новые сведения. Авторы статьи показывают, каким образом можно организовать геоданные в сложную систему, являющуюся новым информационным ресурсом.

ГЕОДАННЫЕ КАК СИСТЕМНЫЙ ИНФОРМАЦИОННЫЙ РЕСУРС

В.П. Савиных, В.Я. Цветков

Геоданными называют информацию о процессах и явлениях на земной поверхности, включающую классифицированные и интегрированные в единую систему группы данных. Подчеркнём, что геоданные как обобщение информации включают сведения не только из области наук о Земле, но и из других областей, таких как транспорт, экономика, экология, управление, образование, анализ, искусственный интеллект. Иными словами, термин "геоданные" в современной трактовке вышел за рамки наук о Земле и имеет некоторые особенности.

Технологическая особенность геоданных состоит в том, что их не получают на основе непосредственных измерений — они формируются в результате постобработки измеренной информации. Системная особенность заключается в том,

САВИНЫХ Виктор Петрович — член-корреспондент РАН, президент Московского государственного университета геодезии и картографии. ЦВЕТКОВ Виктор Яковлевич — доктор технических наук, доктор экономических наук, профессор кафедры информатики и информационных систем Московского государственного технического университета радиотехники, электроники и автоматики. vp@miigaik.ru; cvj7@mail.ru

что после их формирования они представляют собой систему, связывающую и согласовывающую данные разных типов и структур в единый комплекс. Информационная особенность обусловлена тем, что геоданные представляют собой новый информационный ресурс, позволяющий решать задачи разных предметных областей [1].

Основой организации геоданных является пространственно-временная информация [2], обобщающая разнообразные сведения для последующего пространственного, экономического, регионального и других видов анализа. Геоданные — это не просто данные, а система данных и информационный ресурс [3]. Они отражают реально существующие пространственные отношения в разных областях, что обеспечивает универсальность их применения при региональном управлении, в экономике, транспорте и т.д. [4]. Геоданные дополняют и интегрируют другие данные, чем обеспечивают решение известных задач новыми методами.

Исходную информацию собирают с помощью разных технологий и систем. Эти первичные сведения отражают характеристики и свойства объектов окружающего мира и могут иметь разные размерности, количество значащих цифр, разрядов, точность. Собранные данные хранятся в виде наборов или файлов, а также образуют связанные совокупности, называемые моделями данных. Для того чтобы можно было обрабатывать разнородные данные и модели данных в одной системе, их нужно упорядочить и свести к единой информационной модели, где они будут дополнять друг друга. Решить такую задачу помогает организация геоданных.

Организацией геоданных называют совокупность технологических процессов сведения разнородных данных и моделей в единую непротиворечивую информационную модель, которую в дальнейшем можно будет эффективно применять в различных технологиях анализа и управления.

ГЕОДАННЫЕ КАК СИСТЕМНЫЙ ИНФОРМАЦИОННЫЙ РЕСУРС

827

Эту особую информационную модель называют информационной основой геоданных. Она позволяет организовать хранение геоданных в базе данных [5]. Таким образом обеспечивается их структурная согласованность, что даёт возможность не только хранить их, но и подвергать автоматизированной обработке.

Для организации геоданных исходные данные должны быть классифицированы, унифицированы, интегрированы и стратифицированы. Последовательность этих процедур показана на рисунке 1. Первым этапом является сбор информации, когда формируются так называемые первичные данные. Особенность сбора информации для организации геоданных состоит в использовании множества качественно разнородных источников информации, и эта информация может относиться не только к пространству, но и к другим областям. На данном этапе можно отметить различие между сбором информации для организации геоданных и сбором информации для специализированных наук. Например, в геодезии собирают специализированные геоданные, которые предназначены для решения геодезических задач в рамках требований геодезических технологий. По существу, это данные, которые используются в одной из наук о Земле. База данных для их хранения является специализированной (геодезической) и жёсткой. Она строится только на реляционных принципах. Интегрированные геоданные, которые собирают методами геоинформатики, предназначены для решения широкого круга задач в разных предметных областях, следовательно, они избыточны. База данных для хранения геоданных является интегрированной (универсальной) и допускает ассоциативные связи, обеспечивающие согласованность с графическим представлением пространственной информации.

Исходная информация включает множество параметров, многие из которых дублируют друг друга. Уменьшение числа данных о реальных объектах достигается применением моделей, сохраняющих основные свойства объектов исследования и не содержащих второстепенных свойств. Поэтому в процесс предобработки входят организация моделей данных и контроль их на точность и непротиворечивость. Одной из особенностей сбора данных является то, что исходные данные могут иметь не только разные размерности, но разные шкалы измерений. Организация геоданных направлена на объединение их в единую систему для хранения и последующей обработки, что даёт возможность комплексного анализа [6] при работе с разнородными исходными данными, зафиксированными в разных шкалах измерений.

Следующий этап организации геоданных — классификация собранной информации, которая служит основой дальнейших действий. Она позволяет относить различные модели и их характеристики к разным классам, подклассам и типам,

Рис. 1. Организация геоданных

что даёт возможность систематизировать исходные наборы данных и использовать свойства классов при последующем анализе информации. Как дополнительный этап классификации в геоинформатике присутствует процедура локализации данных [1], состоящая в привязке их к точкам земной поверхности и задающая совокупность данных с вертикальными связями.

После того, как данные классифицируют, осуществляется их унификация. Разнообразие технологий и методов сбора данных порождает разнообразие их типов, которые впоследствии необходимо обрабатывать. Обрабатывать множество различных данных неудобно и неэффективно. Для упрощения этого процесса разнородные данные приводят к единому структурному виду. Такие данные называют унифицированными. В ходе унификации разрабатывается единая форма данных. Только после этого возможно построение интегрированной модели или интегрированной информационной основы. Унификация не создаёт систему, а преобразует исходную совокупность разнородных и несогласованных данных в другую, уже более согласованную и менее разнородную.

Для обработки информации по единой технологической системе и в единой информационной среде модели данных должны быть объединены на основе правила или метода, отвечающего требованиям оптимального хранения и обработки. Таким объединяющим методом служит интеграция, создающая систему данных вместо совокупности. Необходимо отметить, что геоданные образуют естественную информационную систему данных [7]. Это обусловлено тем, что они отображают реальные объекты и явления земной поверхности, которые расположены не произвольно, а организованно и имеют объективные связи

828

САВИНЫХ, ЦВЕТКОВ

Рис. 2. Стратификация геоданных

друг с другом. Можно сказать, что информация об объектах и явлениях земной поверхности отражает некую систему объектов, где отдельные модели или геоданные являются её элементами. Интеграция — восстановление и/или повышение качественного уровня взаимосвязей элементов системы, а также процесс создания из нескольких разнородных систем единой системы с целью исключения (до технически необходимого минимума) функциональной и структурной избыточности и повышения общей эффективности функционирования. Интеграция приводит к установлению дополнительных связей между данными, к формированию геоданных как системы и создаёт их интегрированную модель.

Интегрированная модель представляет собой не просто сумму информационных частей, её составляющих. Она, как правило, имеет меньший объём физической памяти при увеличении информационной ёмкости по сравнению с информационными моделями, входящими в её состав. Она включает данные о связях и дополнительную служебную информацию, а также дополнительные связи между исходными данными, что создаёт синергетический эффект, как следствие, появляется возможность решения большего количества задач, в частности, комплексного анализа данных и коррелятивного анализа [8]. В реально-

сти многие модели можно отнести к интегрированным, поэтому говорят о степени интеграции. Другим значимым параметром является критерий или аспект интеграции. Он служит основой объединения данных в интегрированную модель. Важное свойство интеграции модели заключается в том, что это не просто объединение данных, а приобретение моделью дополнительных свойств. В результате создаётся модель, обладающая дополнительными свойствами, иначе говоря, имеющая синергетический эффект.

Интегрированная модель является развитием информационной модели. Она более сложная, описывает не только информационные свойства объекта, но и большее число связей между элементами объекта как сложной системы. Большее число связей допускает применение большего числа видов моделирования, что позволяет проводить эффективную обработку геоданных, относящихся к исследуемому объекту. В этом заключается преимущество модели.

Аспект интеграции связан с выбором устойчивого её критерия. Одна из особенностей геоинформатики заключается

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком