научная статья по теме АНАЛИЗ ИСПОЛЬЗУЕМЫХ ФОРМАТОВ ФАЙЛОВ ДЛЯ ПРЕДСТАВЛЕНИЯ ВЕКТОРНЫХ ДАННЫХ В ГЕОГРАФИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «АНАЛИЗ ИСПОЛЬЗУЕМЫХ ФОРМАТОВ ФАЙЛОВ ДЛЯ ПРЕДСТАВЛЕНИЯ ВЕКТОРНЫХ ДАННЫХ В ГЕОГРАФИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ»

Олейник А.С., кандидат технических наук

Болтачев Э. Ф., соискатель (Академия управления Министерства внутренних дел Российской Федерации)

АНАЛИЗ ИСПОЛЬЗУЕМЫХ ФОРМАТОВ ФАЙЛОВ ДЛЯ ПРЕДСТАВЛЕНИЯ ВЕКТОРНЫХ ДАННЫХ В ГЕОГРАФИЧЕСКИХ ИНФОРМАЦИОННЫХ СИСТЕМАХ

В статье рассматриваются форматы файлов для представления векторных данных в географических информационных (геоинформационных) системах. Приведен перечень таких форматов, поддерживаемых многими геоинформационных систем.

Благодаря поддержке большинством программных продуктов наиболее распространенным отмечается формат ShapeFile, состоящий из набора одноименных файлов, хранящийся в единой директории. Каждая такая совокупность файлов предназначена для хранения определенного типа геометрических фигур и соответствующих атрибутивных данных. К данным типам объектов относятся точка, множество точек, линейная форма, площадная форма, набор расширенных форм, набор трехмерных форм, покрытия и пустая форма.

Далее статья описывает организацию формата ShapeFile. Обязательную совокупность файлов составляют три одноименных файла, которыми являются главный файл, индексный файл и файл базы данных. Главный файл предназначен для хранения заголовка файла, заголовков записей и содержимого данных записей. Индексный файл хранит сведения о смещении соответствующей записи в главном файле относительно начала главного файла для поиска формы по номеру ее записи. Файл базы данных хранит атрибутивных данные.

На примере типа объекта «Площадная форма» проведен анализ структуры формата ShapeFile. Анализ позволил отобразить обязательные и необязательные элементы, константные и переменные записи, а также типы данных, используемые при записях в данном формате. Структуру главного файла условно можно разделить на восемь элементов, состоящих из полей для хранения константного значения, нулевых значений, длины главного файла, версии файла, типа объекта, обязательных ограничений координат, факультативных ограничений координат и собственно записей переменной длины об описываемых объектах. Индексный файл также соответствует общей структуре главного файла, а файл базы данных связан с главным файлом в связи «один к одному».

Отмечена краткая характеристика и назначение необязательных файлов формата ShapeFile, а также некоторые технические особенности практического применения рассмотренного формата.

Ключевые слова: географическая информационная система (ГИС), формат векторных данных, ShapeFile.

ANALYSIS OF THE FILE FORMATS USED TO REPRESENT VECTOR DATA IN GEOGRAPHICAL INFORMATION SYSTEMS

This article discusses the file formats for submission of vector data in geographic information (geoin-formation) systems. Is a list of formats supported by many GIS.

With the support of the majority of software products most widely celebrated format ShapeFile, consisting of a set of similar files stored in a single directory. Each set offiles is designed to store a certain type of geometric shapes and associated attribute data. For these types of objects are point, multipoint linear form, areal form a set of extended forms, a set of three-dimensional shapes, coatings and empty form.

Next article describes the organization format ShapeFile. Mandatory set of files is composed of three of the same name of the file, which is the main file, the index file and the database file. The main file is designed to store the file header record headers and the content of such records. The index file stores information about the displacement of the corresponding record in the main file with respect to the main file for the search form to the number of its entries. The database file stores the attribute data.

On the example of the type of object "square shape" the analysis of structure format ShapeFile. The analysis will display the mandatory and optional elements, constant and variable record and data types used

in the records in this format. Master file structure can be divided into eight elements, consisting of fields to store constant values, zero values, the length of the main file, file version, object type, mandatory limits coordinate optional restrictions coordinates and proper records of variable length describes the object. The index file also corresponds to the general structure of the main file and the database file associated with the main file because "one to one".

Marked by a brief description and purpose of the optional file format ShapeFile, as well as some of the technical features of the practical application of the considered format.

Keywords: Geographic Information System (GIS) format vector data, ShapeFile.

1. Введение

Векторный формат пространственных данных в ГИС цифровое представление точечных, линейных и полигональных объектов осуществляется в виде набора координатных чисел. Векторные модели представления географических данных делятся на два типа: векторно-топологическое и векторно-нетопологическое [4].

На сегодняшний день большинство геоинформационных систем, таких как ArcGIS, GvSIG, Quantum GIS, GRASS и др., стараются поддерживать большинство форматов файлов для представления векторных данных. В таблице ниже приведён неисчерпывающих перечень таких файлов.

Таблица 1

Перечень форматов файлов для представления векторных данных.

№ п/п Наименование Расширение файла

1 ESRI shapefile * shp

2 Spatial Data Transfer Standard [SDTS] * catd, *.ddf

3 S-57 Base file * 000

4 Microstation DGN * dgn

5 VRT (виртуальный растр) * vrt

6 Atlas BNA * bna

7 CSV * csv

8 Geography Markup Language [GML] * gml

9 GPS exchange Format [GPX] * gpx

10 Keyhole Markup Language [KML] * kml

11 GeoJSON * geojson

12 INTERUS 1 * itf, *.xml, *.ili

13 INTERUS 2 * itf, *.xml, *.ili

14 Generic Mapping Tools [GMT] * gmt

15 SQLite * sqlite, *.db

16 ESRI Personal GeoDatabase * mdb

17 ESRI File GeoDataBase * gdb

18 X-Plane/Flightgear apt.dat, nav.dat, fix.dat, awy.dat

19 Покрытие Arc/Info ASCn *.e00

20 AutoCAD DXF *.dxf

21 Geoconcept *.gxt, *.txt

22 GeoRSS *.xml

23 GDAL/OGR VSIFileHandler *.zip, *.gz, *.tar, *.tar.gz, *.tgz

2. Анализ структуры представления данных в формате ShapeFile

Одним из наиболее распространенных форматов стал ShapeFile (англ. Shape - форма, фигура), который представляет собой векторную нетопологическую модель представления пространственной информации. Формат данных ShapeFile поддерживается большинством открытых и пропритарных программных продуктов как для чтения, так и для записи географических данных. Данный формат разработан компанией Esri в начале 90-х годов с целью ин-тероперабельности между продуктами Esri и другими программами [5].

Формат ShapeFile включает набор файлов, хранящийся в едином каталоге (директории) с одинаковым именем, но разными расширениями [1]. Каждый такой набор одноименных файлов позволяет хранить только свой тип геометрических объектов и связанную с данным типом атрибутивную информацию, в совокупности образующих собой тип формы (Табл. 2).

Таблица 2

Набор типов форм ShapeFile.

№ п/п Тип формы Обозначение Описание

1. Точка Point Объект, состоящий из одной точки.

2. Множество точек Multipoint Объект, состоящий из нескольких точек.

3. Линейная форма PolyLine Объект, состоящий из нескольких линий (ломаных), которые могу соприкасаться и пересекаться.

4. Площадная форма Polygon Полигон, который может состоять из нескольких точек с пустотами.

5. Набор расширенных форм PointM MultiPointM PolyLineM PolygoneM Объект с каким-либо измеренным значением. Для каждой задаваемой точки, кроме ее координат X и У, указывается вещественное число М, называемое «мерой» этой точки.

6. Набор трехмерных форм PointZ MultiPointZ PolyLineZ PolygoneZ Объект в 3-х мерном пространстве (XYZ). Наряду с величинами Х,У и М, для каждой задаваемой точки указывается координата Z.

7. Покрытия MultiPatch Триангуляционные поверхности, которые описывают сложные трехмерные поверхности

8. Пустая форма NullShape Не соответствует никакой графический объект, но с ним может быть связана атрибутивная информация

Основой формата ShapeFile являются три обязательных файла с расширениями: *^р, и *.ёЬГ, из которых первые два хранят информацию в двоичной форме (би-

нарный файлы). Главным файлом является файл с расширением «^р» ^ИР-файл), который представляет собой файл прямого доступа, содержащий заголовок файла, заголовки записей и содержимое записи, каждая из которых описывает объект при помощи списка вершин (Таблица 3).

Таблица 3

Организация главного файла

Заголовок файла

Заголовок записи Содержимое записи

Заголовок записи Содержимое записи

• • • • • •

Заголовок записи Содержимое записи

Файл с расширением «.shx» (SHX-файл) является индексным и предназначен для поиска формы по номеру ее записи. SHX-файл для каждой записи о форме, хранящейся в главном файле, содержит данные о смещении соответствующей записи в главном файле относительно начала главного файла.

Файл с расширением «.dbf» (DBF-файл) представляет собой файл для хранения содержащихся в формате dBase атрибутивных данных, связанных с формами SHP-файла. Каждой форме SHP-файла соответствует запись DBF-файла, номер которой соответствует номеру формы в SHP-файле, т.е. каждая запись базы данных находится в связи «один к одному» с соответствующей записью объекта.

Длина заголовка главного файла составляет 100 байт (50 16-битных слов). Начиная с нулевого байта первые 4 байта содержат число 9994 (в 16-битном формате: 270A), с 4 по 23 байты не используются и содержат нули, в 4-х байтовой ячейке начиная с 24 содержится информация о длине SHP-файла, с 28 по 31 байт - версия SHP-файла, с 32 по 35 байт - тип формы, с 36 по 99 байт содержатся значения на ограничения координат, используемые в SHP-файле (Рисунок 1.).

Y Y

Тип данных: Integer Тип данных: Double

Рис. 1. Пример заголовка SHP-файла

Длина заголовка каждой записи главного файла составляет 8 байт (четыре 16-битных слова), где первые 4 байта номер записи ( 00 00 : 00 01 ) и следующие 4 байта -длина содержимого записи об объекте ( 00 00 : 00 48 ), т.е. данные заняли 48 16-битных слов или 72

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком