научная статья по теме РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ДАННЫХ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ С ПРИВЛЕЧЕНИЕМ ТЕХНОЛОГИЙ ОБЪЕКТНО-РЕЛЯЦИОННЫХ БАЗ ДАННЫХ Общие и комплексные проблемы естественных и точных наук

Текст научной статьи на тему «РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ДАННЫХ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ С ПРИВЛЕЧЕНИЕМ ТЕХНОЛОГИЙ ОБЪЕКТНО-РЕЛЯЦИОННЫХ БАЗ ДАННЫХ»

ВЕСТНИК ЮЖНОГО НАУЧНОГО ЦЕНТРА Том 9, № 3, 2013, стр. 61-65

ПОЛИТОЛОГИЯ

УДК 316.334.552+912(470.6)

РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ДАННЫХ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ С ПРИВЛЕЧЕНИЕМ ТЕХНОЛОГИЙ ОБЪЕКТНО-РЕЛЯЦИОННЫХ БАЗ ДАННЫХ

© 2013 г. В.П. Зорин1

Предложена оригинальная структура базы данных социологических исследований на основе технологии объектно-реляционных баз данных (ОРБД), совместимая с геоинформационными системами (ГИС) и обладающая повышенной устойчивостью.

Ключевые слова: технологии баз данных, ГИС, социальные исследования.

Социологический мониторинг является важным инструментом анализа и прогнозирования состояния общества, необходимым для осуществления механизма обратной связи и принятия обоснованных управленческих решений в области экономической и социальной политики.

Социологическое исследование должно носить системный характер и включать комплекс организационных процедур и алгоритмов, целью которых является получение надежной информации об изучаемом явлении или процессе.

Стремительный прогресс в области коммуникаций и компьютерных технологий, который наблюдается в последние два десятилетия в связи с развитием микропроцессорной техники и глобальных информационных систем, открывает новые возможности для развития социологических исследований. В качестве таковых следует отметить возможности интернет-технологий и географических информационных систем.

Социологическое исследование включает в себя ряд содержательно взаимосвязанных этапов [1]:

- методологическая и методическая подготовка (составление анкет, опросных листов, определение классифицирующих признаков, групп респондентов, проведение инструктажа и т.п.);

- сбор первичной социологической информации (проведение анкетирования, опросов, обследований);

- сбор данных официальной (государственной, муниципальной и ведомственной) статистики;

- скрининг собранной информации и ее предварительная статистическая обработка с использованием пакетов прикладных программ;

1 Адыгейский государственный университет, 385000, Республика Адыгея, г. Майкоп, ул. Первомайская, 208.

- математический и содержательный анализ данных, включающий извлечение информации (data mining), ее визуализацию, подготовку отчета, формулирование выводов и рекомендаций.

Последние два этапа наиболее сложны, так как опираются на математические методы, недостаточное понимание сути которых может привести к неверным выводам. На сегодня существует большое количество программ, а также интернет-ресурсов, позволяющих проводить обработку социологической информации разной степени сложности, а также интеллектуальный анализ данных. Программы, используемые в социологических исследованиях, можно условно разделить на две группы.

1. Программы обработки первичной социологической информации

SPSS (Statistical Package for the Social Sciences). Постоянно совершенствуемая компьютерная программа для статистической обработки данных, один из лидеров рынка в области коммерческих статистических продуктов, предназначенных для проведения прикладных исследований в социальных науках.

Vortex 8. Основные функции Vortex:

- разработка инструментов сбора данных, например опросов, анкет, бланков интервью;

- ввод информации, собранной в ходе исследования;

- обработка и анализ, полученной информации;

- визуализация данных в виде различных графиков, таблиц, диаграмм;

- импорт данных в другие программы.

2. Программы статистического анализа (STATISTICA, STATGRAPHICS, SAS)

Наибольшую популярность приобрел пакет для всестороннего статистического анализа STATISTICA. Он имеет модульную структуру. Каждый модуль содержит уникальные процедуры и методы анализа данных, включая анализ временных рядов, модели нейронных сетей и др.

Для статистического анализа также широко используются табличные редакторы. Большинство табличных редакторов имеют встроенные блоки математических и статистических функций. Существуют как коммерческие (Microsoft Office Excel), так и свободно распространяемые программные пакеты (Open Office.org Calc).

Перечисленные пакеты обладают достаточным для проведения самостоятельного социологического исследования набором функций, но их использование затруднительно в рамках системы.

Удобной базой для информатизации социологических исследований могут служить геопорталы, объединяющие возможности географических и традиционных информационных систем. При этом социологические базы данных получают пространственную привязку, что повышает их информативность и позволяет лучше контролировать качество выборки. Использование геопорталов в социологических исследованиях может проводиться в двух направлениях. Во-первых, пользователям геопорталов может быть предложено заполнять в режиме онлайн-опросники, выложенные непосредственно на сайте. Во-вторых, с помощью геопортала могут формироваться фокус-группы из пользователей, желающих принять участие в социологическом мониторинге, которые получают определенные пароли и дополнительные возможности. При этом в открытом доступе формируются карты, показывающие пространственное распределение, динамику, активность и характер ответов на конкретные вопросы.

Кратко остановимся на терминологии и типологии баз данных. Базы данных (БД) представляют собой именованную совокупность данных, отражающую статус объектов (в данном контексте - респондентов) и их отношений (в данном контексте -ответов на заданные вопросы). С базой данных неразрывно связана система управления базами данных - совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями.

Обычно различают три класса (модели) организации БД: иерархические, сетевые и реляционные. Термин "модель" в данном случае рассматривается как структура, позволяющая количественно и ка-

чественно оценивать на логическом уровне организацию хранения и доступа к данным.

Иерархическая модель данных имеет иерархическую структуру, т.е. каждый из элементов связан только с одним стоящим выше элементом, но в то же время на него могут ссылаться один или несколько стоящих ниже элементов. В рамках иерархической модели используются более конкретные понятия: "элемент" (узел); "уровень" и "связь". Узел чаще всего представляет собой атрибут (признак), описывающий некоторый объект. Иерархическая модель схематически изображается в виде графа, в котором каждый узел является вершиной. Эта модель представляет собой совокупность элементов, расположенных в порядке их подчинения от общего к частному и образующих граф - дерево с иерархической структурой.

Сетевая модель использует ту же терминологию, что и иерархическая модель: "узел", "уровень" и "связь". Единственное отличие между иерархической и сетевой моделями данных заключается в том, что в последней каждый элемент данных (узел) может быть связан с любым другим элементом (узлом).

Основная идея реляционной модели данных заключается в том, чтобы представить любой набор данных в виде двумерного массива - таблицы. Реляционные модели данных, или реляционные базы данных, являются в настоящее время основным способом в проектировании и организации информационных систем.

Различают еще три дополнительных модели организации БД.

Объектно-ориентированная модель данных -это БД, в которой данные оформлены в виде моделей объектов, включающих прикладные программы, которые управляются внешними событиями. Результатом совмещения возможностей (особенностей) баз данных и возможностей объектно-ориентированных языков программирования являются Объектно-ориентированные системы управления базами данных (ООСУБД). ООСУБД позволяет работать с объектами баз данных так же, как и с объектами в программировании на объектно-ориентированном языке программирования. ООСУБД расширяет языки программирования, прозрачно вводя долговременные данные, управление параллелизмом, восстановление данных, ассоциированные запросы и другие возможности.

Объектно-реляционная модель данных является реляционной моделью с некоторыми свойствами объектной модели данных, или наоборот.

Объектно-реляционная БД - реляционная БД, поддерживающая технологии, реализующие объектно-ориентированный подход:

РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ДАННЫХ СОЦИОЛОГИЧЕСКИХ ИССЛЕДОВАНИЙ

63

- инкапсуляцию;

- полиморфизм;

- наследование;

- составные типы.

Постреляционная модель данных представляет собой расширенную реляционную модель, снимающую ограничение неделимости данных, хранящихся в записях таблиц. Постреляционная модель данных допускает многозначные поля, значения которых состоят из подзначений. Набор значений многозначных полей считается самостоятельной таблицей, встроенной в основную. Помимо обеспечения вложенности полей постреляционная модель поддерживает ассоциированные многозначные поля (множественные группы). Совокупность ассоциированных полей называется ассоциацией. На длину полей и количество полей в записях таблицы не накладывается требование постоянства. Это означает, что структура данных и таблиц имеет большую гибкость.

В общем случае процесс проектирования БД включает в себя следующие этапы [2]:

1) информационно-логическое (инфологическое) проектирование,

2) выбор СУБД и других инструментальных программных средств,

3) логическое проектирование БД,

4) физическое проектирование БД.

Концептуальное (инфологическое) проектирование - построение семантической модели предметной области, то есть информационной модели наиболее высокого уровня абстракции. Конкретный вид и содержание концептуальной модели базы данных определяется выбранным для этого формальным аппаратом. Обычно используются графические нотации, подобные ER-диаграммам.

Логическое (даталогическое) проектирование -создание схемы базы данных на основе конкретной модели данных, например реляционной. Для реляционной модели данных даталогическая модель - набор схем отношений, обычно с указанием первичных ключей, а также "связей" между отношениями, представляющих собой внешние ключи.

На этапе логического проектирования учитывается специфика конкретной модели данных, но может не учитываться специфика конкретной СУБД. Физическое проектирование - соз

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком