научная статья по теме УТИЛИТЫ ДЛЯ ПРОВЕРКИ И КОРРЕКЦИИ ЭЛЕКТРОННЫХ КАТАЛОГОВ Культура. Культурология

Текст научной статьи на тему «УТИЛИТЫ ДЛЯ ПРОВЕРКИ И КОРРЕКЦИИ ЭЛЕКТРОННЫХ КАТАЛОГОВ»

АЛЕКСАНДР КАРАУШ, ДМИТРИЙ КОПЫТКОВ, АЛЕКСАНДР МАКАРЕВИЧ

Утилиты для проверки

и коррекции ктронных каталогов

И

СПОЛЬЗОВАНИЕ систем автоматизации в повседневной деятельности обеспечивает повышение

производительности труда, но сопряжено с непредвиденными проблемами, вызванными ошибками данных или отказами системы. Типы непредвиденных проблем в работе информационной системы могут быть следующими:

1) недопустимые простои критически важных сервисов (например, программ определения задолженных документов в филиалах библиотеки для книговыдачи во время рабочего дня);

2) прекращение сопровождения критически важных приложений по причине распада внутренней команды разработчиков или фирмы-поставщика;

3) масштабное поражение корпоративной сети компьютерным вирусом;

4) необходимость срочной легализации применяемого программного обеспечения (ПО) вследствие возникновения правовых проблем и пр.

«Среда обитания» информационной системы слабо поддается контролю и прогнозированию. Особенно это касается вопросов правового и финансового регулирования. К рискам и проблемам внешней среды, которые зачастую невозможно контролировать, относятся:

1) технические проблемы, не предусмотренные в рамках регулярных процедур планирования и управления информационными технологиями (ИТ), например проблема 2000 года;

2) изменение технической политики производителей оборудования и ПО;

3) изменение лицензионной политики производителей ПО.

Данные проблемы находятся вне зоны контроля отделов информационных технологий библиотек.

Для решения непредвиденных проблем ведется работа над соответствующими проектами. Подобный проект предполагает немедленное изменение инфраструктуры отдела ИТ или всей библиотеки в целом. С этой целью может потребоваться замена (причем срочная) оборудования или ПО, явившегося причиной проблемы.

Как свидетельствует опыт авторов, наиболее частыми являются проблемы, связанные с отказом компьютерного оборудования и системного ПО. Однако нередки случаи, когда наряду с вышеперечисленными проблемами появляются потери данных в АБИС, в том числе в электронном каталоге (ЭК) библиотеки. Можно предложить следующий перечень встречающихся проблем состояния баз данных (БД), произошедших по причине отказа в работе оборудования или операционных систем:

1) физическое уничтожение данных;

2) потеря целостности структуры данных в среде СУБД;

3) физические нарушения структуры файлов;

4) потеря одного или нескольких значимых файлов СУБД, при которой работа АБИС становится невозможной.

Что касается проблемы физического уничтожения данных, где самой распространенной причиной является отказ жестких дисков или их физическое разрушение, то можно сказать, что ничего сопоставимого по эффективности резервированию данных человечество еще не придумало. По мнению авторов, оптимальный период резервного копирования данных информационных систем составляет 24 часа. Это позволяет свести основные затраты от случайной потери файлов БД к минимуму, за счет того, что потеря данных возможна только в ретроспективе одного дня. Имеются случаи, когда отказ

При работе автоматизированных библиотечно-информационных систем существует возможность частичной или даже полной потери данных. Программное обеспечение по поиску, локализации и исправлению частых и случайных ошибок каталогизации, разрабатываемое в Муниципальной информационной библиотечной системе г. Томска, позволяет улучшить качество электронных каталогов и баз данных библиотек.

Александр Сергеевич Карауш, заместитель директора Муниципальной информационной библиотечной системы,

Томск

Дмитрий Юрьевич Копытков, программист-технолог Отдела новых информационных технологий Муниципальной информационной библиотечной системы,

Томск

Александр Сергеевич Макаревич, программист-технолог Муниципальной информационной библиотечной системы,

Томск

оборудования происходит «постепенно», вследствие чего невозможно восстановить данные по копии предыдущего дня. Тогда для нормальной работы системы резервирования следует применять сложные схемы, где объем места, необходимый для хранения копий баз данных, должен в 15-50 раз превышать объем самой базы данных. Это необходимо помнить, приобретая оборудование, чтобы обезопасить организацию от полной или суще ствен ной по тери дан ных.

Потеря целостности данных для локальных АБИС представляет собой нарушение организации данных в одном или нескольких файлах СУБД, в результате чего становится невозможным поиск или показ результатов поиска. В Системе «ИРБИС32» (CDS/ISIS) такие ситуации возникают при ошибках уровня таблиц размещения файлов на жестком диске и проявляются в невозможности показа данных словарей или появлении ошибок работы АРМов. Решением данной проблемы является выполнение последовательности команд АРМа «Администратор»: «Диагностика файла документов» и «Создание словарей заново».

При проблемах, связанных с физическим нарушением в структуре файла, например потерей данных блока или кластера на жестком диске, возможны случаи потерь диапазона записей ЭК, которые:

1) не поддаются какой-либо диагностике с точки зрения наличия /отсутствия данных и их содержимого;

2) не поддаются анализу по возможной локализации «проблемных» записей;

3) не подлежат восстановлению системными утилитами или утилитами, поставляемыми разработчиками ПО.

При появлении подобных проблем все действия, связанные с доступом к БД, следует производить только после резервирования состояния всех файлов системы. Практика показала, что желательно делать резервирование файлов СУБД средствами операционной системы с монопольным доступом к файлам, чтобы уменьшить влияние возможных ошибок на физическом уровне размещения данных в файлах.

Восстановление данных при нарушениях структуры файлов может потребовать проверки на дополнительные условия после восстановления записей для утверждения того факта, что в процессе восстановления не были потеряны значимые блоки информации. Например, при сбое системы могут возникнуть случаи, когда записи потеряны, а вместо них в БД присутствует такое же количест-

во хаотично полученных кодов, не содержащих никакой информации. Простейшим случаем таких проблем является поиск в каждой записи заданного ключевого слова (набора слов с условием). Например, создание запроса, который ищет в полях рабочих листов только разрешенные имена.

Потеря файлов — это частный случай потери данных (далее будет рассматриваться только случай потери файлов, не несущих значимой информации). Для Системы «ИР-БИС32» критическим является только один файл с расширением MST (master-file), имя которого совпадает с именем конкретной базы данных. При потерях других файлов Система «ИРБИС32» полностью сохранит записи и находящуюся в них информацию. Однако для восстановления работоспособности потребуется произвести манипуляции, связанные с восстановлением файлов перекрестных ссылок (расширение XRF) и созданием файлов словарей. Наиболее частой причиной потери данных файла перекрестных ссылок (XRF) являются случаи переполнения емкости жесткого диска или попытки сохранения записи, превосходящей физически допустимый объем, который разрешен для Системы «ИРБИС32» (32 Кбайта). Восстановление XRF-файла может быть проведено при помощи утилиты MSTRCV (Master Receive), поставляемой UNESCO, которая позволяет восстановить XRF-файл по структуре MST-файла. После этого для восстановления работоспособности Системы «ИР-БИС32» требуется заново создать словари.

В ряде случаев возможны нарушения работоспособности Системы «ИРБИС32», которые не поддаются какой-либо систематизации и анализу. Авторами используется следующая последовательность действий в АРМ «Администратор» для восстановления работоспособности:

1. Копирование файлов базы данных Системы «ИРБИС32» с целью повторных попыток восстановления.

2. Проверка записей в БД («Диагностика файла документов»).

3. Копирование файла документов (для задач дополнительной проверки структуры дан ных).

4. Экспорт всех записей базы данных в текстовый формат без использования переформатирования. Использование текстового формата передачи позволяет сохранить поля с технологическими метками более 999, которые все чаще используются работниками отделов автоматизации для настройки Системы «ИР БИС32».

5. Опустошение БД.

6. Импорт ранее экспортированных записей из текстового формата. При этом следует помнить, что вследствие исчезновения логически и физически удаленных записей в базе данных произойдет изменение номеров очередности записей, т. е. база данных «сожмется».

7. Создание заново словарей базы данных.

Осуществление последовательности действий по восстановлению работоспособности Системы «ИРБИС32» занимает около 1,5-2 часов для базы данных объемом 100— 120 тысяч записей при работе непосредственно на сервере (РеШшт-^ 2GHz), но при работе на удаленной машине со скоростью сети 100 Мбит на это уйдет уже не менее 6 часов. Данная последовательность действий может входить в плановое обслуживание Системы «ИРБИС32» и выполняться не реже 1 раза в 2 месяца.

Следует обратить внимание, что вышеперечисленные операции по восстановлению данных оказались успешными во всех случаях потерь данных, кроме одного, когда потребовалась смена отказавших магнитных головок жесткого диска. Стоимость подобной операции, не дающей стопроцентной гарантии восстановления потерянной информации, составляет от 6 до 25 тысяч рублей (без стоимости заменяемых деталей), что существенно выше, чем затраты на ежедневное резервирование данных.

Одной из важнейших проблем использования информационных систем является наличие разного рода ошибок в данных. Теория разработки и поддержки ПО уделяет недостаточное внимание вопросам исправления и корректировки ошибок в БД и массивах информационных систем. Не секрет, что просчитать все ошибки при вводе их в систему и придумать алгоритмы проверки и коррекции невозможно. При интенсивной работе с АБИС возникает множество ошибочных данных разного уровня, которые могут повлиять не только на выполнение конкретной функции, но на работу всей информационной системы.

В общем случае ошибки работы АБИС

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком