научная статья по теме МОДЕЛИ НАДЕЖНОСТИ СПЕЦИАЛИЗИРОВАННЫХ ВЫЧИСЛИТЕЛЬНЫХ МАШИН С УЧЕТОМ ТИПОВ ОТКАЗОВ И ВРЕМЕННЫХ СООТНОШЕНИЙ Автоматика. Вычислительная техника

Текст научной статьи на тему «МОДЕЛИ НАДЕЖНОСТИ СПЕЦИАЛИЗИРОВАННЫХ ВЫЧИСЛИТЕЛЬНЫХ МАШИН С УЧЕТОМ ТИПОВ ОТКАЗОВ И ВРЕМЕННЫХ СООТНОШЕНИЙ»

Автоматика и телемеханика, № 4, 2015

( 2015 г. В.О. ЧУКАНОВ, д-р техн. наук (seva@dozen.mephi.ru), И.М. ЯДЫКИН (IMYadykin@mephi.ru) (Национальный исследовательский ядерный университет "МИФИ", Москва)

МОДЕЛИ НАДЕЖНОСТИ СПЕЦИАЛИЗИРОВАННЫХ ВЫЧИСЛИТЕЛЬНЫХ МАШИН С УЧЕТОМ ТИПОВ ОТКАЗОВ И ВРЕМЕННЫХ СООТНОШЕНИЙ

Рассматривается задача анализа надежностных характеристик специализированных вычислительных машин с комбинированным резервированием с учетом типов отказов и временных соотношений. Вводится критерий надежности - вероятность функционально безотказной работы. Предложены новые модели надежности с учетом функции распределения времени появления ошибки, времени обнаружения ошибки и др. Определены точностные параметры результатов моделирования.

1. Введение

В настоящее время для повышения надежности широко используются на практике резервирование замещением и постоянное резервирование. Для резервирования замещением характерно обнаружение и отключение отказавшего блока и подключение работоспособного резервного блока. Резервирование замещением применяется тогда, когда могут быть допущены перерывы в работе для обнаружения отказавшего блока и подключения резервного блока [1]. Из известных примеров можно отметить многопроцессорную систему "1ЬЫЛС-4" [2].

Постоянное резервирование характеризуется тем, что передача и прием информации ведутся параллельно по нескольким каналам сразу, а исправление ошибок, возникающих из-за отказов и сбоев, осуществляется за счет внутренних свойств системы без отключения отказавших блоков. При этом исправление ошибок происходит автоматически без перерывов в функционировании специальными восстанавливающими органами или организацией связей между избыточными элементами. При постоянном резервировании невозможно выделить основной и резервный блоки.

Необходимо заметить, что постоянное резервирование используется как для повышения надежности бортовых специализированных вычислительных машин (СВМ) в космических аппаратах, так и в наземных системах ответственного целевого назначения.

Поиск новых решений в области структурной избыточности привел к комбинированному резервированию [3].

Комбинированное резервирование - это метод повышения надежности резервного оборудования при совместном использовании методов резервирования замещением [4] и постоянного резервирования. Комбинированное резервирование может быть реализовано в виде гибридного резервирования (мажоритарное ядро с резервом), параллельно-гибридного резервирования

(несколько однородных мажоритарных ядер и общий скользящий резерв) и итеративного резервирования (ИР) (методы резервирования вложены один в другой). Гибридное резервирование реализовано, например, в СВМ "SPACE SHUTTLE" [5] и "FTMP" [6]. Итеративное резервирование описано, например, в [7]. Смешанное резервирование широко распространено на практике, например, использовано в цифровой системе стабилизации орбитальной космической станции "SKYLAB". При этом должен учитываться автомат надежности, под которым понимается устройство реконфигурации и контроля системы.

2. Постановка задачи

В настоящее время необходимо разрабатывать такие критерии и показатели, которые, с одной стороны, отражают надежностные свойства, а с другой - учитывают параметры контроля. Отдельные подходы к построению комплексных критериев известны: в [7, 8] представлены модели, основанные на вероятности функционально безотказной работы, но в этих работах не рассматриваются временные соотношения, в частности не учитывается время распространения ошибки до выхода системы.

В настоящей статье приводятся аналитические комплексные модели надежности специализированных ЭВМ с комбинированным резервированием с учетом характеристик контроля и временных соотношений между моментами появления ошибок, обнаружения ошибок системой контроля и появления ошибок на выходе вычислительной системы [8].

Рассмотрим вычислительную систему с контролем. Пусть требуется определить вероятность отсутствия ошибок, либо возникновения ошибок в системе (после отказов и сбоев), либо появления ошибок на выходе системы (вследствие не мгновенного распространения ошибок до выхода), либо обнаружения ошибок системой контроля (вследствие неидеальности системы контроля) за заданное время t [9].

Сначала исследуем случай появления одной ошибки. Обозначим временные соотношения для одиночной ошибки: ti - случайная величина - время возникновения ошибки; t2 - случайная величина - время появления ошибки на выходе (выходах) системы; t3 - случайная величина - время обнаружения ошибки системой контроля. Введем обозначения характеристик надежности: Hi(t) - функция распределения времени возникновения ошибки; hi(t) - функция плотности распределения времени возникновения ошибки, hi(t)= Hi (t);

Ri(t) - функция распределения времени появления ошибки на выходе; ri(t) - функция плотности распределения времени появления ошибки на выходе, ri(t) = R'(t);

Li(t) - функция распределения времени обнаружения ошибки автоматом надежности, в который входит система контроля;

li(t) - функция плотности распределения времени обнаружения ошибки автоматом надежности, в который входит система контроля li(t) = L'i(t).

3. Расчет вероятности функционально безотказной работы

В дальнейшем вероятность отсутствия ошибок и фиксации ошибок системой контроля за время Ь будем называть вероятностью функционально безотказной работы [10].

Для одной ошибки возможны следующие случаи:

1. Ошибка не возникла за время Ь - вероятность этого события обозначим

2. Ошибка возникла и обнаружена системой контроля за время I - вероятность этого события обозначим Р^).

3. Ошибка возникла и не обнаружена системой контроля за время Ь -вероятность этого события обозначим Р1(Ь).

Тогда по определению вероятность функционально безотказной работы системы Рс (Ь) за время Ь можно определить так:

РсЮ = Рг(1)+ Р~г(1).

При этом для полной группы несовместных событий

Рг(1)+ Рг(1) = 1.

Далее определим вероятность отсутствия одиночной ошибки Р\(1) и вероятность обнаружения ошибки Р^):

(1)

ъ

Р1(Ь) = 1 - / М*1) = 1 - #!(*),

0

ъ

где ^1(^1, ¿2, Ьз) - вероятность появления ошибки на выходе системы в момент ¿2 и обнаружение ошибки системой контроля в момент Ьз при условии, что ошибка возникла в момент Ь1, ^ < Ь2 < Ьз < Ь. Вероятность ^1(^1, ^2,^3) можно представить в виде:

ъ

*1(*1, Ь2, Ьз)^ Г1(Ь2 - Ь1) С1(Ь2,Ьз) ^2,

Ъ1

где ^1(^2? Ьз) - вероятность обнаружения ошибки системой контроля в момент времени Ьз, при условии, что ошибка появилась на выходе устройства в момент времени Ь2, Ь2 < Ьз < Ь.

При этом вероятность ^1(^2, Ьз) можно определить так:

ъ

С1(Ь2,Ьз) = I № - *2)^з.

ъ2

0

Таким образом, вероятность обнаружения ошибки Р\(1) можно представить в виде:

г (г

(2) РТ(*)=/ М^М 1'гг(г2 - ¿1)

о

11 (¿3 - ¿2) ¿¿3

-¿2

>

Рассмотрим случай двух ошибок. Вероятности для второй ошибки обозначим Р-2(¿), Р-2(¿), аналогичные вероятностям Р1(1),Р1(1) и для одиночной ошибки. При этом вероятность функционально безотказной работы Рс(¿) для случая двух ошибок определяется выражением:

Рею = Р\ р2 +та ад+адта+тата-

В случае появления в системе трех ошибок (вероятности являются функциями времени):

Рс = Р1 Р2Р3 + ад^з + Р1Р2Р3 + +

+ + ^ВД + РгЪЪ + 'РхЪ'Рз.

В общем случае для М ошибок:

Рс /', Р>. ..Рм ■ РР> ...Рм ■ ... • Р\ Р'2 • • • ~Р~Ч •• • • ~рТГ2...1Тй

Б

= Е П рп П ^

х=1пеА пеВ

где

г

р* = р*(¿) = 1 - У ь*(¿1*) = 1 - н(¿);

-Р/г — Рп{{) — J о

(^2п - ¿1п)

ьп га ь2га

.¿2п

^2га > ¿¿1п;

Р* (¿) - вероятность отсутствия ошибки г-го типа за время г € А; Рп(¿) - вероятность возникновения ошибки п-го типа, появления ошибки на выходе системы и обнаружения ошибки системой контроля за время ¿, п € В;

У = 1, 3, — соответственно времена возникновения ошибки, появления ошибки на выходе и обнаружения ошибки г-го (п-го) типа;

Л.п (¿), гп(£), 1п(£) - соответствующие функции плотности распределений для п-й ошибки;

Иг(¿) - функция распределения времени возникновения г-й ошибки;

Нг (¿) - функция плотности распределения времени возникновения г-й ошибки;

А и В - множества номеров ошибок соответственно г-го и п-го типов, при этом А и В = С, где С = {1, 2, ..., М} - множество всех номеров ошибок;

Б - количество слагаемых в левой части.

о

г

г

4. Расчет вероятностных характеристик

Рассмотрим в качестве примера случай появления одной ошибки в вычислительной системе. Определим вероятность функционально безотказной работы системы за время Ь [11].

Предполагаем, что все функции распределения имеют экспоненциальный вид с интенсивностью отказов Л. Тогда функцию распределения и

функцию плотности времени возникновения ошибки Л-1 (Ь) можно определить

Я1(Ь) = Е1(Ь) = ад) = 1 - ехр(-ЛЬ); МЬ) = Г1(Ь) = ¿1 (Ь) = Л ехр(-ЛЬ).

Для этого случая вероятность отсутствия ошибки Р1(Ь) за время Ь по (1) определяется следующим образом:

г

Р1(Ь) = 1 ^ У Л ехр(-Л^) = ехр(-ЛЬ).

о

Вероятность Р\(£) возникновения ошибки, появления ошибки на выходе и обнаружения ошибки системой контроля за время Ь определяется по (2):

ад) =

г I г г

У Л ехр(-ЛЬ1 ) < У Л ехр(-Л(Ь2 - ¿1)) У Л ехр(-Л (Ьз - ¿2)) ^з

и 2

>

о

Тогда вероятность функционально безотказной работы Рс (Ь) за время Ь для случая одной ошибки определяется следующим образом:

Рс(*) = Рф) = 1 - ехр(-Аг) [М + (Л^)2/2] .

Сравним полученное выражение для функционально безотказной работы Рс (Ь) с выражением для вероятности безотказной работы Рб(Ь);

(3) Рб(Ь) = ехр(-ЛЬ).

При среднем времени безотказной работы Ь = 1/Л = Т получаем:

Рс = 1 - 3/(2е), Рб = 1/е, е - экспоненциальная функция.

Таким образом, Рс(Ь) > Рб(Ь).

Это следует из того, что при вычислении вероятности безотказной работы Рб(Ь) не учитывается время распространения ошибки до выхода - ошибка

появляется на выходе мгновенно, а при вычислении вероятности функционально безотказной работы Pc (t) учитывается время распространения ошибки. При этом возможна ситуация, когда ошибка возникла, но на выходе системы не появилась за заданное время t.

Таким образом, предложенная методика вычисления вероятности функционально безотказной работы Pc (t) по

Для дальнейшего прочтения статьи необходимо приобрести полный текст. Статьи высылаются в формате PDF на указанную при оплате почту. Время доставки составляет менее 10 минут. Стоимость одной статьи — 150 рублей.

Показать целиком