Современные информационные технологии Вычислительная техника и программирование

Д.т.н. Богатырев , Демидов Д.В., Алексанков С.М.

Санкт-Петербургский государственный университет информационных технологий, механики и оптики, Россия

Оценка Надежности ДУБЛИРОВАННЫХ ВЫЧИСЛИТЕЛЬНЫХ КОМПЛЕКСОВ С учетом КОНТРОЛя

 

В настоящее время наблюдается определенный интерес к созданию и исследованию отказоустойчивых систем, особенно систем работающих в реальном времени и систем, связанных с безопасностью [1].

Для решения ответственных задач управления, особенно, в реальном времени, используются резервированные вычислительные системы, в том числе дублированные вычислительные комплексы (ДВК).

В исследуемых дублированных комплексах выделяются два полукомплекса, каждый из которых содержит вычислительный модуль, модуль памяти и адаптер взаимосвязи, выполняющий также контроль вычислительного процесса [2]. Основная и резервная ЭВМ решают одну задачу. В связующем устройстве сравниваются результаты вычислений обеих ЭВМ, если результаты не совпадают, то производится пересчет результатов, если совпадают, то результат выдает основная ЭВМ. Если одна из ЭВМ отказывает, то вычисления выполняются последовательно одной машиной, при этом для контроля последствий сбоев вычисления на одной функционирующей машине могут повторяться, и в случае повторного несовпадения, либо повторяются вновь, либо вычисление проводится ещё один раз, с выбором результата по мажоритарному принципу (по большенству).

В работе предложена модель надежности ДВК, учитывающая влияние отказов и сбоев на организацию контроля функционирования восстанавливаемых и невосстанавливаемых комплексов.

При анализе систем, основанном на применении Марковских моделей, построены графы состояний для восстанавливаемых и не восстанавливаемых комплексов с учетом последствий отказов и возможных восстановлений.

На основе построенных графов составлены матрицы переходов и системы дифференциальных уравнений, позволяющих найти вероятности  работоспособных и отказавших состояниях ДВК. ,

где p — функция вектора вероятностей состояний системы, T — матрица переходов.

Расчёты проведены в программном пакете MATLAB 7.10.0. В результате расчетов определен стационарный и нестационарный коэффициенты готовности, а также коэффициент оперативной готовности восстанавливаемого и невосстанавливаемого комплексов. Коэффициент оперативной готовности определен как при поступлении запроса в произвольный, достаточно удаленный, момент времени, при нахождении системы в стационарном режиме, так и в виде функции времени поступления запроса, при нахождении системы в нестационарном режиме. Результаты расчета коэффициента оперативной  готовности от времени решения задачи τ и от времени поступления запроса t в неустановившемся режиме представлены на рисунке.

Результаты проведенных исследований могут быть использованы при прогнозировании надежности ДВК, выборе его организации, в том числе вариантов функционирования системы контроля при поддержке отказоустойчивых вычислений.

Рисунок. Коэффициент оперативной готовности дублированного вычислительного комплекса, как функция от времени поступления запроса

 

Литература:

1.     Schroeder B. The Computer Failure Data Repository (CFDR) / B. Schroeder, G. A. Gibson // 7th USENIX Symposium on Operating Systems Design and Implementation (OSDI '06) – Seattle, 2006

2.     Голубев И.Ю., В.А.Богатырев, В.Ф. Беззубов Сравнительный анализ структур отказоустойчивых дублированных вычислительных комплексов // Информационно-измерительные и управляющие системы – 2011 – т. 9. № 2. с. 08–12