Последовательный анализ в приложениях

Гарькина И.А., д.т.н. проф.,  Данилов А.М., д.т.н. проф.

Пензенский государственный университет архитектуры и строительства

При синтезе материалов, исследовании свойств смесей, экспертизе зданий и сооружений [1] и т.д. часто возникает задача, аналогичная постановке врачом диагноза заболевания с последовательным добавлением все новых симптомов. Здесь число наблюдений, на основании которых принимается решение, заранее не фиксируется и зависит от результатов, полученных на данной стадии эксперимента (случайная выборка из генеральной совокупности). Так, если требуется разработать экономный план выборочного статистического контроля качества продукции при заданной предельно допустимой доле брака po, то можно извлечь n1   изделий и  оценить долю брака  .   Если окажется  << po  (или  >> po), то принимается гипотеза о том, что истинная доля дефектных изделий  (или соответственно альтернатива ); если же доля  брака несущественно отличается от заданного порогового значения  (находится в «зоне неопределённости» или «безразличия»), то принимается решение об извлечении второй выборки объёма n2  и т.д. К такой последовательной схеме наблюдений целесообразно обращаться в ситуациях, когда каждое наблюдение является дорогостоящим или труднодоступным, и по условиям эксперимента исследователь имеет возможность реализовать эту схему. В последовательной процедуре вместо одного порога, как в классической процедуре, задаются два порога. Проверяемую гипотезу (основная, или нулевая) обозначают Ho, альтернативную (конкурирующее с ней предположение) - H1. Вследствие ограниченности выборки, полученной из генеральной совокупности, по которой проверяется гипотеза Ho, возможны ошибки, как в ту, так и в другую сторону. В небольшой доле a случаев гипотеза Ho может оказаться отвергнутой, в то время как на самом деле она является справедливой, или, наоборот, в доле b случаев принимается гипотеза Ho, в то время, как она является ошибочной, а справедливой оказывается H1. Вероятность a ошибочного отклонения гипотезы Ho (ошибка первого рода) называется уровнем значимости, или размером статистического критерия. Вероятность b  принятия неправильной гипотезы Ho называется ошибкой второго рода. Выбор величины уровня значимости a зависит от сопоставления потерь вследствие ошибочных заключений. Чем весомее потери от ошибочного отказа от Ho, тем меньше выбирается a. Однако в большинстве практических задач такое сопоставление затруднительно. Часто принимается a = 0,05. Это означает, что в 5 случаях из 100 ошибочно отвергается гипотеза Ho .

Пусть произведена последовательная процедура оценки гипотез Ho и H1 , и получилась последовательность выборок некоторого объёма. Рассмотрим подмножество выборок, которые приводили к гипотезе H1 , и определим вероятность того, что последовательный процесс закончится принятием гипотезы H1 (отклонением Ho). Эта вероятность  в случае, когда на самом деле имеет место гипотеза Ho, и   (1 - b), если на самом деле имеет место гипотеза H1. Последнее положение следует из того, что по определению вероятность принятия Ho, когда верна H1, равна b.  В силу сходимости последовательной процедуры (за конечное число шагов n)  можно утверждать, что вероятность отклонения Ho (принятия H1), когда верна H1, должна быть равна  (1 - b).  Но  так   как  на   каждом   шаге,   включая   последний,  справедливо  соотношение  p (x ½ H1 ) ³  Ap (x ½ Ho ), то можно утверждать, что   или . Отсюда следует, что величина  является верхней границей для A; аналогично ; нижней границей величины  B  является . Практически последовательная процедура считается законченной, если выборка перестала попадать в область, определяемую неравенством

 .

Пороги А и B удовлетворяют соотношению

0 <  £  B £  1 £  A £  .

Следует помнить, что неотрицательный результат статистической проверки гипотезы Ho не означает, что высказанное предположительное утверждение является наилучшим, единственно подходящим. Из этого лишь следует, что она не противоречит имеющимся выборочным данным. При этом таким же качеством могут обладать, наряду с Ho, и другие гипотезы.

 Указанный подход при участии авторов успешно применялся в клинической диагностике психиатрии  и лечении алкоголизма, а также в задачах дооперационной диагностики и лечения митральных стенозов [2] (как решение статистической задачи распознавания образов).  Из метода Байеса вытекает метод последовательного распознавания, позволяющего определить вероятности состояний  при наличии комплекса признаков (симптомов) , вообще говоря, зависимых.

Как известно

.

При этом отношение

показывает, во сколько состояние  вероятнее состояния .

Однако такой подход к использованию диагностической информации требует более длительных вычислений, чем необходимо при приемлемой надежности диагноза. Поэтому при выборе одной или нескольких диагностических гипотез с заранее намеченным уровнем надежности и используется  последовательная диагностическая процедура. Здесь значение  количества симптомов устанавливается исходя из заранее выбранных допустимых уровней диагностических ошибок (после достижения порога  или  принимается решение: «состояние » или «состояние »). При последовательной процедуре распознавания для пары () возможны варианты: состояние ; состояние ; имеющейся информации недостаточно для принятия решения с намеченным уровнем надежности (или существует промежуточное состояние между  и ). Для принятия одного из решений правая часть  последнего равенства сравнивается с диагностическим порогом. Если   - ошибочная диагностика состояния, (риск заказчика),  - ошибка пропуска состояния (риск изготовителя);  - ошибки второго и первого родов, то отношение вероятностей правильных и ошибочных диагнозов состояний  равно .  Аналогично отношение ошибочных и правильных  диагнозов . Если теперь  , то принимается «состояние ». Если , то принимается «состояние ». Если , то последовательная процедура продолжается.

Указанная процедура эффективно использовалась и при изучении свойств материалов в области фазовых переходов [3].

 

Литература

1. Данилов А.М., Гарькина И.А. Теория вероятностей и математическая статистика с инженерными приложениями. Пенза: ПГУАС, 2010. -228 с.

2. Чагоров Н.В., Данилов А.М. Моделирование и диагностика различных форм митрального стеноза // Вестник аритмологии. №4. -1995. - С.54.

3. Данилов А.М., Гарькина И.А. Синтез материалов на основе анализа структурообразования композиционных материалов в области фазовых переходов // Воронеж: «Кибернетика и технологии XXI века», Институт системного анализа РАН, ИПУ РАН, 2003. - С.113-123