Д. И. Плёнкина, С. Л. Никулин

Национальный горный университет, г. Днепропетровск, Украина

Эффективность использования различных методов распознавания при решении геологических задач

 

На сегодняшний день для решения геологических задач широко применяются методы распознавания образов, но эффективность их использования детально не изучена. При этом проблема оценки качества распознавания привлекает не меньшее вни­мание, чем задачи, связанные непосредственно с распознаванием. На практике понятие "качество распознавания" обычно выражает отношение специалиста к результату и определяется степенью соответствия классификации фактическим данным [1]. Показателями такого соответствия могут служить абсолютная или относительная погреш­ность результата, доверительная вероятность попадания решения в заданную область, степень совпадения прогнозных оценок каких-либо параметров с истинными и др. В любом случае речь идет о ве­личине сходства решения к истинному, т.е. об ошибке прогноза (распознавания).

Математическая модель прогноза обычно записывается в виде , где  результат прогноза;  – набор методов прогноза (решающих правил, операторов, алгоритмов); X – исходные данные;– ошибка прогноза.

Способ оценки качества прогноза существенно зависит от его цели, назначения, априорных данных и принятых допущений.

Целью настоящей работы является определение эффективности использования различных методов распознавания с помощью методов оценки качества. В качестве решаемой задачи выступала задача прогнозирования золоторудных месторождений на Зиаэтдинском золоторудном поле (Западный Узбекистан).

Распознавание и оценка качества проводились в специализированной геоинформационной системе РАПИД [2], разработанной на кафедре Геоинформационных систем Национального горного университета (г. Днепропетровск, Украина).

В системе РАПИД задача распознавания геологических данных решается следующими методами:

     логические (алгоритм "Кора-3");

     статистические (параметрический метод оценки плотности распределения, непараметрический метод оценки плотности распределения);

     детерминистские (функция меры близости, потенциальная функция, функция угловой меры);

     частотные (распознавание на основе относительной частоты, распознавание на основе расчета прогнозирующей функции);

     нейросетевые (персептрон Розенблатта, многослойный персептрон, радиальная базисная сеть, вероятностная нейронная сеть, машина опорных векторов, рекуррентная сеть Элмана, рекуррентная сеть 2 порядка).

В настоящей работе оценка качества рассматривается как процесс, состоящий из трех последовательных этапов:

     1. Определя­ется цель, с которой производится оценка.

     2. Устанавлива­ются желательные с точки зрения цели свойства (атрибуты), которы­ми должен обладать прогноз, т.е. раскрывается понятие качества.

     3. Формируются меры качества, или правила оценки, позволяющие количественно определить, в какой степени прогнозы обладают желаемыми свойствами.

При распознавании прогноз обычно выдается в категорической форме. Наиболее распространенным критерием качества в этом случае является число ошибок, подсчитываемых на объек­тах обучающей или контрольной выборки.

В системе РАПИД реализованы следующие показатели качества распознавания: оценки ошибок первого и второго рода, коэффициент риска поисков, показатель Брайера, логарифмический показатель, сферический показатель.

Перечисленные величины позволяют получить количественную информацию о результатах прогноза объектов определенного класса, а также в среднем по всем классам.

По результатам проведенного исследования наибольшую эффективность показал  непараметрический метод оценки плотности распределения. Ошибка прогноза при его использовании составила 5,64%.

 

Литература

1.     Бусыгин Б.С., Мирошниченко Л.В. Распознавание образов при геолого-геофизическом прогнозировании. – Днепропетровск: Изд-во ДГУ, 1991. – 168 с.

2.     Пивняк Г.Г., Бусыгин Б.С., Никулин С.Л. ГИС-технология интегрированного анализа разнородных и разноуровневых геоданных. // Доповіді Національної академії наук України, 2007. – №6 – c. 121-128.