Турко
О. Л.
Национальный горный
университет
Геометрический
и структурный подходы при решении проблемы обучения распознаванию
образов
Образное
восприятие мира — одно из загадочных свойств живого мозга, позволяющее
разобраться в бесконечном потоке воспринимаемой информации и сохранять
ориентацию в океане разрозненных данных о внешнем мире.
Способность
восприятия внешнего мира в форме образов позволяет с определенной
достоверностью узнавать бесконечное число объектов на основании ознакомления с
конечным их числом, а объективный характер основного свойства образов позволяет
моделировать процесс их распознавания.
В
целом проблема распознавания образов состоит из двух частей: обучения и
распознавания. Обучение осуществляется путем показа отдельных объектов с указанием
их принадлежности тому или другому образу. В результате обучения распознающая
система должна приобрести способность реагировать одинаковыми реакциями на все
объекты одного образа и различными — на все объекты различных образов. Очень
важно, что процесс обучения должен завершиться только путем показов конечного
числа объектов без каких-либо других подсказок. В качестве объектов обучения
могут быть либо картинки, либо другие визуальные изображения , либо различные
явления внешнего мира, например звуки, состояния организма при медицинском
диагнозе, состояние технического объекта в системах управления и др. Важно, что
в процессе обучения указываются только сами объекты и их принадлежность образу.
За обучением следует процесс распознавания новых объектов, который
характеризует действия уже обученной системы. Автоматизация этих процедур и
составляет проблему обучения распознаванию образов. В том случае, когда человек
сам разгадывает или придумывает, а затем навязывает машине правило
классификации, проблема распознавания решается частично, так как основную и
главную часть проблемы (обучение) человек берет на себя.
Проблема
обучения распознаванию образов интересна как с прикладной, так и с
принципиальной точки зрения. С прикладной точки зрения решение этой проблемы
важно прежде всего потому, что оно открывает возможность автоматизировать
многие процессы, которые до сих пор связывали лишь с деятельностью живого
мозга.
Круг
задач, которые могут решаться с помощью распознающих систем, чрезвычайно широк.
Сюда относятся не только задачи распознавания зрительных и слуховых образов, но
и задачи распознавания сложных процессов и явлений, возникающих, например, при
выборе целесообразных действий руководителем предприятия или выборе
оптимального управления технологическими, экономическими, транспортными или
военными операциями. В каждой из таких задач анализируются некоторые явления,
процессы, состояния внешнего мира, всюду далее называемые объектами наблюдения.
Но каждый объект наблюдения может
воздействовать по-разному, в зависимости от условий восприятия. Например,
какая-либо буква, даже одинаково написанная, может в принципе как угодно
смещаться относительно воспринимающих органов.
Выбор
исходного описания объектов является одной из центральных задач проблемы
обучения распознаванию образов. При удачном выборе исходного описания задача распознавания может оказаться
тривиальной и, наоборот, неудачно
выбранное исходное описание может привести либо к очень сложной дальнейшей
переработке информации, либо вообще к отсутствию решения.
Геометрической
интерпретацией проблемы обучения распознаванию образов является то что, любое изображение, которое
возникает в результате наблюдения какого-либо объекта в процессе обучения,
можно представить в виде вектора, а значит и в виде точки некоторого
пространства признаков. Если утверждается, что при показе изображений возможно
однозначно отнести их к одному из двух образов, то тем самым утверждается, что
в некотором пространстве существует две или несколько области, не имеющие общих
точек, и что изображения — точки из этих областей. Каждой такой области можно
приписать наименование, т. е. дать название, соответствующее образу.
В
ходе обучения предъявляются точки, случайно выбранные из этих областей, и
сообщается информация о том, к какой области принадлежат предъявляемые точки. Цель обучения состоит в построении поверхности, которая разделяла
бы не только показанные в процессе обучения точки, но и все остальные точки,
принадлежащие этим областям, либо в построении поверхностей, ограничивающих эти
области так, чтобы в каждой из них находились только точки одного образа.
Наряду
с геометрической интерпретацией проблемы обучения распознаванию образов
существует структурный или лингвистический
подход. Примером лингвистического
подхода может служить распознавание зрительных изображений. Сначала выделяется
набор исходных понятий, которые образуют словарь, позволяющий строить различные
логические высказывания. Задача состоит в том, чтобы из большого количества
высказываний, которые могли бы быть построены с использованием этих понятий,
отобрать наиболее существенные для данного конкретного случая.
Далее,
просматривая конечное и по возможности небольшое число объектов из каждого
образа, нужно построить описание этих образов. Построенные описания должны быть
столь полными, чтобы решить вопрос о том, к какому образу принадлежит данный
объект. При реализации лингвистического подхода возникают две задачи: задача
построения исходного словаря, т. е. набор типичных фрагментов, и задача
построения правил описания из элементов заданного словаря.