К ВОПРОСУ ИСПОЛЬЗОВАНИЯ НЕАДАПТИВНЫХ
АЛГОРИТМОВ РАСПОЗНАВАНИЯ ПРИМЕНИТЕЛЬНО К ОБЪЕКТАМ РАЗЛИЧНОГО ТИПА.
М.М.Рожков, М.Ю.Звягин, И.Г.Кокорин, В.Г.Прокошев
ВлГУ, г. Владимир
roshkovmax@mail.ru, muz1953@yandex.ru, ikokorin@vlsu.ru, prokoshev_vg@vlsu.ru
Аннотация
В статье затрагивается
проблема использования неадаптивных алгоритмов для распознавания объектов
различного типа. В рамках проблемы одного эталонного изображения предлагается
оригинальный подход для решения этой проблемы. Кратко описываются поставленные эксперименты
для проверки предложенного подхода. Приводятся результаты сравнительных
экспериментов и делаются выводы
Обзор проблемы
В последние годы
происходит всё более широкое внедрение методов распознавания образов. Рост
интереса к таким методам объясняется, с одной стороны, возрастающей потребностью
в них (в отраслях роботостроения и приборостроения, в правоохранительных
органах), с другой же – расширяющимися возможностями вычислительной техники.
Рост производительности
вычислительной техники повышает эффективность систем распознавания за счёт
возможности осуществлять более быстрый поиск в больших базах данных и
возможности в реальном времени реализовывать всё более сложные и эффективные
алгоритмы распознавания. В настоящее время ведутся интенсивные исследования, направленные
на решение задач распознавания.
Создание и развитие
универсальных по отношению к распознаваемому объекту алгоритмов распознавания
является весьма актуальным направлением. Так как является одним из ключевых в
задачах создания роботоризованных систем, способных самостоятельно оценивать
окружающую обстановку и производить в ней те или иные действия.
В настоящей статье
рассматриваются возможности неадаптивных алгоритмов при распознавании объектов
различного типа.
Исходные данные
Эксперименты по
распознаванию будем проводить на двух принципиально разных наборах изображений:
·
общедоступная
база промышленных изделий ALOI [1];
·
общедоступная
база человеческих лиц ColorFERET [2].
База фотографий ALOI
содержит изображения 1000 объектов, сфотографированных как при различном
освещении, так и при различных углах съемки. Это различные промышленные
изделия: игрушки, посуда, обувь и т.д. Для экспериментов использовались фотографии
объектов, снятые при углах съемки, отличающихся на 10 градусов. Фотография в
фас использовалась в качестве эталонного изображения. А фотография под углом 10
градусов использовалась в качестве распознаваемого изображения. В испытаниях
использовались изображения 1000 объектов (всего 2*1000 = 2000 изображений).
В качестве второго
набора для распознавания использовались изображения, полученные из набора fafb
базы изображений лиц COLORFERET. Тестовые и эталонные
изображения были получены из оригинальных изображений базы COLORFERET
путём вырезания области, содержащей лицо человека. В испытаниях использовались
изображения 847 людей (всего 2*847 = 1694 изображения).
Описание процедуры распознавания
Распознавание объектов будем
осуществлять на базе неадаптивной модели распознавания, более подробно
описанной в [3-5]. В ней одновременно сочетаются относительная простота, обусловленная
строгой иерархичностью системы, и логичность взаимодействия подсистем. Модель
представляет своего рода каркас, который можно наполнять различными
процедурами. При этом уровни иерархии имеют чётко определённый интерфейс, что
позволяет типизировать алгоритмы, используемые на нижнем уровне иерархии.
В качестве алгоритмов,
используемых в системе предлагается применять методы, основанные на дискретном
косинусном преобразовании, ортогональном преобразовании на многочленах
Лежандра, детекторе краев на масках Собеля, текстурных картах Лавса [6].
Главная особенность
указанных методов заключается в принципиальном отказе от исследования структуры
распознаваемого изображения: поиска характерных точек, исследования расстояний
между ними и т.д. Вместо этого распознаваемое изображение анализируется
несколькими методами, основанными на различных математических преобразованиях
всего изображения. Таким образом, распознаваемый объект рассматривается как
целое – без какого-либо деления на элементы.
Расчет ошибок и результаты распознавания
В рамках проведенных
экспериментов рассчитывались величины ошибок распознавания первого и второго
рода при распознавании объектов. Формально расчет ошибок можно представить
следующим образом.
Рассматриваемые нами
базы изображений состоят из двух наборов, так как каждый объект имеет пару
фотографий – в одном наборе и в другом. Один набор будем рассматривать в
качестве распознаваемой базы , состоящей из распознаваемых изображений.
Другой набор – в качестве эталонной базы , состоящей из эталонных изображений.
Каждая база содержит по одному изображению для каждого из классов. Для
определенности положим, что эталонные изображения и распознаваемые изображения
занумерованы так, что индекс изображения определяет его класс. То есть, изображения
одного класса
(одного объекта).
Тогда расчет ошибок
распознавания первого рода выглядит следующим образом. Если при распознавании
некоторого изображения модель относит его к
другому классу или вообще считает,
что для него в эталонной базе нет соответствующего класса, то в таком случае
возникает ошибка распознавания первого рода.
Для расчета ошибки распознавания второго рода при
распознавании некоторого изображения будем искусственно
изымать из эталонной базы соответствующее эталонное изображение . При таких условиях ошибка второго рода будет возникать,
если модель все же будет относить распознаваемое изображение к некоторому
классу, известному системе.
Эксперименты по
распознаванию системой двух принципиально различных типов объектов представлены
в таблице 1.
Таблица 1.
Сравнение результатов распознавания
Результаты
распознавания системой промышленных изделий |
Результаты
распознавания системой человеческих лиц |
||
Ошибка I рода |
Ошибка II рода |
Ошибка I рода |
Ошибка II рода |
1,30% |
8,70% |
18,03% |
7,03% |
Выводы
Модель распознавания,
использующая неадаптивные алгоритмы, продемонстрировала универсальность своего
применения. В экспериментах по распознаванию принципиально разных объектов: человеческих
лиц и промышленных изделий – она продемонстрировала весьма низкие ошибки
распознавания.
Успешность описанных
экспериментов обуславливается неадаптивностью применяемых в модели алгоритмов.
В основе которых лежат не механизмы исследования структуры распознаваемых
образов, а принцип равной реакции на эти образы. Неадаптивные алгоритмы
преобразуют карту яркости распознаваемого изображения и извлекают из нее набор
атрибутов – вектор атрибутов. Дальнейшее исследование соотношения векторов
атрибутов производится средствами векторной алгебры в пространствах таких
векторов.
Литература
1.
The Amsterdam Library of Object Images (ALOI). Grey value (8 bit). Half resolution
(384 x 288). Viewing
direction. [Электронный ресурс] — Электрон. дан. (2,2 Гб.). — Режим доступа:
http://www.science.uva.nl/sites/ALOI/aloi_grey_red2_view.tar
2.
The Color FERET Database [Электронный ресурс]: Public face
database — Ver. 2. — Last modified Jan. 31, 2008. — Режим
доступа: http://face.nist.gov/colorferet/
3. Прокошев, В.Г. Проблема
автоматического распознавания лиц с одним эталонным изображением / В.Г.
Прокошев, М.М. Рожков, П.Ю. Шамин // Научно-технические ведомости
Санкт-Петербургского государственного политехнического университета. Серия
«Информатика. Телекоммуникации. Управление». — СПб., 2010. — №5. — С. 13-18.
4. Прокошев, В.Г. Построение
подпространств атрибутов на базе одного эталона для обеспечения устойчивости
работы в перспективных системах автоматического распознавания лиц. / Прокошев
В.Г., Рожков М.М., Шамин П.Ю., Голубев А.С. // Прикладная информатика — М,
2011. — №2 (32). — С. 100-107. — ISSN 1993-8314.
5. Рожков, М.М. Система неадаптивного распознавания
образов в условиях ограниченного количества информации: монография / М.М.
Рожков, В.Г.Прокошев, С.М.Аракелян, М.Ю.Звягин; Владим. гос. ун-т. — Владимир:
Изд-во владим. гос. ун-та, 2011. — 120 с. — ISBN 978-5-9984-0212-8.
6. Рожков, М.М. Использование текстурных
карт Лавса и дискретного косинусного преобразования в задаче распознавания лиц
/ Рожков М.М. // Прикладная информатика — М, 2011. — №1 (31). — С. 98-103. —
ISSN 1993-8314.