ст.гр.КС-05-1 Волжанина О.О., ст.гр.КС-05-2 Тимощук
С.Л.
Национальный
Горный Университет
Методы сегментации для распознавания изображений
Скорость развития вычислительной техники в
наши дни завораживает. Порой бывает трудно уследить за огромными темпами роста
быстродействия компьютеров, сетевых технологий, мультимедийных систем.
Однако
достижения в области компьютерного зрения и слуха являются куда более
скромными. Этот вопрос становится все острее с растущей потребностью
человечества в создании интеллектуальных систем, ведь без слуха и зрения
подобные системы никогда не смогут быть приближенны по возможностям к
человеку.
Все
большее распространение получили системы автоматизированного ввода информации
через различные типы сканеров (ручные, листовые, барабанные, графические
планшеты, дигитайзеры, факс-модемы), а также цифровые фото- и видеокамеры. При
этом по разрешающей способности такие системы ввода вполне приближаются к
зрению человека или животных, а с учетом быстродействия ближайшей технической моделью
глаза, очевидно, являются видео- и цифровые фотокамеры.
Тем не менее, возможности
интеллектуального анализа изображений с помощью компьютеров оставляют желать
большего. Успехи по распознаванию букв и цифр в документах и текстах
впечатляют, также как и другие значительные достижения по анализу изображений
специального вида
(например, распознавание треков ядерных частиц,
идентификация автомобилей-нарушителей по фотоснимкам, анализ и распознавание
сигналов в медицине и геологии). Однако, универсальных методов обработки
изображений, сравнимых по эффективности с интеллектуальными возможностями
человека, еще не найдено. А ведь именно обработка изображений с целью их
распознавания является одной из центральных и практически важных задач при
создании систем искусственного интеллекта.
Проблема
включает ряд основных этапов:
1.
восприятие поля зрения
2.
сегментация
3.
нормализация выделенных
объектов
4.
распознавание.
Понимание (интерпретация) изображений
включается частично в этап сегментации и окончательно решается на этапе
распознавания.
Основным элементом любой задачи
распознавания изображений является ответ на вопрос: относятся ли данные
(входные) изображения к классу изображений, который представляет данный эталон?
Казалось бы, ответ можно получить, сравнивая непосредственно изображение с
эталонами (или их признаки). Однако возникает ряд трудностей и проблем,
специфических, в особенности, при создании систем технического зрения:
·
Изображения
предъявляются на сложном фоне.
·
Изображения эталона и
входные изображения отличаются положением в поле зрения.
·
Входные изображения не
совпадают с эталонами за счет случайных помех.
·
Отличия входных и
эталонных изображений возникает за счет изменения освещенности, подсветки,
локальных помех.
·
Эталоны и изображения
могут отличать геометрические преобразования, включая такие сложные как
аффинные и проективные.
Для решения задачи в целом и на отдельных
ее этапах применяются различные методы сегментации, нормализации и
распознавания.
Остановимся более подробно на сегментации
изображения, поскольку многие преобразования выполняются именно на основании её
результатов.
Сегментация обычно понимается как процесс
поиска однородных областей на изображении. Этот этап весьма трудный и в общем
виде не алгоритмизированный до конца для произвольных изображений. Наиболее
распространены методы сегментации, основанные на определении однородных
яркостей (цветов) или однородностей типа текстур.
При существовании стабильных различий в
яркостях отдельных областей поля зрения применяются пороговые методы. Методы
наращивания областей эффективны при наличии устойчивой связности внутри
отдельных сегментов. Метод выделения границ хорошо применять, если границы
достаточно четкие и стабильные. Перечисленные методы служат для выделения
сегментов по критерию однородных яркостей. Заметим, что один из самых
эффективных методов наращивания областей предполагает выбор стартовых точек
либо с помощью оператора (алгоритм центроидного связывания), либо
автоматически. Эффективным здесь представляется метод водоразделов, основанный
на поиске локальных минимумов с последующей группировкой вокруг них областей по
связности.
Все методы весьма приемлемы с точки зрения
вычислительных затрат, однако, для каждого из них характерна неоднозначность
разметки точек в реальных ситуациях из-за необходимости применения эвристик
(выбор порогов совпадения яркостей, выбор цифровых масок и т.д.). Заслуживает
внимания в связи с этим предложенный метод многозначной разметки, основанный на
комбинации различных приемов для снижения неопределенности. Важное практическое
значение имеют допускающие параллельную обработку алгоритмы ускорения процесса
разметки на основе логического анализа соседних элементов.
Для описания и сегментации свойств
изображений, именно, однородности, шероховатости, регулярности, применяют
текстурные методы делящиеся условно на две категории: статистические и
структурные. Примером статистического подхода является использование матриц
совпадений, формируемых из исходных изображений, с последующим подсчетом
статистических моментов и энтропии. При структурном подходе, например, на
основе мозаики Вороного, строится множество многоугольников. Многоугольники с
общими свойствами объединяют в области. Для исследования общих свойств часто
используют признаки - моменты многоугольников.
После сегментации возникают помехи в виде
как разрозненных изменений изолированных элементов изображения, так и в виде
искажений некоторых связных областей. Не останавливаясь подробно на методах
борьбы с подобными помехами, отметим лишь, что на практике наибольшее
распространение получили цифровые фильтры-маски и нелинейные фильтры типа
медианных. При этом в случае сегментации путем выделения границ использование
усредняющих фильтров-масок невозможно, так как границы при этом не
подчеркиваются, а размываются. Для подчеркивания контуров применяются
специальные операторы интегрального типа.
Рассмотренные методы сегментации могут
быть сведены к схеме:
Заключение.
Процесс распознавания изображений является
очень актуальной, но сложной многоэтапной процедурой. Иерархичность обусловлена
тем, что различные задачи обработки тесно связаны. Именно поэтому так важно
правильно подобрать метод, необходимый в каждой конкретной ситуации, ведь качество
решения одной задачи обработки непосредственно влияет на остальные.
Анализ рассмотренных методов сегментации
позволяет более точно подобрать необходимый метод и тем самым значительно
повысить эффективность данного этапа. Что в свою очередь значительно повысит
эффективность всего процесса обработки изображения.
Литература:
1.
Путятин Е.П., Аверин
С.И. Обработка изображений в робототехнике. М: Машиностроение, 1990. 320 с.
2.
Shalkoff R.J. Digital image processing and computer vision. – New
York-Chichester-Brisbane-Toronto-Singapore: John Wiley & Sons, Inc., 1989.
- 489 p.
3.
Техническое зрение
роботов. Под ред. Ю.Г.Якушенкова – М.: “Машиностроение” 1990. – 300с.