Математика /5. Математичне моделювання

 

Васьковський О.В.

Вінницький національний технічний університет, Україна

 

Використання вейвлет перетворень в задачі розпізнавання контурів

 

 

Анотація

У даній роботі було розглянуто можливість використання комплексних вейвлетів для визначення границь об’єкту в задачі розпізнавання зображень. Запропоновано новий підхід до фільтрації фону в задачі розпізнавання.

Вступ

Визначення границь – це фундаментальний інструмент в обробці зображень. Особливо важливе значення ця задача має у випадку розпізнавання образів, оскільки похибки на цьому етапі накопичуються при подальших розрахунках.

Границі отримані з двомірного зображення трьохвимірної події представляють собою залежні та незалежні одна від одної точки. Незалежні точки зазвичай характеризують характер поверхні та фону, так наприклад як текстура. В той час як залежні точки характеризують геометрію сцени, тобто положення об’єктів один відносно одного.

Існує цілий ряд методів, що використовують вейвлети для визначення граничних точок об’єктів та попередньої фільтрації, але вони крім очевидних переваг, таких як швидкодія, володіють і недоліками, такими як: коливання в області видалення вейвлетів, залежність вейвлетів від дисперсії сигналу, аліасинг, відсутність спрямованості вейвлетів.

Загальний огляд проблеми

В той час як Фур’є синусоїди відповідають значній спрямованості хвиль, то звичайний тензор вейвлетів такий, що вони орієнтовані одночасно в декількох напрямах. Ця відсутність явної спрямованості значно ускладнює моделювання та обробку таких геометричних явищ як границі та гребені.

Відмінність вейвлетів полягає в тому, що вони базуються на коливаннях в дійсній частині вейвлету, в той час як перетворення Фур’є базується на комплексному представлені коливань:

 

 

де . Осцилюючі компоненти синуса та косинуса(дійсна та уявна частини, відповідно) утворюють пару перетворень Гілберта, так як вони зсунуті по фазі на 90° один відносно одного. В сукупності вони утворюють аналітичний сигнал , який відображає лише одну половину частотної осі(). Комплексна складова гілбертового перетворення має вигляд:

для сигналу

         В загальному випадку вейвлет розкладання сигналу :

         Коефіцієнти апроксимації(маштабуючі) та деталізації відповідно будуть:

         Відповідно до представлення Фур’є, відобразимо вейвлет перетворення в комплексній формі:

         Де, по аналогії   дійний та парний, а  - уявний та непарний вейвлети. Більше того, якщо  та  формуються з пари Гілбертових перетворень(зсув фази 90° один відносно одного), то  – це аналітичний сигнал і супроводжується лише на половині частотної області.

Функція масштабування в комплексній формі визначається аналогічно:

         Проектуючи сигнал на область , отримуємо комплексні вейвлет коефіцієнти:

 

 

зі значенням вектору:

та фазою:

де .

         Використаємо це в створенні банку фільтрів дискретних вейвлет перетворень для утворення комплексного вирішення даної функції. Фільтр реальних значень коефіцієнтів змінюється на фільтр комплексних коефіцієнтів при правильній побудові методології яка задовольняє умові збіжності. Після цього комплексний фільтр може бути знову розкладений на два фільтри в реальній області. Таким чином, два фільтра реальних значень утворять гілбертову пару. Комбінована пара з двох таких фільтрів називається аналітичним фільтром. Формулювання та інтерпретація аналітичного фільтру показано на малюнку:

 

 

Це дає змогу застосовувати розроблений метод для визначення коефіцієнтів розкладання не втрачаючи при цьому уявну частину матриці. В нашому випадку зображення. Очевидно, що це дає значні переваги в задачі розпізнавання образів, оскільки досягається неперервність контуру за рахунок уникнення ефектів шахової дошки. Варто відмітити і швидкодію запропонованого методу, оскільки більшу частину перетворень можна виконати застосувавши швидке вейвлетне розкладання та смуговий фільтр.

Таким чином дійсна частина  міститиме коефіцієнти, що визначають дійсну частину. Проаналізувавши ці коефіцієнти можна утворити масив точок, який повторює контури об’єктів. Оскільки високочастотна складова  першого рівня розкладання міститиме лише незначні зміни, то очевидно, що масив отриманих значень міститиме значну кількість завад . Виникає необхідність їх профільтрувати за аналогією фільтрації в одномірних та звичайних двомірних методах:

Отримане зображення міститиме відфільтровану матрицю коефіцієнтів, готову для використання в розпізнаванні.

 

Висновок

Виходячи з наведеного матеріалу видно, що комплексні вейвлети чудово справляються з задачею фільтрації фону в задачі розпізнавання. На відміну від звичайних вейвлетних методів, запропонований метод позбавлений таких недоліків як: коливання в області видалення вейвлетів, залежність вейвлетів від дисперсії сигналу, аліасинг, відсутність спрямованості вейвлетів. Вирішення цих проблем позбавляє нас проблем виникнення ефекту шахової дошки після фільтрації, що дозволяє зменшити похибку на наступних етапах розпізнавання.

 

Список літератури

 

1. R. A. Gopinath, Wavelet Based Post Processing of Low Bit Rate Transform Coded Images, Proc. ICIP’94, Nov. 1994. p. 913 917.

2. B. Jeon, J. Jeong and J. Jo, Locking artifacts reduction in image coding based on minimum block boundary discontinuity, Visual Communications Proceedings, Image Processing, May 1995. p. 198 209.

3. J. Jeong and B. Jeon, Use of a class of two dimensional funtions for blocking artifacts reduction in image coding, Proceedings of the International Conference on Image Processing, October 1995. – p. 478 481

4 T. C. Hsung, D. P. K. Lun and W. C. Siu, A Deblocking Technique for Block Transform Compressed Image Using Wavelet Transfor Modulus Maxima, IEEE Trans. Image Processing, vol. 7, no. 10, Oct. 1998. – p. 1488 1496.

5. S. Wu, H. Yan and Z. Tan, An Efficient Wavelet Based Deblocking Algorithm for Highly Compressed Images, IEEE Trans. Circuits Syst. [Video Technol]., vol. 11, no. 11, Nov. 2001. – p. 1193 1198.