МОДУЛЬНИЙ СИНТЕЗ  СХЕМ КЛАСИФІКАЦІЇ ТА РОЗПІЗНАВАННЯ

Повхан І.Ф.*, Мошкола П.В. **, Василенко Ю.А. ***

 *Закарпатський державний університет, м. Ужгород, Україна

**Карпатський університет імені Августина Волошина, м. Ужгород, Україна

***Закарпатський державний університет, м. Ужгород, Україна

xcomi@rambler.ru

 

Work is devoted to research of such models of systems of recognition at which multistage designing, it is possible to use any algorithms of recognition on an any step. The ideology of mathematical designing of systems of recognition which uses any algorithms for each specific target is offered. In a basis of work the put concept of an intensification of use of opportunities of known methods of recognition of images which will allow to use as much as possible full the saved up potential in the theory of recognition of images.

 

В сучасному розвитку теорії штучного інтелекту велика роль відводиться  важливій проблемі – розв’язку завдань по створенню високоефективних систем розпізнавання образів.    

Центральною проблемою в теорії розпізнавання образів є побудова на основі певних теоретичних та експериментальних досліджень ефективних обчислювальних систем для віднесення об‘єктів до відповідних класів. Ця задача ділиться на дві підзадачі: навчання та розпізнавання. Перший етап здійснюється шляхом надання системі певних початкових даних, в результаті чого система розпізнавання повинна набути спроможність реагувати однаковим чином на об‘єкти з однакових класів і по-різному – на  об‘єкти з різних класів. На етапі розпізнавання система повинна на основі певної інформації, отриманої з першого етапу, провести процес класифікації об‘єктів, які подаються на вхід системи, тобто етап розпізнавання характеризує дії вже навченої системи. В тих випадках, коли людина запрограмувала систему на певне правило класифікації, задача розпізнавання образів розв‘язується лише частково, бо зрозуміло, що головну проблему людина бере на себе, використовуючи лише обчислювальні потужності машини. Підхід, який базується на методах розгалуженого вибору ознак дозволяє побудувати повністю автоматичну систему розпізнавання, яка принципово позбавлена цього недоліку.

Так обмеження відомих підходів в теорії розпізнавання образів випливають з парадигми фіксації методу, що в ряді задач великої складності є недостатнім для отримання високої ефективності. Отже виникає проблема побудови нових методів (схем), орієнтованих на оптимізацію відбору ознак та застосування відповідних до задачі алгоритмів класифікації. Таким чином даний напрямок наукових досліджень є важливими та актуальними.

Так, наприклад, парадигма сучасних методів та підходів розпізнавання, зводиться до вузької орієнтації на конкретний клас задач. В якості альтернативи можна запропонувати використання методів, які базуються на методі розгалуженому виборі ознак, з метою найповнішого використання накопиченого арсеналу алгоритмів розпізнавання та класифікації. При цьому головна риса даного методу – можливість комплексного використання для розв’язання кожної конкретної задачі побудови системи розпізнавання багатьох відомих алгоритмів класифікації на основі єдиної методології – оптимальної апроксимації навчаючої вибірки (за кількістю ознак та об’єму пам’яті ЕОМ на їх зберігання) набором узагальнених ознак (алгоритмів), які входять в деяку схему (оператор), побудовану в процесі навчання.

В якості критерію оцінки важливості ознаки або групи ознак запропонуємо використання відповідних функціоналів, які формуються безпосередньо за даними навчальної вибірки та оптимізований метод розрахунку функціональної важливості ознак,  при якому немає необхідності зберігати  у пам‘яті ЕОМ всю вибірку [1,2,3,4].  

Практичне значення досліджуваних методів розгалуженого вибору ознак полягає в розробці підходів, числово-аналітичних методик і програм, які дозволяють синтезувати автономні системи розпізнавання, у створенні інструментарію для автоматичного проектування і конструювання систем розпізнавання на основі нової  методології, яка сприяє підвищенню якості роботи такої системи (через збільшення її ефективності) і значному зниженню витрат на її розробку (через автоматичний процес її побудови та можливість керування її складністю). Тобто, спираючись на особливості реалізації методу розгалуженого вибору ознак, досягається гнучкість, автономність та висока ефективність  побудованих систем розпізнавання. Швидкодія довільної системи побудованої на основі даного підходу  залежить, взагалі, від кількості кроків, через які проходить та або інша інформація при розпізнаванні, а також від часу, який витрачається на кожний з кроків. Тому швидкодія загального методу розгалуженого вибору ознак досить велика: кількість кроків – це кількість ярусів певного дерева розпізнавання (загальна схема методу розгалуженого вибору ознак – є деяке  дерево), а час, який витрачається на кожний з кроків,  є відносно невеликим, так як  на кожному етапі побудови ознак (вершин дерева) проходить розрахунок важливості ознак (ефективності алгоритмів розпізнавання) за простими формулами. Таким чином, швидкодію метода розгалуженого вибору ознак можна спрощено визначити наступним чином:

,

де час розрахунку певної ознаки в ій вершині найдовшого шляху в даному дереві розпізнавання, а кількість вершин на даному шляху. Зауважимо, що   час   не  потрібно плутати з часом, який витрачається на створення схеми розпізнавання (зрозуміло, що в значній мірі він залежить від алгоритму формування ознак).

Використання необхідної пам‘яті визначається, кількістю вершин результуючого дерева розпізнавання, а також складністю ознак, які стоять у вершинах дерева. Якщо позначити кількість вершин дерева розпізнавання через , а кількість інформації, яка витрачається на кожну ову ознаку через , то загальна витрачена пам‘ять , яка необхідна для реалізації методу розгалуженого вибору ознак, може бути оцінена наступною формулою:

.

Теорія алгоритмів вибору ознак (метод розгалуженого вибору ознак)  представляє собою перспективну наукову основу для подальших досліджень в області математичного конструювання та оптимізації одержаних систем розпізнавання.

Автоматична система генерації систем розпізнавання “Оріон” [4] використовувалась для синтезу систем прогнозування економічних явищ (крім чотирьох базових геометричних методів розпізнавання в систему були інтегровані метод потенціалів та метод еталонів), системи класифікації геологічних даних. Теоретичні та практичні результати запропонованого підходу можуть знайти додаткове застосування в сучасних інформаційно-аналітичних системах організаційного і технологічного типу.

 

Література

1. Повхан І.Ф., Василенко Ю.А., Василенко Е.Ю., Ковач М.Й., Нікарович О.Д. Мінімізація логічних деревоподібних структур в задачах розпізнавання образів // Науково технічний  журнал “European Journal of Enterprise  Technologies”. –   2004. – 3[9], – С. 12-16.

2. Повхан І.Ф., Василенко Ю.А., Василенко Е.Ю. Концептуальна основа систем розпізнавання образів на основі метода розгалуженого вибору ознак// Науково технічний журнал “European Journal of Enterprise Technologies”. – 2004. – 7[1], – С. 13-15.

3. Повхан І.Ф., Василенко Ю.А., Василенко Е.Ю. Метод розгалуженого вибору ознак в математичному конструюванні багаторівневих систем розпізнавання образів// Науково- технічний журнал “Штучний Інтелект”. – 2003. – №7, – С. 246-249.

4. Повхан І.Ф. Генерація узагальнених ознак в методі розгалуженого вибору ознак// Науково-  технічний журнал “Штучний Інтелект”. – 2004. – №3, – С.   516-522.