Зинченко А.Е., асс. Козаченко А.А.
Национальный горный университет, Украина
Обоснование методики классификации
полудрагоценных камней по их текстуре
В
статье «Обзор основных методов распознавания образов в компьютерных системах»
были рассмотрены основные методы распознавания образов в контексте задачи
распознания рисунков текстур камней. Среди этих методов были выделены
нейросетевые, как наиболее оптимальные для решения этой задачи.
Многослойный персептрон
Многослойными
персептронами называют нейронные сети прямого распространения. Входной сигнал в
таких сетях распространяется в прямом направлении, от слоя к слою. Многослойный
персептрон в общем представлении состоит из следующих элементов:
·
множества входных узлов, которые образуют входной слой;
·
одного или нескольких скрытых слоев вычислительных нейронов;
·
одного выходного слоя нейронов.
Многослойный
персептрон представляет собой обобщение однослойного персептрона Розенблатта.
Количество входных и выходных элементов в многослойном персептроне определяется
условиями задачи.
Многослойный
персептрон содержит один или несколько слоев скрытых нейронов, не являющихся
частью входа или выхода сети. Эти нейроны позволяют сети обучаться решению
сложных задач, последовательно извлекая наиболее важные признаки из входного
образа.
Многослойный
персептрон обладает высокой степенью связности, реализуемой посредством
синаптических соединений. Изменение уровня связности сети требует изменения
множества синаптических соединений или их весовых коэффициентов.
Комбинация
всех этих свойств наряду со способностью к обучению на собственном опыте
обеспечивает вычислительную мощность многослойного персептрона. Однако эти же
качества являются причиной неполноты современных знаний о поведении такого рода
сетей: распределенная форма нелинейности и высокая связность сети существенно
усложняют теоретический анализ многослойного персептрона.
Сеть Кохонена
Сеть
Кохонена имеет всего два слоя: входной и выходной, ее называют
самоорганизованной картой. Элементы карты располагаются в некотором пространстве
- как правило, двумерном.
Сеть
распознает кластеры в обучающих данных и распределяет данные по соответствующих
кластерах. Если дальше сеть встречается с набором данных, непохожим ни на одни
из известных образцов, она относит его к новому кластеру. Если в данных
содержатся метки классов, то сеть способна решать задачи классификации.
Сеть
Кохонена учится методом последовательных приближений. Начиная со случайным
образом выбранного выходного расположения центров, алгоритм постепенно
улучшается для кластеризации обучающих данных.
Основной
итерационный алгоритм Кохонена последовательно проходит ряд эпох, на каждой
эпохе обрабатывается один обучающий пример. Входные сигналы (векторы
действительных чисел) последовательно предъявляются сети, желаемые выходные
сигналы не определяются. После предъявления достаточного числа входных
векторов, синаптические весы сети определяют кластеры. Весы организуются так,
что топологически близкие узлы чувствительны к похожим входным сигналам.
Сеть Хопфилда
Сеть
Хопфилда использует три слоя: входной, слой Хопфилда и выходной слой. Каждый
слой имеет одинаковое количество нейронов. Входы слоя Хопфилда подсоединены к
выходам соответствующих нейронов входного слоя через изменяющиеся веса
соединений. Выходы слоя Хопфилда подсоединяются ко входам всех нейронов слоя
Хопфилда, за исключением самого себя, а также к соответствующим элементам в
выходном слое. В режиме функционирования, сеть направляет данные из входного
слоя через фиксированные веса соединений к слою Хопфилда. Слой Хопфилда
колебается, пока не будет завершено определенное количество циклов, и текущее
состояние слоя передается на выходной слой. Это состояние отвечает образу, уже
запрограммированному в сеть.
Обучение
сети Хопфилда требует, чтобы обучающий образ был представлен на входном и
выходном слоях одновременно. Рекурсивный характер слоя Хопфилда обеспечивает
средства коррекции всех весов соединений. Недвоичная реализация сети должна
иметь пороговый механизм в передаточной функции. Для правильного обучения сети
соответствующие пары "вход-выход" должны отличаться между собой.
Если
сеть Хопфилда используется как память, адресуемая по смыслу, она имеет два
главных ограничения. Во-первых, число образов, которые могут быть сохранены и
точно воспроизведены, является строго ограниченным. Если сохраняется слишком
много параметров, сеть может сходится к новому несуществующему образу,
отличному от всех запрограммированных образов, или не сходится вообще.
Предложенная методика
Для
решения задачи о классификации рисунка текстуры было предложено использовать
послойно полносвязную нейронную сеть прямого распространения (персептрон). В
качестве входных данных выступает изображение текстуры камня. Ограничивающей
особенностью любой нейросети является константное количество входов. Поэтому
решено масштабировать рисунок до константных размеров, дабы его можно было бы
подать на вход нейросети. Размеры изображения примем 200x200 пикселей, так как,
при таких масштабах еще можно рассмотреть рисунок текстуры.
Исходя
из того, что входными данными для нейросети выступает изображение размером
200x200 пикселей, использовать многослойный персептрон довольно затруднительно.
Поскольку на каждый нейрон первого скрытого слоя будет приходится по 40000
синаптических связей (при использования RGB составляющих цвета пикселя в
качестве входных данных необходимо 120000 синаптических связей). Для решения
этой проблемы можно разделить входное изображение на несколько частей и
произвести классификацию элементов текстуры и подать значения классификации
элементов на персептрон. Что бы сохранить связность изображения предложено
вначале разделить его на участки 10х10, полсе чего на 100х1 и 1х100. Таким
образом количество входных данных возрастет в 3 раза, но сохранится связность
соседних участков изображения. Для классификации отдельных участков текстуры
целесообразно использовать слой Кохонена. Соответственно для каждого варианта
разделения изображения, будет обучен свой слой Кохонена (всего 3 слоя).
Результатом классификации частей изображения будут 1200 номеров классов,
значения которых можно подать на многослойный персептрон.
Для
опытов были выбраны изображения текстур камней содержащие 6 основных рисунков:
«Полосчатый», «Пятнистый», «Однородный», «Пейзажный», «Плойчатый»,
«Концентрически-зональный». Реализованы нейронные сети для распознавания
изображений с различным количеством нейронов. В качестве входных данных брались
значения RGB составляющих пикселей и значения пикселей в градациях серого.
Нейронные сети били обучены на выборке по 10 изображений на каждый класс. В
качестве контрольной выборки было взято по 8 изображений на класс. Результаты
опытов приведены в таблицах 1 и 2.
Таблица 1: Результаты опытов для размерности слоя Кохонена в 600
нейронов и одним скрытым слоем персептрона с 800 нейронами
Контрольная выборка |
RGB |
Градации серого |
Полосчатый |
50,00% |
50,00% |
Пятнистый |
62,50% |
50,00% |
Однородный |
75,00% |
75,00% |
Пейзажный |
50,00% |
62,50% |
Плойчатый |
50,00% |
50,00% |
Концентрически-зональный |
62,50% |
50,00% |
Таблица 2: Результаты опытов для размерности слоя Кохонена в 1000
нейронов и одним скрытым слоем персептрона с 1200 нейронами
Контрольная выборка |
RGB |
Градации серого |
Полосчатый |
62,50% |
75,00% |
Пятнистый |
75,00% |
62,50% |
Однородный |
75,00% |
75,00% |
Пейзажный |
50,00% |
50,00% |
Плойчатый |
62,50% |
50,00% |
Концентрически-зональный |
62,50% |
62,50% |
Заключение
В
ходе опытов было установлено, что классификационные способности сети при
увеличению количества нейронов возрастают довольно медленно. Так же, из опытов,
очевидно, что значения цвета во входных данных не имеет значительного влияния
на качество распознавания. А, исходя из того, что при использовании значений
RGB, входных данных в три раза больше, целесообразней на вход, подавать
значения градаций серого. Среди обученных нейросетей лучшие результаты показали
сети с размерностью слоев Кохонена в 1000 нейронов и одним скрытым слоем
персептрона в 1200 нейронов.
Литература
1.
Головко В.А.
Нейроинтеллект: Теория и применения. Книга 1. Организация и обучение нейронных
сетей с прямыми и обратными связями – Брест:БПИ, 1999, - 260с.
2.
Головко В.А.
Нейроинтеллект: Теория и применения. Книга 2. Самоорганизация,
отказоустойчивость и применение нейронных сетей – Брест:БПИ, 1999, - 228с.