Д.т.н.
В.В. Мартынов, П.В. Мартынов
Саратовский государственный технический университет
имени Гагарина Ю.А., Россия
ОСНОВНЫЕ ПРОБЛЕМЫ
ОБРАБОТКИ ДАННЫХ О СОСТОЯНИИ И ЭВОЛЮЦИИ
СЛОЖНЫХ СИСТЕМ И ПРОЦЕССОВ
Обработка данных, полученных в процессе
теоретических или экспериментальных исследований состояния и эволюции различных
систем и процессов в машиностроении,
энергетике, экологии, медицине, экономике, биологии и других областях
практической деятельности, заключается в их аналитическом или
статистическом выравнивании в зависимости от способа получения. В случае, если
данные характеризуют развитие какого-либо процесса во времени, т.е.
представляют собой временнόй ряд, используется аналитическое выравнивание
с помощью различных кривых, уравнения которых при соблюдении ряда условий можно
применить и для прогнозирования. В случае, если данные представляют собой часть
членов некоторой достаточно большой совокупности (называемой генеральной),
используется статистическое выравнивание с помощью различных распределений,
которые позволяют ответить на вопрос о вероятностях наступления различных событий.
Вопрос о выборе вида кривой или
распределения является основным при выравнивании данных, поскольку ошибка в его
решении всегда оказывается более значимой по своим последствиям, чем ошибка,
связанная со статистическим оцениванием параметров.
Выбор кривой или распределения можно
осуществить различными способами. Однако независимо от того, какой способ будет
принят, всегда является целесообразным предварительный анализ содержательной
сущности изучаемого процесса с целью раскрытия физического механизма,
генерирующего данные, и оценки степени его устойчивости в условиях действия
возмущений. Практически это позволяет сократить число кривых или распределений,
которые выступают в качестве альтернативных при непосредственном исследовании
данных. Однако для данных, полученных в процессе исследования состояния и
эволюции сложных систем и процессов, основа для содержательного анализа часто
отсутствует, поскольку они относятся к так
называемым “шумящим”, т.е. к системам и процессам, в которых выходные данные
являются случайными даже тогда, когда входные данные неслучайны. Это означает,
что фиксированным значениям на входе системы или процесса (далее – объекта)
практически всегда соответствует случайное значение на выходе, т.е. неопределенность
их поведения. Причем степень неопределенности тем больше, чем сильнее влияние
“шумовых” свойств. В результате обработка выходных данных возможна только на
основе применения методов, которые позволят решить проблему отображения закономерностей
их появления на выходе объекта. Решение этой проблемы сводится к реализации
идеи адаптивного моделирования данных [1, 2] и заключается в следующем.
Информация, снимаемая с выхода объекта (выходные данные), используется
для построения их модели (рис.1, а) [3]. Качество модели, т.е. количественная
оценка ее изоморфности моделируемым данным, производится путем непрерывного
оценивания погрешностей , гдеи– выходные данные модели и объекта, соответственно.
Структурная схема адаптивного моделирования строится на основе селективного (в
частном случае – последовательного) перебора многих возможных вариантов
структуры и параметров модели по некоторому внешнему обобщенному критерию F, например вида:
|
|
(1) |
минимум которого необходимо
отыскать. При этом в соответствии с принципом самоорганизации [4] критерий при
постепенном увеличении сложности модели вначале уменьшается, затем проходит через точку минимума и начинает возрастать
а
б
Рис.В.1. Структурная схема
адаптивного моделирования:
о – модель оптимальной сложности;
УД – уровень
доверия
в области переусложненных моделей
(рис.1, б). Это происходит потому, что степень соответствия модели и объекта в
первом приближении линейно связана с отклонениями значений их параметров и при
сравнительно малых отклонениях имеет тот же порядок величины [5], поэтому в
условиях фиксированной достоверности сведений о параметрах бессмысленно
пытаться “уточнить” модель путем усложнения ее структуры. В связи с этим минимум
критерия и определяет единственную модель оптимальной сложности. Параметры каждой
модели в процессе перебора оцениваются различными методами и уточняются на
основе использования итеративных процедур до тех пор, пока критерий не
достигнет минимума или не опустится ниже установленного уровня (уровня доверия)
(рис.1, б).
Описанную процедуру
при необходимости (например, если у найденной оптимальной модели минимум
внешнего критерия не является острым) можно дополнить процедурой доопределения
(регуляризации) модели. В этом случае все модели, минимумы внешних критериев
которых лежат ниже уровня доверия, вновь сравниваются между собой, но уже по
другому, более жесткому критерию (критерию второго уровня), который может представлять
собой либо свертку в общем случае N
критериев вида (1) [6]
|
|
(2) |
вычисленных при делении исходной информации на N равных частей ( – одно из таких
разделений), если с помощью моделирования решается задача
прогнозирования, либо частный показатель, но с более узкой областью предельно
возможных значений, если решается задача идентификации. Модель, прошедшая такую
проверку, будет не только оптимальной, но и максимально помехоустойчивой (в
смысле зависимости от качественного состава входной информации), т.е. обладать
не только внутренней, но и внешней валидностью, верно определяя как имеющиеся
по результатам наблюдений данныеот объекта, так и данные, не зафиксированные в ходе
наблюдений, но также относящиеся к нему [7].
Таким образом, проблема обработки данных о
состоянии и эволюции сложных систем и процессов выходит за рамки используемых
на практике общепринятых статистических подходов и связана с решением
математических (разработка и адаптация математических методов моделирования),
программных (создание надежного программного обеспечения) и технологических (поиск
наиболее эффективных и экономичных приемов моделирования на ЭВМ для достижения
практически полезных результатов) задач, т.е. с разработкой целостной
совокупности методов построения и использования моделей, в основе получения которых
лежат обобщенные критерии, в том числе и критерии специального вида.
Литература
1. Льюнг Л. Идентификация систем. Теория для
пользователя / Л. Льюнг. – М.: Наука, 1991. – 432 с.
2. Шульце К.-П. Инженерный анализ адаптивных
систем / К.-П. Шульце, К.-Ю. Реберг. – М.: Мир, 1992. – 280 с.
3. Урин И.А. Системное моделирование точности
механической обработки / И.А. Урин, В.В. Мартынов // Прогрессивные направления
развития технологии машиностроения: межвуз. науч. сб. – Саратов: Сарат. гос.
техн. ун-т, 1993. – С.108-112.
4. Ивахненко А.Г.
Самоорганизация прогнозирующих моделей / А.Г. Ивахненко, Й.А. Мюллер. – Киев:
Техника; Берлин: ФЕБ Ферлаг техник, 1985. – 223 с.
5. Левин А.И. Математическое моделирование в
исследованиях и проектировании станков / А.И. Левин. – М.: Машиностроение,
1978. – 184 с.
6. Ивахненко А.Г. Помехоустойчивость
моделирования / А.Г. Ивахненко, В.С. Степашко. – Киев: Наукова думка, 1985. –
214 с.
7. Большаков А.А. Методы обработки
многомерных данных и временных рядов: учеб. пособие для вузов / А.А. Большаков,
Р.Н. Каримов. – М.: Горячая линия – Телеком, 2007. – 522 с.