Ибрагимов У.М., Хамидова Ф.Ф.
Южно-Казахстанский
государственный университет им. М.Ауезова
Моделирование
задачи фазового перехода
в управляемой
системе
Постановка задачи. Пусть управляемая система описывается уравнением [1]
(1)
где , -мерный вектор
евклидова пространства постоянная
матрица порядка управляющий
параметр, непустое подмножество пространства . В пространстве выделено
непустое подмножество , которое называется терминальным.
Определение. Будем
говорить, что из точки возможен переход на , если существует измеримая функция , , такая, что решение , уравнения
,
при попадает на , т.е. .
Принцип
максимума Понтрягина [2]. Для формулировки принципа максимума мы рассмотрим еще
одну систему уравнений относительно допольнительных
переменных
. (2)
Вводя -мерный вектор и функцию Понтрягина
(Гамильтона)
, (3)
мы можем записать уравнения в виде
, (4)
и
(5)
в виде гамильтоновой системы
, (6)
. (7)
Теорема
[2]. Пусть , - такое допустимое управление,
переводящее фазовую точку из положения в положение , a
- соответствующая
траектория, так что . Для оптимальности управления и траектории необходимо
существование такой ненулевой непрерывной вектор-функции , соответствующей функциями и , что:
10. для всех , функция переменного достигает в точке максимума
; (8)
20. в конечный момент выполнено соотношение
. (9)
Апробация алгоритма и анализ результатов. Рассмотрим уравнение , где -вещественный
управляющий параметр дано в правой части в аддитивной форме
подчиненный условию . Приводим уравнения к управляемой системе виду:
(10)
Рассмотрим задачу о попадании в начало
координат (0, 0) из заданного начального состояния . Функция Понтрягина в рассматриваемом
случае имеет вид
. (11)
Далее, для вспомогательных переменных мы получаем систему
уравнений
откуда , где и -некоторые
постоянные.
Для изучения траекторий, соответствующих
отрезкам времени, на которых и , рассмотрим систему
(12)
(получающуюся из системы (10) при ). Произвольное решение этой системы может быть записано в
виде
, (13)
где и -постоянные (). Таким образом, фазовыми траекториями являются окружности с
центром в начале координат:
(14)
Из (13) видно,
что движение фазовой точки по окружности (14) совершается по часовой стрелке с линейной
скоростью . Отметим, в частности, что за промежуток времени, имеющий
длину , фазовая точка двигаясь по часовой стрелке, описывает ровно половину окружности.
Как было указано [2], каждое оптимальное
управление является
кусочно-постоянной функцией, получающейся из функции , равной поочередно +1 и -1 на интервалах длины , при помощи сдвига на некоторый отрезок . Если оптимальное управление поочередно равно +1 и
-1 на интервалах , , и в заключение, на некотором интервале длины равно +1, то
соответствующая оптимальная траектория может быть построена следующим образом (рис.1).
Рисунок 1 - График управления
В течение заключительного отрезка времени
фазовая точка движется по окружности (где на этом отрезке
времени), причем по той из этих окружностей, которая проходит через начало
координат.
Рисунок 2 – Оптимальные фазовые траектории уравнения
Такой окружностью является окружность
радиуса 1 с центром в точке (рис.2). По этой окружности фазовая точка попадает в
начало координат, проходя дугу, меньшую половины окружности (где ). Таким образом, обозначив нижнюю полуокружность этой
окружности через , мы найдем, что заключительный кусок фазовой траектории
представляет собой некоторую дугу полуокружности .
Выводы. Итак, согласно теореме, только указанные траектории
могут быть оптимальными, причем из проведенного исследования видно, что из
каждой точки фазовой плоскости исходит только одна траектория, ведущая в начало
координат, которая может быть оптимальной. Из теоремы вытекает, что в
рассматриваемом примере для любой начальной точки существует
оптимальная траектория. Таким образом, найденные траектории являются
оптимальными, и других оптимальных траекторий, ведущих в начало координат, не
существует.
Литература