Полный текст
Введение
Известно, что линейно-квадратичная задача слежения ставится следующим образом (см., например, [1]). Рассматривается управляемая система вида
(1)
(2)
Здесь вектор состояния системы, вектор вектор наблюдаемых параметров, вектор управляющих параметров, вектор внешних возмущений. Эталонное движение задается в явном виде , а функционал качества имеет вид
(3)
или
(4)
В дальнейшем будем предполагать, что все матричные функции, входящие в (1)(3) непрерывно дифференцируемы при , тогда решение данной задачи дается следующей формулой для оптимального управления
Здесь решение матричного дифференциального уравнения Риккати
, , а решение линейной дифференциальной системы
Рассмотрим управляемую систему вида
Здесь эталонное движение задается функцией , а функционал качества имеет вид
null (5)
Полагая , приходим к задаче вида (1)(3) при
null
Представим и в следующем виде:
Тогда для матриц , , получается нелинейная система матричных уравнений вида
(6)
с граничными условиями
а система уравнений для и имеет вид
(7)
(8)
с граничными условиями
Для анализа задач управления с сингулярными возмущениями обычно применяется метод пограничных функций Васильевой (см. обзоры [2-4]). В настоящей статье будет применен метод декомпозиции [5]. Суть метода декомпозиции состоит в следующем. При некоторых естественных предположениях о гладкости и нормальной гиперболичности сингулярно возмущенная система
преобразованием
приводится к виду
в котором первое уравнение не зависит от быстрой переменной, а решениями второго уравнения являются так называемые правые пограничные функции, для которых справедливы оценки типа , при не зависящих от малого параметра числах и ( , ). При этом соответствует медленному интегральному многообразию исходной системы, а быстрому многообразию некоторой вспомогательной системы. При этом переменная соответствует регулярной составляющей решения исходной системы, а переменная погранслойной составляющей. Важно отметить, что если при , то и функция содержит в качестве множителя малый параметр. Матричная функция удовлетворяет так называемому уравнению инвариантности
Следует отметить, что применение в реальных системах управления управляющих воздействий с использованием пограничных функций далеко не всегда целесообразно, так как предполагает резкое изменение напряжения в цепях управления на очень коротком промежутке времени. С другой стороны, отказ от использования таких функций может незначительно сказываться на погрешности функционала качества. Ниже будет показано, что субоптимальное управление, не содержащее правых пограничных функций, приводит к погрешности порядка в функционале (5), что вполне приемлемо с прикладной точки зрения.
1. Оценка погрешности функционала
Для оценки погрешности при построении субоптимального управления функционал (3) можно представить в следующем виде:
Здесь
с условием на конце рассматриваемого промежутка т. е.
Для доказательства этого факта достаточно использовать непосредственно проверяемое равенство
Легко видеть, что минимальное значение определяется равенством
Пусть каким-либо способом построено субоптимальное управление
с соответствующими приближенными выражениями для вектора состояния ( ), коэффициента усиления ( ) и вектора ( ) (вместо индекса используется индекс ). Введем следующие обозначения:
Отсюда следует, что если вместо оптимального управления используется приближенное (субоптимальное) управление
то возникающая при этом погрешность функционала качества представима в следующем виде:
Для краткости аргументы у функций под знаком интеграла опущены.
Полагая и используя выражение для , получаем
(9)
Следует заметить, что полученная формула не связана с конкретным выбором приближений и может применяться для оценки погрешности при применении как асимптотических, так и численных методов приближенного анализа.
Если, например, рассмотреть случай регулярной зависимости матричных и векторных функций, входящих в (1), (2) и (3) от малого параметра, в предположении, что эти функции достаточное число раз дифференцируемы по своим аргументам, то можно применить эту формулу для оценки погрешности функционала при применении простейшего варианта метода малого параметра. При этом проявляется некоторое отличие от задач оптимального управления, связанное с зависимостью погрешности от .
В рассматриваемом случае формула (9) с учетом выражений
имеет вид
(10)
Нетрудно видеть, что пренебрежение регулярными членами порядка и правыми пограничными функциями, содержащими в качестве множителя малый параметр, в представлении переменных и приводит к погрешности порядка в функционале качества.
2. Декомпозиция системы уравнений Риккати
Будем предполагать, что все собственные числа матрицы на рассматриваемом отрезке имеют положительные вещественные части. Полагая в последних двух уравнениях системы матричных дифференциальных уравнений (6) малый параметр равным нулю, получим уравнения
Отсюда следует, что медленное интегральное многообразие этой системы имеет вид
Приравнивая в соответствующих уравнениях инвариантности члены, содержащие множителем первую степень малого параметра, получим соотношения для определения матричных функций
и
(11)
Последнее равенство представляет собой однозначно разрешимое матричное уравнение Ляпунова. После подстановки найденного решения в предыдущее уравнение матрица находится путем умножения на соответствующих слагаемых, т. е.
(12)
При необходимости аналогичным образом определяются соответствующие матричные коэффициенты при более высоких степенях малого параметра.
Важно отметить, что при матричные функции обращаются в нуль. Отсюда следует, что правые пограничные функции , в представлении матриц , должны содержать в качестве множителя малый параметр. Это означает, что если при построении закона управления пренебречь правыми пограничными функциями, то в силу формулы (10) погрешность функционала качества не превысит величину .
3. Декомпозиция линейной системы уравнений
Обратимся к системе (7)(8) и сначала рассмотрим соответствующую однородную систему, не содержащую правых пограничных функций , , и членов порядка у регулярных матричных функций , :
где , .
Для декомпозиции этой линейной системы можно применить известный метод приведения к блочно-диагональной форме. С этой целью сначала вводится новая быстрая переменная . Используемая в этой формуле матричная функция удовлетворяет несимметричному матричному дифференциальному уравнению Риккати
из которого она может быть легко найдена в виде разложения по степеням малого параметра
где
Для переменных , получаем систему
или после выполнения транспонирования
На следующем шаге вводится новая медленная переменная . При этом матричная функция удовлетворяет линейному матричному дифференциальному уравнению
из которого она может быть легко найдена в виде разложения по степеням малого параметра где
В результате получаются две независимые подсистемы
Для матричных функций и , пренебрегая членами второго и более высоких порядков в разложении по степеням малого параметра, получаем следующие представления:
Здесь
Применение преобразования
(13)
к неоднородной системе (7), (8) приводит к уравнениям
(14)
и
Здесь
В этих уравнениях и выражениях для функций и опущены правые пограничные функции , , и члены порядка у регулярных функций. Принимая во внимание, что функция содержит малый параметр в качестве множителя, получаем следующее приближенное выражение для :
в котором учтены только регулярные члены порядка , а регулярные члены более высоких порядков и правые пограничные функции, которые содержат в качестве множителя малый параметр, опущены. В рассматриваемом случае формула для оптимального управления принимает вид
Чтобы получить погрешность порядка при вычислении значения функционала качества для субоптимального управления, следует использовать приближенное выражение
(15)
Что касается , использование представления
которое вытекает из (13), и полученное выше выражение для позволяет применять следующее приближенное выражение:
Таким образом, система (6) имеет медленное интегральное многообразие, которое с точностью до членов порядка включительно описывается уравнениями (15), где является решением уравнения Ляпунова (11), задается формулой (12), а матрица представляет собой решение матричного дифференциального уравнения
в котором задается выражением (15). Через обозначим выражение
(16)
в котором в качестве следует взять решение уравнения (14) с граничным условием .
Суммируя вышесказанное, приходим к следующему утверждению.
Теорема. Применение субоптимального управления
где и заданы выражениями (15), а выражением (16), приводит к погрешности порядка в функционале (5).
Выводы
В статье обсуждается возможность применения метода декомпозиции для понижения размерности задачи оптимального слежения с сингулярными и случайными возмущениями. Традиционные методы решения задач оптимального управления с сингулярными возмущениями для таких задач неприменимы, так как основываются на предположении о гладкости правых частей, которое входит в противоречие с наличием случайных возмущений. Метод декомпозиции позволяет избежать этой трудности и получить формулу для субоптимального управления.