On the problem of optimal control of rotation axis reorientation of a spacecraft
- Authors: Gorelov Y.N.1, Kurganskaya L.V.1
-
Affiliations:
- Samara National Research University
- Issue: Vol 30, No 3 (2024)
- Pages: 76-88
- Section: Mathematical Methods in Natural Sciences
- URL: https://journals.ssau.ru/est/article/view/27949
- DOI: https://doi.org/10.18287/2541-7525-2024-30-3-76-88
- ID: 27949
Cite item
Full Text
Abstract
Various variants of the formulation of optimal control problem of the reorientation of the axis of dynamic symmetry of the spacecraft (spacecraft), which is the axis of rotation, are considered. It is assumed that the solution to this problem should be found in the class of movements with one directional (flat) rotation, provided that before and after the reorientation of the axis of rotation, the angular velocity of the spacecraft is the same. In this case, the angular motion of the spacecraft is controlled according to the "rotary jet engine" scheme, when the control moment is limited by the ellipsoid of rotation. The corresponding mathematical model of spacecraft motion for the control problem under consideration is given. In addition to the formulation of the problem of the steepest reorientation of the axis of rotation of the spacecraft, the optimal control problem is also formulated, for which optimal control for the full control moment is found. In order to analyze the formulation of the problem under consideration, the results of its reduction to the boundary value problem and to the isoperimetric variational problem are also presented.
Full Text
Введение
Рассматривается управляемое движение динамически симметричного космического аппара-
та (КА) вокруг центра масс. Исследованию оптимальной по быстродействию переориентации
КА посвящен ряд работ [1–5]. Например, в [1; 2; 5] рассмотрены задачи оптимального управ-
ления переориентацией оси вращения КА, являющейся осью его динамической симметрии, в
классе движений с одним направленным плоским поворотом. Соответственно, в [1; 3] были
поставлены и решены задачи оптимального управления в предположении, что угловая ско-
рость закрутки КА в течение маневра остается постоянной, а в [2] — в предположении, что
она может регулироваться с помощью автономной системы реактивных двигателей, когда
допустимые управляющие моменты ограничены поверхностью круглого прямого цилиндра.
В настоящей статье рассматривается также постановка взаимной задачи к задаче наискорейшей
переориентации оси вращения КА. Эти задачи аналогичны задаче оптимального управления,
рассмотренной в [2], но отличающиеся тем, что множество допустимых управляющих моментов
КА здесь ограничивается эллипсоидом вращения. Такую схему управления обычно называют
схемой «поворотного реактивного двигателя» [4]. В этом случае, как и в [2], требуется найти
оптимальное управление наискорейшей переориентацией оси вращения КА в классе движений
с одним направленным (в заданной плоскости) поворотом в инерциальном пространстве на
заданный угол γT: 0 < γT ≤ π. Кроме того, с целью анализа постановки рассматриваемой
задачи оптимального управления в настоящей статье также приводятся результаты ее сведения
к соответствующей краевой задаче и к изопериметрической задаче вариационного исчисления.
Вестник Самарского университета. Естественнонаучная серия 2024. Том 3, № 30. С. 76–88
Vestnik of Samara University. Natural Science Series 2024, vol. 3, no. 30, pp. 76–88 77 из 88
1. Уравнения управляемого движения оси вращения КА
в заданной плоскости
Пусть оси связанной системы координат КА Oxyz являются главными центральными осями
инерции, а ось Oz является также осью динамической симметрии КА. Тогда Jx = Jy = J и в
общем случае Jz ̸= J, где Jx, Jy, Jz — главные центральные моменты инерции КА. Управление
движением КА относительно центра масс и, соответственно, управление движением оси Oz в
заданной плоскости P с нормалью eω осуществляется в рассматриваемой задаче с помощью
моментов, создаваемых «поворотным реактивным двигателем» [4]:
Mx = auνx; My = auνy; Mz = azuνz, (1.1)
где a и az — постоянные, характеризующие эффективность управляющего воздействия «пово-
ротного реактивного двигателя»; νx, νy, νz — направляющие косинусы: ν2
x + ν2
y + ν2
z = 1; u —
степень дросселирования: 0 ≤ u ≤ 1.
В начальный момент пусть ось Oz совмещена с осью OZ некоторой инерциальной системы
координат OXYZ, а угол между осью Ox (или осью Oy) и осью OX (или осью OY) равен φ0.
Если обозначить через e0 орт оси Oz в начальный момент и через eT — в конечный момент
маневра ее переориентации, то нормаль к плоскости P определяется так: eω = e0 × eT/ sin γT,
и e0 · eT = cos γT. Угол между осью OX и нормалью eω равен δ, а между осью Ox и осью
OX в начальный момент, соответственно, δ − φ0. Угол между осью Ox и нормалью eω в
произвольный момент времени в течение маневра будет равен квазикоординате φ, равной
φ(t) = φ0 +
Rt
0
ωz(ξ)dξ.
Если γ — текущий угол поворота оси Oz (угол между осью Oz и OZ), ω = dγ
dt — ее угловая
скорость, а Ω — мгновенная угловая скорость закрутки КА вокруг оси Oz, то проекции вектора
угловой скорости КА на оси связанной системы координат Oxyz будут равны [2; 3]:
ωx = ω cos(δ − φ); ωy = ω sin(δ − φ), ωz = Ω. (1.2)
Дополнительно введем направляющие косинусы для экваториальной составляющей вектора
управляющего момента:
νэ
x = νx(ν2
x + ν2
y)−1
2 ; νэ
y = νy(ν2
x + ν2
y)−12
,
где (νэ
x )2 + (νэ
x )2 = (nэ)2 = 1, а nэ — управляющий параметр, который равен nэ = ±1. Можно
записать, что νx = νэ
x (ν2
x + ν2
y)
12
и νy = νэ
y (ν2
x + ν2
y)
12
, где ν2
x + ν2
y = 1 − ν2
z . Учитывая эти
соотношения и подставляя выражения (1.1) и (1.2) в динамические уравнения Эйлера [6],
получим
dω
dt
cos(δ − φ) + σωΩsin(δ − φ) =
a
J
u(1 − ν2
z )
1
2 νэ
x ; (1.3)
dω
dt
sin(δ − φ) − σωΩcos(δ − φ) =
a
J
u(1 − ν2
z )
1
2 νэ
y ; (1.4)
dΩ
dt
=
az
Jz
uz, (1.5)
где обозначено uz = uνz и σ = Jz/J.
Исключая направляющие косинусы для экваториальной составляющей управляющего
момента из первых двух уравнений системы (1.3) и (1.4), получим
dω
dt
2
+ σ2ω2Ω2 = b2(u2 − u2z
)(nэ)2,
Горелов Ю.Н., Курганская Л.В. К задаче оптимального управления переориентацией оси вращения...
Gorelov Yu.N., Kurganskaya L.V. On the problem of optimal control of rotation axis reorientation... 78 из 88
где b = a/J. С учетом этого уравнения и кинематического соотношения dγ
dt = ω, а также
(nэ)2 = 1 получим следующую систему уравнений управляемого движения оси динамической
симметрии КА:
dγ
dt
= ω;
dω
dt
= bn(u2 − u2z
− k2ω2Ω2)
1
2 , (1.6)
где n = 0,±1 — управляющий параметр, κ = σ/b = Jz/a. Соответственно, уравнение управле-
ния закруткой КА вокруг оси Oz получается из уравнения (1.5):
dΩ
dt
= bzuz, (1.7)
где bz = az/Jz.
Множество допустимых управлений для системы (1.6), (1.7) определяется следующими
ограничениями:
n = 0,±1; 0 ≤ κωΩ ≤ u ≤ 1; (1.8)
0 ≤ u2z
≤ u2 − k2ω2Ω2. (1.9)
Отметим, что компонента κωΩ в (1.9) пропорциональна гироскопическому моменту, возникаю-
щему при движении оси Oz и при Ω ̸= 0, то есть ограничение на величину uz = uνz необходимо
связано с выполнением условий плоского движения оси Oz.
Граничные условия для системы дифференциальных уравнений (1.6), (1.7) имеют следую-
щий вид:
γ(0) = 0; ω(0) = 0; Ω(0) = Ω0; (1.10)
γ(T) = γT; ω(T) = 0; Ω(T) = Ω0, (1.11)
где γT и Ω0 — заданные параметры маневра (0 < γT ≤ π и Ω0 > 0), а T — длительность
маневра, которую по условиям рассматриваемой здесь задачи требуется минимизировать.
Итак, теперь можно сформулировать следующую задачу оптимального управления, в
которой требуется минимизировать функционал
J0 =
ZT
0
dt (1.12)
на допустимом множестве, определяемом условиями (1.6)–(1.11).
2. Сведение исходной задачи оптимального управления
к взаимной задаче
Следуя [1; 2], вместо задачи оптимального управления (1.6)–(1.12) можно рассматривать
взаимную для нее задачу, в которой требуется переориентировать ось Oz КА за фиксированное
время T на максимальный угол γT. С учетом первого уравнения в (1.6) эта задача будет
эквивалентна задаче максимизации функционала
γT =
ZT
0
ω dt (2.1)
на множестве, которое определяется условиями (1.6)–(1.9), а также при учете граничных
условий (1.10), (1.11) в виде
ω(0) = 0; Ω(0) = Ω0; ω(T) = 0; Ω(T) = Ω0. (2.2)
Доказательство эквивалентности задач (1.6)–(1.12) и (1.6)–(1.9), (2.1), (2.2) аналогично
доказательству эквивалентности взаимных задач, которое приведено в [1].
Вестник Самарского университета. Естественнонаучная серия 2024. Том 3, № 30. С. 76–88
Vestnik of Samara University. Natural Science Series 2024, vol. 3, no. 30, pp. 76–88 79 из 88
Нормируя переменные γ, ω и Ω, систему уравнений (1.6), (1.7) приведем к следующему
виду:
dy
dτ
= n(u2 − u2z
− p2y2z2)
1
2 ;
dz
dτ
= uz
dx
dτ
= y
, (2.3)
где τ = t/T, x = (bT2)−1γ, y = (bT)−1ω, z = (bzT)−1Ω, p = κbbzT2 — параметр. Тогда с
учетом указанных преобразований с точностью до постоянного множителя функционал (2.1)
можно заменить функционалом
J1 =
Z1
0
ydτ (J1 = xT = (bT2)−1γT, xT = x(1)). (2.4)
Соответственно, граничные условия (2.2) здесь также следует переписать в виде:
y(0) = 0; z(0) = z0; y(1) = 0; z(1) = z0, (2.5)
где z0 = (bzT)−1Ω0 > 0.
Таким образом, вместо задачи (1.6)–(1.12) далее можно рассматривать эквивалентную ей
задачу максимизации функционала (2.4) при условиях (2.3), (2.5) и допустимых управлениях:
n = 0,±1; 0 ≤ u ≤ 1; 0 ≤ u2z
≤ u2 − p2y2z2. (2.6)
Можно показать, что на основе принципа оптимальности В.Ф. Кротова [1; 7] решение задачи
(2.3)–(2.6), как и в [2], сводится к построению верхней границы функции y(τ) на интервале [0, 1],
которая доставляет абсолютный максимум функционалу (2.4). Получаемая при этом программа
оптимального управления: n˜ (τ); u˜(τ); u˜z(τ), ∀τ ∈ [0, 1], в силу симметрии граничных условий
(2.5), также будет симметрична относительно момента времени τ = 1/2, а именно:
n˜ (τ) = −n˜ (1 − τ); u˜(τ) = u˜(1 − τ); u˜z(τ) = −u˜z(1 − τ), ∀τ ∈ [0, 1].
То же самое имеет место и для оптимальной траектории задачи: ˜ y(τ), ˜z(τ), которая получается
для указанной программы управления n˜ (τ), u˜(τ), u˜z(τ) и граничных условий (2.5):
˜ y(τ) = ˜ y(1 − τ); ˜z(τ) = ˜z(1 − τ); ˜ x(τ) = xT − ˜ x(1 − τ), ∀τ ∈ [0, 1].
Кроме того, здесь же можно показать, что функция ˜ y(τ) на интервале [0, 1/2) является
возрастающей, а функция ˜z(τ) — убывающей; на интервале (1/2, 1], наоборот, функция ˜ y(τ) —
убывающая, а ˜z(τ) — возрастающая функция. Соответственно, на интервале [0, 1/2) имеет
место: n˜ (τ) ≥ 0 и u˜z(τ) ≤ 0 — это участок «разгона» оси Oz; интервал (1/2, 1] — участок
«торможения» оси Oz, на котором n˜ (τ) ≤ 0 и u˜z(τ) ≥ 0. Очевидно, что если на некоторых
конечных подынтервалах ˜n(τ) = 0, то на этих же подынтервалах имеет место: d ˜ y(τ)
dτ = 0, а
также выполняется условие
˜ u2(τ) − ˜ u2z
(τ) − p2 ˜ y2(τ) ˜z2(τ) = 0.
Более того, можно показать, что для оптимального управления здесь, как и в [2], имеет
место:
u˜(τ) = 1, ∀τ ∈ [0, 1]. (2.7)
Действительно, пусть uz(τ) = u˜z(τ), где u˜z(τ) — оптимальное управление. В этом случае
решение второго уравнения (2.3) — z(τ) = z˜(τ). Соответственно, далее примем u˜(τ) = 1,
∀τ ∈ [0, 1/2), имея в виду, что в общем случае u(τ) = 1 + δu(τ), где δu(τ) ≤ 0, ∀τ ∈ [0, 1/2),
и при этом выполняется условие [1 + δu(τ)]2 − ˜ u2z
(τ) − p2y2(τ) ˜z2(τ) ≥ 0. Первое уравнение в
(2.3) тогда принимает вид:
dy
dτ
= ˜n(u2 − ˜ u2z
− p2y2 ˜z2)
1
2 ,
Горелов Ю.Н., Курганская Л.В. К задаче оптимального управления переориентацией оси вращения...
Gorelov Yu.N., Kurganskaya L.V. On the problem of optimal control of rotation axis reorientation... 80 из 88
где y(τ) = ˜ y(τ) + δy(τ). Проводя линеаризацию этого уравнения в окрестности оптимальной
траектории, получим
dδy
dτ
=
˜n(δu − p2 ˜ y ˜z2δy)
(1 − ˜ u2z
− p2 ˜ y2 ˜z2)
1
2
.
Выберем такой подынтервал [τ0, τ0 + ε) ∈ [0, 1/2), на котором ˜n(τ) = 1; здесь 0 ≤ τ0 <
< τ0 + ε < 1/2, а ε > 0 — некоторое малое число. Пусть
u(τ) =
1 − δu0, ∀τ ∈ [τ0, τ0 + ε);
1, ∀τ ∈ [0, 1/2)\[τ0, τ0 + ε),
где 0 < δu0 < 1 −
p
˜ u2z
(τ0) + p2 ˜ y2(τ0) ˜z2(τ0). Поэтому δy(τ0 + ε) ≤ 0. Но тогда отсюда сле-
дует, что ∀τ ∈ [τ0 + ε, 1/2) имеет место: δy(τ) ≤ 0, и, стало быть, для функционала (2.4),
вычисляемого на интервале [0, 1/2), получим
Z1/2
0
y(τ)dτ <
Z1/2
0
˜ y(τ)dτ.
Следовательно, u˜(τ) = 1, ∀τ ∈ [0, 1/2). То же самое имеет место и ∀τ ∈ (1/2, 1].
В конечном счете эквивалентная задача (2.3)–(2.6) с интервалом управления [0, 1] сводится
к задаче с интервалом управления [0, 1/2], в которой с учетом (2.4) требуется максимизировать
функционал
J2 =
Z1/2
0
ydτ (2.8)
на множестве решений системы дифференциальных уравнений (2.3) с учетом (2.6), (2.7), то
есть на траекториях управляемой системы:
dy
dτ
= n(1 − u2z
− p2y2z2)
1
2 ;
dz
dτ
= uz; (2.9)
для которой заданы только начальные условия
y(0) = 0; z(0) = z0, (2.10)
и выполняются следующие ограничения для управляющих параметров:
n = 0, 1; 0 ≤ |δuz| ≤ (1 − p2y2z2)
1
2 . (2.11)
Очевидно, что в этом случае исходная задача (1.6)–(1.12) сведена к взаимной задаче
(2.8)–(2.11) со свободным правым концом, то есть значения y(1/2) > 0 и z(1/2) ≥ 0 для
которой не фиксированы. Соответственно, допустимые и оптимальные траектории в этой
задаче находятся в области D, определяемой условиями: 0 ≤ y ≤ 1/2; 0 ≤ z ≤ min {z0, 1/py}.
3. Сведение задачи оптимального управления к краевой задаче
Решение задачи оптимального управления (2.8)–(2.11) можно отыскивать с помощью прин-
ципа максимума Понтрягина [5; 6; 8]. Введем в системе уравнений (2.9) вместо параметра uz
новый управляющий параметр с учетом структуры ограничения (2.11). Итак, пусть
uz = (1 − p2y2z2)
1
2 sin μ, (3.1)
где μ — управляющий параметр, удовлетворяющий ограничениям:
−π/2 ≤ μ ≤ π/2, (3.2)
Вестник Самарского университета. Естественнонаучная серия 2024. Том 3, № 30. С. 76–88
Vestnik of Samara University. Natural Science Series 2024, vol. 3, no. 30, pp. 76–88 81 из 88
то есть с учетом (3.1), (3.2) уравнения (2.9) принимают вид
dy
dτ
= (1 − p2y2z2)
1
2 cos μ;
dz
dτ
= (1 − p2y2z2)
12
sin μ. (3.3)
С учетом (2.8) и (3.3) введем функцию Гамильтона — Понтрягина
H = y + ψy(1 − p2y2z2)
1
2 cos μ + ψz(1 − p2y2z2)
12
sin μ, (3.4)
где ψy и ψz — сопряженные переменные, которые должны удовлетворять дифференциальным
уравнениям [8]:
dψy
dτ
= −
∂H
∂y
;
dψz
dτ
= −
∂H
∂z
.
Дифференцируя функцию H (3.4) по y и z, получим
∂H
∂y
= 1 − p2(ψy cos μ + ψz sin μ)(1 − p2y2z2)−1
2 yz2;
∂H
∂z
= −p2(ψy cos μ + ψz sin μ)(1 − p2y2z2)−12
y2z.
Эти производные от правых частей уравнений (3.3) не существуют при выполнении условия:
1 − p2y2z2 = 0, когда имеет место y = const, то есть ось Oz движется по «инерции», также
z = const, то есть угловая скорость закрутки КА сохраняется постоянной. При этом управ-
ляющий момент полностью направлен на компенсацию гироскопического момента, так как в
этом случае u = 1 и, соответственно, uz = 0. Такого вида экстремали были выявлены в задачах
оптимальной переориентации оси вращения КА в [1–5].
Если условие 1 − p2y2z2 = 0 не выполняется для некоторого множества значений z0 и p
∀τ ∈ [0; 1/2), то в силу существования частных производных функции H по y и z применение
принципа максимума будет правомерным.
Вводя вспомогательную переменную ϑ с помощью соотношений:
cos ϑ = ψy(ψ2
y + ψ2
z )−1
2 ; sin ϑ = ψz(ψ2
y + ψ2
z )−12
,
функцию H (3.4) с учетом ψy cos μ + ψz sin μ = (ψ2
y + ψ2
z )
1
2 cos(ϑ − μ) можно переписать в
следующем виде:
H = y + (1 − p2y2z2)
12
(ψ2
y + ψ2
z )
1
2 cos(ϑ − μ). (3.5)
Тогда из условия максимума функции H по μ получим: ˜μ = arg max
μ
H(y, z, ψy, ψz, μ). Так как
max
μ
cos(ϑ − μ) = 1, то тогда
˜μ
= ϑ = arctg ψz
ψy
. (3.6)
Следовательно, cos ˜μ = ψy (ψ2
y + ψ2
z )−1
2 и sin ˜μ = ψz (ψ2
y + ψ2
z )−1
2 .
С учетом приведенных выше выражений для ∂H
∂y и ∂H
∂z , а также (3.6) дифференциальные
уравнения для ψy и ψz будут иметь следующий вид:
dψy
dτ
= −1 + p2 (ψ2
y + ψ2
z )
12
(1 − p2y2z2)−12
yz2; (3.7)
dψz
dτ
= p2 (ψ2
y + ψ2
z )
12
(1 − p2y2z2)−12
y2z. (3.8)
Соответственно, исходя из граничных условий задачи (2.8)–(2.11), для системы (3.7), (3.8)
должны выполняться условия
ψy(1/2) = 0; ψz(1/2) = 0. (3.9)
Горелов Ю.Н., Курганская Л.В. К задаче оптимального управления переориентацией оси вращения...
Gorelov Yu.N., Kurganskaya L.V. On the problem of optimal control of rotation axis reorientation... 82 из 88
Начальные условия: ψy(0) = ψy0 и ψz(0) = ψz0, здесь не определены, хотя можно показать, что
для них должны выполняться условия: ψ2
y0 + ψ2
z0 > 0.
Уравнения движения (3.3), для которых заданы начальные условия (2.10), с учетом (3.6)
будут иметь следующий вид:
dy
dτ
= ψy (ψ2
y + ψ2
z )−1
2 (1 − p2y2z2)
12
; (3.10)
dz
dτ
= ψz (ψ2
y + ψ2
z )−12
(1 − p2y2z2)
12
. (3.11)
Таким образом, задача оптимального управления (2.8)–(2.11) сведена к краевой задаче
(2.10), (3.7)–(3.11).
На экстремали задачи, получаемой из условий принципа максимума [8], функция H (3.4)
сохраняет постоянное значение. Поэтому с учетом (3.5) и (3.6) получим
H = y + (1 − p2y2z2)
1
2 (ψ2
y + ψ2
z )
1
2 = const. (3.12)
Так как
dy
dτ
=
∂H
∂ψy
,
dz
dτ
=
∂H
∂ψz
,
то соответствующее дифференцирование (3.12) приводит к уравнениям (3.10), (3.11). То же
самое справедливо и для уравнений сопряженной системы (3.7), (3.8), поскольку
dψy
dτ
= −
∂H
∂y
,
dψz
dτ
= −
∂H
∂z
.
Далее, учитывая начальные условия (2.10), из (3.12) получим
H(0) = (ψ2
y0 + ψ2
z0)
12
= c0,
где c0 — некоторая константа, и, соответственно, с учетом конечных условий (3.9) имеет место:
H(0) = y(1/2) = c0 > 0,
то есть y(1/2) = c0. Исходя из очевидных оценок для правых частей (3.3), имеем 0 < y(1/2) <
< 1/2, но тогда 0 < ψ2
y0 + ψ2
z0 < 1/4 и, с учетом допустимого характера изменения ψy(τ) и
ψz(τ) на интервале [0, 1/2], получим: 0 < ψy0 < 1/2; −1/2 < ψz0 ≤ 0. Кроме того, из (3.12)
также получим (1 − p2y2z2)
1
2 (ψ2
y + ψ2
z )
1
2 = c0 − y, а отсюда следует
(ψ2
y + ψ2
z )
12
=
c0 − y
(1 − p2y2z2)
12
.
4. Сведение взаимной задачи оптимального управления
к изопериметрической задаче вариационного исчисления
Сформулируем еще одну вспомогательную задачу, исходя из задачи управления (2.8)–(2.11).
Для этого вначале предположим, что решение первого уравнения (2.9), y(τ) монотонно воз-
растающая функция, что имеет место в том случае, когда n(τ) ≡ 1, а также 0 ≤ |uz(τ)| <
< [1 − p2y2(τ)z2(τ)]
1
2 , ∀τ ∈ [0, 1/2). При этом из первого уравнения (2.9) следует
dτ =
dy
(1 − u2z
− p2y2z2)
12
. (4.1)
Вестник Самарского университета. Естественнонаучная серия 2024. Том 3, № 30. С. 76–88
Vestnik of Samara University. Natural Science Series 2024, vol. 3, no. 30, pp. 76–88 83 из 88
Кроме того, если в (2.9) разделить второе уравнение на первое, то получим
dz
dy
= z′
y =
uz
(1 − u2z
− p2y2z2)
1
2
. (4.2)
Отсюда нетрудно установить, что имеет место соотношение:
u2z
=
(1 − p2y2z2)z′2
y
1 + z′2
y
. (4.3)
С учетом (4.3) выражение для дифференциала (4.1) можно переписать так:
dτ =
(1 + z′2
y )
1
2 dy
(1 − p2y2z2)
12
,
и, соответственно, переходя к новой независимой переменной, функционал (2.8) можно пред-
ставить в следующем виде:
˜J2 =
y∗ Z
0
y(1 + z′2
y )
1
2
(1 − p2y2z2)
12
dy, (4.4)
где y∗ = y(1/2) > 0 — значение новой независимой переменной на момент τ = 1/2 в (2.8)–(2.11).
Очевидно, что это значение удовлетворяет ограничениям: 0 < y∗ < 1/2. В свою очередь, в
силу перехода к взаимной задаче (2.8)–(2.11) время маневра фиксировано, то есть при этом
должно выполняться условие:
1R/2
0
dτ = 1
2 . Поэтому при максимизации функционала (4.4)
следует учитывать наличие указанного условия, которое в вариационном исчислении называют
изопериметрическим ограничением для рассматриваемой задачи [9]:
y∗ Z
0
(1 + z′2
y )
12
(1 − p2y2z2)
12
dy =
1
2
. (4.5)
Таким образом, задача (2.8)–(2.11) сведена к изопериметрической задаче вариационного
исчисления, в которой требуется найти экстремаль, доставляющую максимум функционалу
(4.4) при выполнении условия (4.5). С учетом граничных условий (2.10) для искомой экстремали
z = z(y) должны выполняться такие условия:
z(0) = z0. (4.6)
Следует также отметить, что сформулированная изопериметрическая задача (4.4)–(4.6)
относится к классу вариационных задач с подвижными концами, а именно: здесь и значение y∗,
и правый конец экстремали, то есть значение z∗ = z(y∗), не фиксированы.
В соответствии с правилом множителей Лагранжа [9] задача (4.4)–(4.6) сводится к простей-
шей вариационной задаче на максимум функционала
˜J3 =
y∗ Z
0
(y + λ0)(1 + z′2
y )
1
2
(1 − p2y2z2)
12
dy, (4.7)
где λ0 — постоянный множитель Лагранжа.
Как известно, необходимыми условиями экстремума функционала (4.7) (здесь — его макси-
мума) являются следующие условия: во-первых, первая вариация (4.7) должна обращаться в
нуль, то есть δ ˜J3 = 0, и, во-вторых, его вторая вариация должна быть неположительной, то
есть δ2 ˜J3 ≤ 0.
Горелов Ю.Н., Курганская Л.В. К задаче оптимального управления переориентацией оси вращения...
Gorelov Yu.N., Kurganskaya L.V. On the problem of optimal control of rotation axis reorientation... 84 из 88
Первое из этих условий приводит к уравнению Эйлера [9]:
Fz −
d
dy
Fz′
y
= 0, (4.8)
где
F = F(y, z, z′
y) =
(y + λ0)(1 + z′2
y )
12
(1 − p2y2z2)
12
, (4.9)
и, соответственно, в развернутом виде уравнение (4.8) записывается так:
Fz − Fz′
yy − Fz′
yzz′
y − Fz′
yz′
y
z′′
yy = 0, (4.10)
где
Fz′
yy =
∂Fz′
y
∂y
, Fz′
yz =
∂Fz′
y
∂z
, Fz′
yz′
y
=
∂Fz′
y
∂z′
y
и z′′
yy =
dz′
y
dy
.
Второе из указанных необходимых условий, то есть δ2 ˜J3 ≤ 0, известно как условие Лежандра [9]:
Fz′
yz′
y
≤ 0. (4.11)
Кроме того, к необходимым условиям экстремума функционала (4.7) здесь также относятся
следующие условия:
Fz′
y
(y, z, z′
y)
y=y∗
δz∗ = 0; (4.12)
[F(y, z, z′
y) − z′
yFz′
y
(y, z, z′
y)]
y=y∗
δy∗ = 0. (4.13)
Вычисляя входящие в (4.10) соответствующие частные производные от функции (4.9)
и подставляя полученные для них выражения в (4.10) при условии, что 1 − p2y2z2 > 0 и
1 + z′2
y < ∞, уравнение Эйлера (4.8) можно переписать в явном виде:
[p2y2z(y + λ0) − (1 + p2λ0yz2)z′
y](1 + z′2
y ) − (y + λ0)(1 − p2y2z2)z′′
yy = 0.
При этом следует отметить, что условие 1+z′2
y < ∞ означает отсутствие вертикальных участков
экстремали z = z(y), что предполагалось в начале настоящего раздела, а условие 1− p2y2z2 > 0
то, что эта экстремаль лежит в допустимой области D .
Возвращаясь к рассмотрению необходимых условий экстремума функционала (4.7), вначале
отметим, что с учетом выражений для F (4.9) и Fz′
y
, а также δy∗ ̸= 0 и δz∗ ̸= 0 из условий (4.12)
и (4.13) следует
(y + λ0)z′
y
(1 − p2y2z2)
12
(1 + z′2
y )
1
2
y=y∗
= 0, (4.14)
y + λ0
(1 − p2y2z2)
12
(1 + z′2
y )
1
2
y=y∗
= 0. (4.15)
Очевидно, что при выполнении условия (4.15) условие (4.14) также выполняется, если
только при этом 1 − p2y2z2 > 0 и 1 + z′2
y < ∞. Тогда соответствующие необходимые условия
принимают следующий вид:
y∗ + λ0 = 0.
Отсюда получим λ0 = −y∗, но 0 < y∗ < 1/2 (при z0 > 0), то есть −1/2 < λ0 < 0. Следова-
тельно, ∀y ∈ [0, y∗) имеет место: y + λ0 < 0, и условие Лежандра (4.11) с учетом выражения
(4.9) строго выполняется ∀y ∈ [0, y∗) и, стало быть, функционал (4.7) достигает на искомой
экстремали максимума.
Вестник Самарского университета. Естественнонаучная серия 2024. Том 3, № 30. С. 76–88
Vestnik of Samara University. Natural Science Series 2024, vol. 3, no. 30, pp. 76–88 85 из 88
Как известно [9], приведенные выше необходимые условия экстремума функционала (4.7) вы-
полняются в классе кусочно-гладких функций z(y). Но в общем случае экстремум функционала
(4.7) может достигаться на более широком классе функций, а именно кусочно-непрерывных
функций. Для того чтобы установить возможность существования вертикальных участков
экстремали z(y), рассмотрим введенные В.Ф. Кротовым функции [9; 10]:
W(y, z) = lim
z′
y→±∞
1
z′
y
F(y, z, z′
y), (4.16)
где пределW(y, z) при z′
y → +∞ называют правым пределом, а при z′
y → −∞ — левым пределом.
Соответственно, характер экстремалей в рассматриваемой задаче определяется поведением
функции W(y, z), и в зависимости от этого возможны пять основных случаев, перечисленных в
[9]. С учетом (4.9) для соответствующих пределов в (4.16) получим, во-первых,
W(y, z) = lim
z′
y→+∞
(y + λ0)(1 + z′2
y )
1
2
z′
y(1 − p2y2z2)
1
2
= +
y + λ0
(1 − p2y2z2)
12
; (4.17)
во-вторых,
W(y, z) = lim
z′
y→−∞
(y + λ0)(1 + z′2
y )
1
2
z′
y(1 − p2y2z2)
12
= −
y + λ0
(1 − p2y2z2)
12
. (4.18)
Отсюда видно, что при y = 0 и y = y∗ правый и левый пределы (4.17) и (4.18) существуют и
равны, то есть в этом случае функционал (4.7) относится ко второму типу по классификации
[9; 10], и, стало быть, экстремаль может содержать вертикальные отрезки. Сразу же отметим,
что при y = y∗ или, что то же самое, в момент времени τ = 1/2 такой отрезок, очевидно,
отсутствует. Если y = 0, то в этом случае экстремаль может содержать вертикальный отрезок
и, соответственно, на некотором подынтервале [0, τ0), где τ0 < min(z0, 1/2), имеет место
uz(τ) = −1; y(τ) = 0; z(τ) = z0 − τ, ∀τ ∈ [0, τ0).
Если же 0 < y < y∗ < 1/2, то пределы (4.17) и (4.18) существуют, но не равны друг другу
всюду на интервале (0, y∗), что отвечает пятому типу функционалов. В этом случае могут
существовать как кусочно-гладкие экстремали, так и экстремали с вертикальными отрезками.
Можно показать, что в общем случае экстремали функционала (4.7), за исключением точки
y = 0, вертикальных отрезков не имеют.
Выводы
Рассмотрены различные постановки задачи оптимального управления переориентацией оси
вращения динамически симметричного КА, решение которой отыскивается в классе движений
с одним направленным (плоским) поворотом оси вращения. При этом до и после ее переори-
ентации угловая скорость закрутки КА должна быть одной и той же. Управление угловым
движением КА, совершающим указанный маневр, осуществляется по схеме «поворотного ре-
активного двигателя», когда управляющий момент ограничивается эллипсоидом вращения.
Приведена соответствующая математическая модель движения КА для рассматриваемой зада-
чи управления. Кроме постановки задачи о наискорейшей переориентации оси вращения КА
также сформулирована взаимная к ней задача оптимального управления, для которой было
найдено оптимальное управление для полного управляющего момента. С целью дальнейшего
анализа рассматриваемой задачи приводятся также результаты ее сведения к краевой задаче
и к изопериметрической вариационной задаче. Последнее существенно как для разработки
численного метода решения рассматриваемой задачи, так и для выявления ее возможных
особенностей при отыскании оптимальной экстремали.
В заключение также следует отметить, что в последнее время широко используются но-
вые постановки различных задач оптимального управления ориентацией КА с применением
кватернионных моделей вращательного движения твердого тела [11; 12]
About the authors
Yu N. Gorelov
Samara National Research University
Author for correspondence.
Email: yungor07@mail.ru
ORCID iD: 0009-0003-2183-6261
Doctor of Technical Sciences, professor, director of the Research Institute of Modeling and Control Science, professor of the Department of Differential Equations and
Control Theory
L. V. Kurganskaya
Samara National Research University
Email: limbo83@mail.ru
ORCID iD: 0000-0003-1513-3802
Candidate of Physical and Mathematical Science, leading researcher of the Research Institute of the Modeling and Control Science, associate professor of the Department of Differential Equations and Control Theory
Russian Federation, 34, Moskovskoye shosse, Samara, 443086, Russian FederationReferences
- Grigoriev N.G., Ioslovich I.V. On some tasks of the fastest reorientation of a spacecraft. Kosmicheskie issledovaniya = Cosmic Research, 1978, vol. 16, no. 6, pp. 822–826. (In Russ.)
- Gorelov Yu.N. On the fastest reorientation of the axis of rotation of a dynamically symmetrical spacecraft. Kosmicheskie issledovaniya = Cosmic Research, 1983, vol. 21, no. 1, pp. 27–33. (In Russ.)
- Gorelov Yu.N., Titov B.A. On the optimal reorientation of a rotating spacecraft. Kosmicheskie issledovaniya = Cosmic Research, 1980, vol. 18, no. 2, pp. 157–162. (In Russ.)
- Roshchin Yu.R. On the problem of optimal reorientation of a solid body. Kosmicheskie issledovaniya = Cosmic Research, 1977, vol. 15, no. 6, pp. 846–852. (In Russ.)
- Akukenko L.D. Asymptotic methods of optimal control. Moscow: Nauka, 1987, 368 p. Available at: https://libcats.org/book/577488?ysclid=m1uei3rp8k286832965. (In Russ.)
- Markeev A.P. Theoretical mechanics. Moscow: Nauka, 1990, 416 p. (In Russ.)
- Krotov V.F., Gurman V.I. Methods and problems of optimal control. Moscow: Nauka, 1973, 448 p. (In Russ.)
- Pontryagin L.S., Boltyanskiy V.G., Gamkrelidze R.V., Mishchenko E.F. Mathematical theory of optimal processes. Moscow: Nauka, 1976, 392 p. Available at: https://djvu.online/file/NN6TYTWzZN0kJ?ysclid=m1uewjz6ev494212948. (In Russ.)
- Petrov Yu.P. Variational methods of optimal control theory. Moscow; Leningrad: Energiya, 1965, 220 p. (In Russ.)
- Krotov V.F. Discontinuous solutions of variational problems. Russian Mathematics. (Iz. VUZ), 1960, no. 5, pp. 86–98. Available at: https://www.mathnet.ru/rus/ivm2307; 1961, no. 2, pp. 75–89. Available at: https://www.mathnet.ru/rus/ivm1863. (In Russ.)
- Levskii M.V. Optimal control of spacecraft orientation with constraints on control and phase variables. Journal of Computer and System Sciences International, 2021, no. 6, pp. 158–176. DOI: http://doi.org/10.31857/S0002338821030100. (In Russ.)
- Levskii M.V. Quaternion solution of the problem on optimum control of the orientation of a solid (spacecraft) with a combined quality criteria. Mechanics of Solids, 2024, no. 1, pp. 197–222. DOI: http://doi.org/10.31857/S1026351924010115. EDN: https://elibrary.ru/vzsrqq. (In Russ.)