Современные методы решения задачи оптимального управления в экономике

Обложка

Цитировать

Полный текст

Аннотация

В данной работе дана современная постановка задачи оптимального управления, после чего проведен обзор методов, применяемых в настоящее время при решении задачи оптимального управления в экономике, с акцентом на численные методы.  Приведены и объяснены наиболее важные проблемы применения численных методов при решении задачи оптимального управления. Затем в статье перечислены и объяснены наиболее распространенные вычислительные методы решения задачи оптимального управления, которые применяются в современной экономической сфере, насколько далеко эти методы продвинулись с точки зрения достижения своих целей и предоставления решений, трудности в реализации этих методов и сопутствующие ограничения. Перечислены новейшие разработки программного обеспечения и программ, которые начинают использоваться в основном экономистами при решении некоторых наиболее распространенных задач оптимального управления, а также объяснены их преимущества и ограничения. Наконец, сделан общий анализ некоторых методов следующего поколения и будущего задачи оптимального управления в целом.

Полный текст

Научная новизна исследования

Стремительный рост цифровизации и применение цифровых методов искусственного интеллекта в экономической сфере привели к развитию новых численных методов решения задачи оптимального управления, использующих возможности вычислительных и математических программ для поиска решений экономических задач, которые ранее считались слишком сложными для решения даже с помощью численных методов. Эта работа важна тем, что она дает представление о современных численных методах, основанных на используемом компьютерном программном обеспечении, исследует некоторые из основных преимуществ и выгод и анализирует, как эти методы могут быть улучшены в будущем. Таким образом, эта работа послужит основой для дальнейшего развития методов следующего поколения (next-generation methods), которые будут более способными и более эффективными в численном решении задачи оптимального управления в экономике.

Введение

Оптимальное управление – это применение математических принципов к заданной динамической системе с целью определения ее входных параметров, позволяющих оптимизировать функционирование системы за счет минимизации или максимизации ее выходных параметров, описывается в виде заданного индекса производительности, полностью удовлетворяя заданным ограничениям системы. Другими словами, для данной динамической системы с заданными ограничениями оптимальное управление стремится максимизировать или минимизировать индекс производительности этой системы с использованием математических методов. Для описания этой задачи оптимизации используется термин «задача оптимального управления» (ЗОП). Принцип оптимального управления был впервые предложен русским математиком Львом Семеновичом Понтрягиным в 1950-х годах, а затем сформулирован в виде Принципа максимума Понтрягина, который Понтрягин и его ученики использовали для поиска метода управления динамической системой, переходящей из одного состояния в другое при наличии заранее заданных ограничений состояния или входных элементов управления. Позже в своей статье 1969 года Дорфман [1] вывел метод решения задачи оптимального управления, рассмотрев экономический аспект проблемы.

Общая математическая постановка задачи оптимального управления

Задача оптимального управления обычно записывается как состоящая из двух функций:

  1. x(t) – функция состояния, описывающая поведение системы, u;
  2. u(t)– функция управления, направляющая эволюцию системы от одного шага к другому.

Поиску путей решения задачи оптимального управления наиболее эффективным способом посвящено множество различных работ [2–7]. Однако эти методы либо не позволяют достичь аналитического решения задачи оптимального управления, либо метод оказывается слишком сложным для решения. На этом фоне исследователи обратились к численным методам решения задачи оптимального управления, основываясь на Принципе максимума Понтрягина. Здесь численные методы делятся на два типа: прямые методы и косвенные методы. Принцип максимума Понтрягина приводит к краевой и нелинейной задаче. В косвенном методе необходимо извлекать необходимые условия оптимальности в аналитическом виде, что часто трудно решить. Кроме того, область сходимости косвенного метода невелика, и, таким образом, в некоторых случаях, если начальное предположение выбрано неправильно, метод не будет сходиться. Поэтому для исследования численного поведения задачи оптимального управления используется прямой метод. Этот метод преобразует задачу оптимального управления в задачу алгебраической оптимизации.

Ниже приводится стандартная постановка задачи оптимального управления.

Задача оптимального управления: Определить состояние (эквивалентно, траектория или путь), x(t)n, управление u(t)m, вектор статических параметров pq, начальное время, t0, и терминальное время, tf (где tt0, tf — независимая переменная), которая оптимизирует индекс производительности

J=Φ[x(t0), t0,x(tf),tf; p]+t0tfL[x(t),u(t),t; p]dt (1)

с учетом динамических ограничений (т. е. ограничения дифференциального уравнения),

x˙(t)=f[x(t), u(t), t; p] (2)

ограничения пути

Cmin C [ x(t), u(t), t; p]Cmax (3)

и граничные условия

ΦminΦ[ x(t0), t0, x(tf), tf; p]Φmax (4)

Состояние, управление и статический параметр могут быть записаны в компонентной форме как

x(t)=x1(t)xn(t)u(t)=u1(t)um(t)p=p1pq.

На рисунке показаны три основных компонента оптимального управления и класс методов, использующих каждый компонент. Понятно, что как косвенные, так и прямые методы используют дифференциальные уравнения и интегрирование функций, тогда как косвенные методы используют системы нелинейных уравнений в отличие от прямых методов, которые используют подходы нелинейной оптимизации.

 

Рисунок – Три основных компонента оптимального управления и класс методов, использующих каждый компонент [8]

Figure – Three main components of optimal control and a class of methods using each component [8]

 

Дифференциальное уравнение (2) описывает динамику системы, а индекс производительности измеряет «качество» траектории. Когда желательно минимизировать индекс производительности, более низкое значение J «лучше»; наоборот, когда желательно максимизировать индекс производительности, более высокое значение J «лучше».

Обычно задачу оптимального управления разбивают на этапы  и фазы связаны или связаны каким-то значимым образом. Многофазная задача оптимального управления ставится следующим образом. Оптимизировать стоимость

J=k=1pJ(k) (6)

[где стоимость на каждом этапе, J(k), (k=1,... ,P),  имеет вид, указанный в уравнении (1)] с учетом динамических ограничений

x˙(k)(t)  =f[x(k)(t),  u(k)(t),  t;  p(k)], (7)

граничные условия,

Φmin(k)Φ(k)x(k) (t0(k)) ,  t0(k), x(k) (tf(k)), p(k)tf(k)Φmax(k), (8)

алгебраические ограничения пути

Cmin(k)    C(k) [ x(k)(t),  u(k)(t),  t;  p(k)]     Cmax(k) (9)

и ограничения связи

Lmin(s)  L  x(ls)tf(ls) , u(ls)tf(ls) , p(ls), tf(ls) ; x(rs)tf(rs), u(rs)tf(rs), p(rs)tf(rs)  Lmax(s). (10)

В уравнении (10) параметр S – количество пар фаз, которые необходимо соединить, rs1,..., S и ls1,... , S – правые фазы и левые фазы, соответственно, пар связей, rsls (означает, что фаза не может быть связана сама с собой), и s1,... , S [8].

В последние годы многими исследователями разработаны самые разнообразные методы применения численных подходов при решении задачи оптимального управления в экономической сфере, описание которых приведено ниже.

Современные подходы к решению задачи оптимального управления численными методами

Как показано на рис. 1, для решения задач оптимального управления с использованием численных методов существует три основных компонента.

  1. Численное решение системы дифференциальных уравнений и функций интегрирования;
  2. Косвенным методом, сочетая как:
    1. численное решение системы дифференциальных уравнений и функций интегрирования;
    2. численное решение систем нелинейных уравнений, а;
  3. Прямым методом, сочетая как
    1. численное решение системы дифференциальных уравнений и функций интегрирования;
    2. численное решение методом нелинейной оптимизации.

Мы рассмотрим вышеперечисленные методы каждый по очереди.

1. Численное решение системы дифференциальных уравнений и функций интегрирования

Рассмотрим начальную задачу (initial-value problem или IVP)

x˙ = fxt, t,        xt0 = x0 (11)

Кроме того, рассмотрим временной интервал ti, ti+1 , в течение которого желательно получить решение дифференциального уравнения. Другими словами, учитывая значение состояния в ti, x(ti)xi, желательно получить состояние в ti+1, x(ti+1)xi+1. Интегрируя уравнение (11), мы можем записать

xi+1 xi+ titi+1x˙(s)ds=xi+ titi+1fx(s),sds (12)

Существует два подхода к решению дифференциального уравнения: шаг по времени (time-marching) и коллокация. В таблице ниже представлены основные характеристики этих подходов.

 

Таблица Методы, используемые для численного решения дифференциальных уравнений [9–15]

Table – Metods user for the numerical solution of differential equations [9–15]

 

При использовании подхода коллокации уравнение

X˙τj=fxτj, τj, j=1,...,K (13)

называется условием коллокации, потому что приближение к производной устанавливается равным правой части дифференциального уравнения, вычисляемого в каждой из промежуточных точек τ1,... , τK.

Существуют три основных категории методов коллокации.

  1. Методы Гаусса – где ни одна из конечных точек tk или tk+1 не является точкой коллокации.
  2. Методы Radau – где не более одной из конечных точек tk или tk+1 является точкой коллокации.
  3. Методы Лобатто – где обе конечные точки tk и tk+1 являются точками коллокации.

Методы Эйлера и Рунге–Кутты можно рассматривать эквивалентно либо как методы перемещения по времени, либо как методы коллокации. Когда используется метод Эйлера или Рунге–Кутты в форме коллокации, говорят, что дифференциальное уравнение решается одновременно, потому что все неизвестные параметры определяются одновременно. Кроме того, методы коллокации, как говорят, имитируют динамику системы неявно, потому что значения состояния в каждой точке коллокации получаются в одно и то же время (в отличие от последовательного решения для состояния, как в методе временного перехода). Чтобы реализовать одновременное моделирование, дискретизированная динамика записывается как дефектные ограничения вида

ζj = X˙(τj )fx(τj),τj (14)

Ограничения дефектов затем могут быть объединены в матрицу в виде

Z=ζ1ζM (15)

где Z – функция коэффициентов a0(k), ..., aK(k), k-1, ..., K. Затем цель состоит в том, чтобы определить значения этих коэффициентов, которые приводят к Z=0.

2. Интеграция функций

Поскольку цель состоит в том, чтобы решить задачу оптимального управления, необходимо аппроксимировать функцию стоимости уравнения (1). Обычно стоимость аппроксимируется с помощью квадратуры, которая согласуется с численным методом решения дифференциального уравнения. Например, если для решения дифференциального уравнения используется прямое правило Эйлера, стоимость также будет аппроксимирована с использованием прямого интегрирования Эйлера. В случае метода ортогональной коллокации правило интегрирования представляет собой правило квадратуры с ортогональным расположением, например, если используются точки Лежандра-Гаусса, то стоимость Лагранжа аппроксимируется с использованием квадратуры Гаусса. Требование согласованности при аппроксимации дифференциальных уравнений и стоимости можно рассматривать и по-другому. Любая задача Больца может быть преобразована в задачу Майера путем добавления состояния xn + 1 and adding the differential equation и добавления дифференциального уравнения

x˙n+1= Lxt, ut, t; p (16)

с начальным условием

xn+1t0=0 (17)

Тогда функция стоимости уравнения (1) будет представлена в форме Майера как

J=x(t0), t0, x(tf), tf, p+xn+1(tf) (18)

Затем общая схема будет использоваться для решения расширенной системы дифференциальных уравнений

x˙t = fxt, ut, t; px˙n+1 = Lxt, ut, t; p (19)

Преобразуя обратно к форме Больца, квадратурная аппроксимация к члену

t0tfLxt, ut, t; pdt (20)

в уравнении (1) должна быть та же самая, что и схема, используемая для решения системы дифференциальных уравнений, приведенной в уравнении (19).

Нелинейная оптимизация

Ключевым компонентом решения задач оптимального управления является способность решать задачи нелинейной оптимизации или нелинейного программирования. Нелинейная задача принимает следующую общую математическую форму.

Определить вектор переменных решения zRn, которые минимизируют функцию стоимости

f(z) (21)

с учетом алгебраических ограничений

g(z)=0 (22)

h(z)0 (23)

где g(z)m и h(z)p. Условия оптимальности первого порядка задачи нелинейной оптимизации, данные в уравнениях (21) и (22), также известные как условия Каруша–Куна–Таккера [9–15], задаются как

gi(z)=0, (i=1, ..., m), (24)

hi(z)0, (i=1, ..., p), (25)

vi0, (i=1, ..., p), (26)

vihi(z)=0, (i=1, ..., p), (27)

f(z)+i=1mλigi(z)+i=1pνihi(z)=0

Затем эти оптимизации решаются с помощью:

  1. градиентных методов;
  2. эвристических методов оптимизации.

Заключение

Дан обзор современных численных методов решения задач оптимального управления в экономике. Задача решения задач оптимального управления разложена на три основных компонента: решение дифференциальных уравнений и интегрирующих функций, решение задач нелинейной оптимизации и решение систем нелинейных алгебраических уравнений. С помощью этих компонентов описаны два класса косвенных и прямых методов решения задач оптимального управления. Впоследствии были обсуждены важные вычислительные вопросы и описано несколько различных программных инструментов для решения задач оптимального управления. Наконец, было дано краткое обсуждение того, как выбрать метод.

×

Об авторах

Юлия Валерьевна Матвеева

Самарский национальный исследовательский университет имени академика С.П. Королева

Email: dr.ymatveeva@ssau.ru
ORCID iD: 0000-0003-4755-226X

кандидат экономических наук, доцент кафедры менеджмента и организации производства

Россия, г. Самара

Марлвин Татенда Чигванда

Самарский национальный исследовательский университет имени академика С.П. Королева

Автор, ответственный за переписку.
Email: marlvin.chigwanda@gmail.com
ORCID iD: 0000-0001-9707-6033

аспирант кафедры менеджмента и организации производства

Россия, г. Самара

Список литературы

  1. Dorfman R. An Economic Interpretation of Optimal Control Theory. American Economic Review, 1969, vol. 59, issue 5, pp. 817–831. URL: https://econpapers.repec.org/article/aeaaecrev/v_3a59_3ay_3a1969_3ai_3a5_3ap_3a817-31.htm.
  2. Bakke V. A maximum principle for an optimal control problem with integral constraints. Journal of Optimization Theory and Applications, 1974, vol. 13, issue 1, pp. 32–55. DOI: https://doi.org/10.1007/BF00935608.
  3. Belbas S. Iterative schemes for optimal control of Volterra integral equations. Nonlinear Analysis, 1999, vol. 37, pp. 57–79.
  4. Belbas S. A new method for optimal control of Volterra integral equations. Applied Mathematics and Computation, 2007, vol. 189, pp. 1902–1915. DOI: http://doi.org/10.1016/j.amc.2006.12.077.
  5. Berkani S., Manseur F., Maidi A. Optimal control based on the variational iteration method. Computers & Mathematics with Applications, 2012, vol. 64, issue 4, pp. 604–610. Available at: http://dx.doi.org/10.1016/j.camwa.2011.12.066.
  6. Carlier G., Tahraoui R. On some optimal control problems governed by a state equation with memory. ESAIM Control Optimization and Calculus of Variations, 2008, vol. 14, issue 4, pp. 725–743. DOI: http://dx.doi.org/10.1051/cocv:2008005.
  7. Dai R., Cochran J.E. Wavelet collocation method for optimal control problems. Journal of Optimization Theory and Applications, 2009, vol. 143, pp. 265–278. DOI: http://doi.org/10.1007/S10957-009-9565-9.
  8. Rao Anil (2010). A Survey of Numerical Methods for Optimal Control. Advances in the Astronautical Sciences, 2010, vol. 135, issue 1, pp. 495–528. Available at: https://www.researchgate.net/publication/268042868_A_Survey_of_Numerical_Methods_for_Optimal_Control.
  9. Bazaraa M.S., Sherali H.D., Shetty C.M. Nonlinear Programming: Theory and Algorithms. 3rd edition. New Jersey: Wiley-Interscience, 2006. Available at: https://books.google.ru/books?id=nDYz-NIpIuEC&printsec=frontcover&hl=ru#v=onepage&q&f=false.
  10. Bertsekas D. Nonlinear Programming. Belmont, Massachusetts: Athena Scientific Publishers, 2004. Available at: http://www.athenasc.com/nonlinbook.html.
  11. Boyd S., Vandenberghe L. Convex Optimization. Cambridge, United Kingdom: Cambridge University Press, 2004. 730 p. Available at: https://web.stanford.edu/~boyd/cvxbook/bv_cvxbook.pdf.
  12. Nocedal J., Wright S. Numerical Optimization. New York: Springer-Verlag, 2nd edition, 2006. Available at: https://books.google.ru/books?id=7wDpBwAAQBAJ&printsec=frontcover&hl=ru#v=onepage&q&f=false.
  13. Gill P.E., W. Murray W., Saunders M.A., Wright M.H. User’s Guide for NPSOL (Version 4.0): A FORTRAN Package for Nonlinear Programming. Department of Operations Research, Stanford University, January 1986. DOI: http://doi.org/10.21236/ada169115.
  14. Biegler L.T., Ghattas O., Heinkenschloss M., Bloemen Waanders B.v. (Eds.) Large-Scale PDE Constrained Optimization. In: Lecture Notes in Computational Science and Engineering, vol. 30. Berlin: Springer-Verlag, 2003. DOI: http://doi.org/10.1007/978-3-642-55508-4.
  15. Betts J.T. Practical Methods for Optimal Control Using Nonlinear Programming. Philadelphia: SIAM Press, 2001. DOI: http://doi.org/10.1115/1.1483351.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рисунок – Три основных компонента оптимального управления и класс методов, использующих каждый компонент [8]

Скачать (144KB)
3. Таблица – Методы, используемые для численного решения дифференциальных уравнений [9–15]


© Матвеева Ю.В., Чигванда М.Т., 2022

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Данный сайт использует cookie-файлы

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, которые обеспечивают правильную работу сайта.

О куки-файлах