学习随笔#12 最优化控制（Optimal Control）

最优化控制（Optimal Control）

在约束条件下达到最优的系统表现。下图是一个单输入单输出（SISO）系统的控制系统框图。

在这个系统中，我们定义误差 e ( t ) e(t) e(t)为参考信号 r ( t ) r(t) r(t)与输出信号 y ( t ) y(t) y(t)的差，即 e ( t ) = y ( t ) − r ( t ) e(t)=y(t)-r(t) e(t)=y(t)−r(t)。如果我们使得 ∫ 0 t e 2 d t \int^t_0e^2\mathrm{d}t ∫0te2dt越小，则系统的跟踪性能越好；如果使得 ∫ 0 t u 2 d t \int_0^tu^2\mathrm{d}t ∫0tu2dt越小，则系统的输入越小，因此我们就有了若干优化指标。
如果分别调整这些优化指标，需要进行大量的调整和测试才能得到最优结果，但如果能把这些指标统一到一个式子中，那么我们只要求解这个式子就可以得到最优结果，因此我们提出了代价函数（Cost Function）的概念。
J = ∫ 0 t ( q e 2 + r u 2 ) d t J=\int^t_0(qe^2+ru^2)\mathrm{d}t J=∫0t(qe2+ru2)dt
通过求解代价函数的最小值，我们就可以得到最优的输入信号。方程中的 q q q和 r r r是两个因数，若 q ≪ r q\ll r q≪r，说明我们更重视误差 e e e对结果的影响；若 q ≫ r q\gg r q≫r，说明我们更重视输入 u u u对结果的影响。
对于多输入多输出（MIMO）系统来说，设其状态方程为
{ d x d t = A x + B u Y = C x \begin{cases} \displaystyle\frac{\mathrm{d}x}{\mathrm{d}t}=Ax+Bu\\Y=Cx \end{cases} ⎩⎨⎧dtdx=Ax+BuY=Cx
则其代价函数为
J = ∫ 0 t ( E T Q E + U T R U ) d t J=\int^t_0(E^TQE+U^TRU)\mathrm{d}t J=∫0t(ETQE+UTRU)dt
其中
E = Y − R = [ y 1 − r 1 y 2 − r 2 ] = [ x 1 x 2 ] E=Y-R=\left[\begin{matrix}y_1-r_1\\y_2-r_2\end{matrix}\right]=\left[\begin{matrix}x_1\\x_2\end{matrix}\right] E=Y−R=[y1−r1y2−r2]=[x1x2]
注意此处 R R R为参考矩阵，与上下文的调节矩阵不同。
所以
{ E T Q E = q 1 x 1 2 + q 2 x 2 2 U T R U = r 1 u 1 2 + r 2 u 2 2 \begin{cases} E^TQE=q_1x_1^2+q_2x_2^2\\U^TRU=r_1u_1^2+r_2u_2^2 \end{cases} {ETQE=q1x12+q2x22UTRU=r1u12+r2u22
其中 Q Q Q、 R R R为调节矩阵， q 1 q_1 q1、 q 2 q_2 q2、 r 1 r_1 r1、 r 2 r_2 r2为权重系数。以上就是最优化控制的思路。

学习随笔#12 最优化控制（Optimal Control）相关推荐

强化学习4——无模型控制model-free control （On-Policy learning：Sarsa和Off-policy learning：Q-learning）
文章目录前言无模型控制问题思路方法 On-Policy learning MC Sarsa Off-policy learning Q-learning On-Policy learning ...
verilog学习笔记- 12)触摸按键控制LED灯实验
目录简介: 实验任务: 硬件设计: 程序设计: 下载验证: 简介: 触摸按键主要可分为四大类:电阻式.电容式.红外感应式以及表面声波式.根据其属性的不同,每种触摸按键都有其合适的使用领域. 电阻式触 ...
学习随笔#15 MPC控制MATLAB代码详解
MPC控制的详细数学推导可以参照文章:一个MPC详细建模的例子.MATLAB/SIMULINK中自带有MPC相关的工具,但本文给出MPC控制的MATLAB程序. function [M, C, Q ...
【DR_CAN-MPC学习笔记】1.最优化控制和MPC基本概念
准研一,准备做混动方向,先学一下MPC相关知识 DR_CAN的视频:[MPC模型预测控制器]1_最优化控制和基本概念: [MPC模型预测控制器]1 1.最优化控制 Optimal Control 最优 ...
强化学习总结(1-2)——model-base(policy evaluation；policy control)
文章目录强化学习总结(1-4) 马尔科夫决策过程 policy evaluation policy control policy iteration value iteration 两种方法的区别 ...
C#程序集Assembly学习随笔(第一版)_AX
①什么是程序集? 可以把程序集简单理解为你的.NET项目在编译后生成的*.exe或*.dll文件. 嗯,这个确实简单了些,但我是这么理解的.详细: http://blog.csdn.net/sws83 ...
深度学习Spring5底层原理(黑马学习随笔)
学习随笔简介跟随着黑马满老师的<黑马程序员Spring视频教程,全面深度讲解spring5底层原理>学习,视频教程地址:黑马程序员Spring视频教程,全面深度讲解spring5底层原理 ...
【Paper】2019_Distributed Optimal Control of Energy Storages in a DC Microgrid with Communication Dela
M. Shi, X. Chen, J. Zhou, Y. Chen, J. Wen and H. He, "Distributed Optimal Control of Energy Sto ...
【Paper】2010_Distributed optimal control of multiple systems
Dong W. Distributed optimal control of multiple systems[J]. International Journal of Control, 2010, ...

学习随笔#12 最优化控制（Optimal Control）

最优化控制（Optimal Control）

学习随笔#12 最优化控制（Optimal Control）相关推荐

最新文章

热门文章