最优化控制(Optimal Control)

  在约束条件下达到最优的系统表现。下图是一个单输入单输出(SISO)系统的控制系统框图。

  在这个系统中,我们定义误差 e ( t ) e(t) e(t)为参考信号 r ( t ) r(t) r(t)与输出信号 y ( t ) y(t) y(t)的差,即 e ( t ) = y ( t ) − r ( t ) e(t)=y(t)-r(t) e(t)=y(t)−r(t)。如果我们使得 ∫ 0 t e 2 d t \int^t_0e^2\mathrm{d}t ∫0t​e2dt越小,则系统的跟踪性能越好;如果使得 ∫ 0 t u 2 d t \int_0^tu^2\mathrm{d}t ∫0t​u2dt越小,则系统的输入越小,因此我们就有了若干优化指标。
  如果分别调整这些优化指标,需要进行大量的调整和测试才能得到最优结果,但如果能把这些指标统一到一个式子中,那么我们只要求解这个式子就可以得到最优结果,因此我们提出了代价函数(Cost Function)的概念。
J = ∫ 0 t ( q e 2 + r u 2 ) d t J=\int^t_0(qe^2+ru^2)\mathrm{d}t J=∫0t​(qe2+ru2)dt
  通过求解代价函数的最小值,我们就可以得到最优的输入信号。方程中的 q q q和 r r r是两个因数,若 q ≪ r q\ll r q≪r,说明我们更重视误差 e e e对结果的影响;若 q ≫ r q\gg r q≫r,说明我们更重视输入 u u u对结果的影响。
  对于多输入多输出(MIMO)系统来说,设其状态方程为
{ d x d t = A x + B u Y = C x \begin{cases} \displaystyle\frac{\mathrm{d}x}{\mathrm{d}t}=Ax+Bu\\Y=Cx \end{cases} ⎩⎨⎧​dtdx​=Ax+BuY=Cx​
则其代价函数为
J = ∫ 0 t ( E T Q E + U T R U ) d t J=\int^t_0(E^TQE+U^TRU)\mathrm{d}t J=∫0t​(ETQE+UTRU)dt
其中
E = Y − R = [ y 1 − r 1 y 2 − r 2 ] = [ x 1 x 2 ] E=Y-R=\left[\begin{matrix}y_1-r_1\\y_2-r_2\end{matrix}\right]=\left[\begin{matrix}x_1\\x_2\end{matrix}\right] E=Y−R=[y1​−r1​y2​−r2​​]=[x1​x2​​]
注意此处 R R R为参考矩阵,与上下文的调节矩阵不同。
所以
{ E T Q E = q 1 x 1 2 + q 2 x 2 2 U T R U = r 1 u 1 2 + r 2 u 2 2 \begin{cases} E^TQE=q_1x_1^2+q_2x_2^2\\U^TRU=r_1u_1^2+r_2u_2^2 \end{cases} {ETQE=q1​x12​+q2​x22​UTRU=r1​u12​+r2​u22​​
其中 Q Q Q、 R R R为调节矩阵, q 1 q_1 q1​、 q 2 q_2 q2​、 r 1 r_1 r1​、 r 2 r_2 r2​为权重系数。以上就是最优化控制的思路。

学习随笔#12 最优化控制(Optimal Control)相关推荐

  1. 强化学习4——无模型控制model-free control (On-Policy learning:Sarsa和Off-policy learning:Q-learning)

    文章目录 前言 无模型控制 问题 思路 方法 On-Policy learning MC Sarsa Off-policy learning Q-learning On-Policy learning ...

  2. verilog学习笔记- 12)触摸按键控制LED灯实验

    目录 简介: 实验任务: 硬件设计: 程序设计: 下载验证: 简介: 触摸按键主要可分为四大类:电阻式.电容式.红外感应式以及表面声波式.根据其属性的不同,每种触摸按键都有其合适的使用领域. 电阻式触 ...

  3. 学习随笔#15 MPC控制MATLAB代码详解

      MPC控制的详细数学推导可以参照文章:一个MPC详细建模的例子.MATLAB/SIMULINK中自带有MPC相关的工具,但本文给出MPC控制的MATLAB程序. function [M, C, Q ...

  4. 【DR_CAN-MPC学习笔记】1.最优化控制和MPC基本概念

    准研一,准备做混动方向,先学一下MPC相关知识 DR_CAN的视频:[MPC模型预测控制器]1_最优化控制和基本概念: [MPC模型预测控制器]1 1.最优化控制 Optimal Control 最优 ...

  5. 强化学习总结(1-2)——model-base(policy evaluation;policy control)

    文章目录 强化学习总结(1-4) 马尔科夫决策过程 policy evaluation policy control policy iteration value iteration 两种方法的区别 ...

  6. C#程序集Assembly学习随笔(第一版)_AX

    ①什么是程序集? 可以把程序集简单理解为你的.NET项目在编译后生成的*.exe或*.dll文件. 嗯,这个确实简单了些,但我是这么理解的.详细: http://blog.csdn.net/sws83 ...

  7. 深度学习Spring5底层原理(黑马学习随笔)

    学习随笔简介 跟随着黑马满老师的<黑马程序员Spring视频教程,全面深度讲解spring5底层原理>学习,视频教程地址:黑马程序员Spring视频教程,全面深度讲解spring5底层原理 ...

  8. 【Paper】2019_Distributed Optimal Control of Energy Storages in a DC Microgrid with Communication Dela

    M. Shi, X. Chen, J. Zhou, Y. Chen, J. Wen and H. He, "Distributed Optimal Control of Energy Sto ...

  9. 【Paper】2010_Distributed optimal control of multiple systems

    Dong W. Distributed optimal control of multiple systems[J]. International Journal of Control, 2010, ...

最新文章

  1. Pyhton 操作MySQL数据库
  2. Javascript元编程创建DOM节点
  3. Druid:数据库连接池实现技术
  4. Sqlserver 查询语句性能测试
  5. poj - 2503 Babelfish
  6. Python_模块_Day_
  7. ASP.NET Ajax In Action!读书笔记1
  8. CentOS 7.6 安装 nginx,配置端口访问网站,切换root目录
  9. Android 颜色表
  10. 捷联惯导系统ETest半实物仿真系统试验方法
  11. 计算机设置启动恢复出厂设置密码,bios怎么恢复出厂设置方法
  12. python写法教程_Python的表达式写法
  13. win7升级win10正式版_Win7免费升级Win10
  14. Android11.0(R) MTK6771 平板横屏方案修改(强制app横屏 + 开机logo/动画+关机充电横屏 + RecoveryUI 横屏)
  15. Windows下利用N2N访问内网资源,点对网的实现
  16. 用c++实现蓝桥杯超级玛丽
  17. Linux内核常见分配函数
  18. 攻防世界之Web新手练习篇
  19. 2020暑期腾讯小程序开发训练营结课心得
  20. 【JVM】CMS简述

热门文章

  1. 程序员副业之无货源闲鱼
  2. POSIX 是什么?让我们听听 Richard Stallman 的诠释
  3. pn532中遇到的坑-----Mifare1 Card(一)
  4. C++小作业-设计一个用于人事管理的People(人员)类
  5. 东北大学计算机a类吗,东北大学在985大学中水平怎么样?东北大学2020能回归双一流A类吗?...
  6. 2022年全球及中国天然橡胶产业供需趋势及行业期货市场走势:预计供需双增长,价格上行[图]
  7. 关于负数的除法和余数的结果
  8. 计算机之父阿兰·图灵(图灵诞辰104周年)
  9. 电脑系统怎么重装?保姆级Windows 8系统安装教程
  10. 夜来风雨声,“网络”知多少?