学习随笔#12 最优化控制(Optimal Control)
最优化控制(Optimal Control)
在约束条件下达到最优的系统表现。下图是一个单输入单输出(SISO)系统的控制系统框图。
在这个系统中,我们定义误差 e ( t ) e(t) e(t)为参考信号 r ( t ) r(t) r(t)与输出信号 y ( t ) y(t) y(t)的差,即 e ( t ) = y ( t ) − r ( t ) e(t)=y(t)-r(t) e(t)=y(t)−r(t)。如果我们使得 ∫ 0 t e 2 d t \int^t_0e^2\mathrm{d}t ∫0te2dt越小,则系统的跟踪性能越好;如果使得 ∫ 0 t u 2 d t \int_0^tu^2\mathrm{d}t ∫0tu2dt越小,则系统的输入越小,因此我们就有了若干优化指标。
如果分别调整这些优化指标,需要进行大量的调整和测试才能得到最优结果,但如果能把这些指标统一到一个式子中,那么我们只要求解这个式子就可以得到最优结果,因此我们提出了代价函数(Cost Function)的概念。
J = ∫ 0 t ( q e 2 + r u 2 ) d t J=\int^t_0(qe^2+ru^2)\mathrm{d}t J=∫0t(qe2+ru2)dt
通过求解代价函数的最小值,我们就可以得到最优的输入信号。方程中的 q q q和 r r r是两个因数,若 q ≪ r q\ll r q≪r,说明我们更重视误差 e e e对结果的影响;若 q ≫ r q\gg r q≫r,说明我们更重视输入 u u u对结果的影响。
对于多输入多输出(MIMO)系统来说,设其状态方程为
{ d x d t = A x + B u Y = C x \begin{cases} \displaystyle\frac{\mathrm{d}x}{\mathrm{d}t}=Ax+Bu\\Y=Cx \end{cases} ⎩⎨⎧dtdx=Ax+BuY=Cx
则其代价函数为
J = ∫ 0 t ( E T Q E + U T R U ) d t J=\int^t_0(E^TQE+U^TRU)\mathrm{d}t J=∫0t(ETQE+UTRU)dt
其中
E = Y − R = [ y 1 − r 1 y 2 − r 2 ] = [ x 1 x 2 ] E=Y-R=\left[\begin{matrix}y_1-r_1\\y_2-r_2\end{matrix}\right]=\left[\begin{matrix}x_1\\x_2\end{matrix}\right] E=Y−R=[y1−r1y2−r2]=[x1x2]
注意此处 R R R为参考矩阵,与上下文的调节矩阵不同。
所以
{ E T Q E = q 1 x 1 2 + q 2 x 2 2 U T R U = r 1 u 1 2 + r 2 u 2 2 \begin{cases} E^TQE=q_1x_1^2+q_2x_2^2\\U^TRU=r_1u_1^2+r_2u_2^2 \end{cases} {ETQE=q1x12+q2x22UTRU=r1u12+r2u22
其中 Q Q Q、 R R R为调节矩阵, q 1 q_1 q1、 q 2 q_2 q2、 r 1 r_1 r1、 r 2 r_2 r2为权重系数。以上就是最优化控制的思路。
学习随笔#12 最优化控制(Optimal Control)相关推荐
- 强化学习4——无模型控制model-free control (On-Policy learning:Sarsa和Off-policy learning:Q-learning)
文章目录 前言 无模型控制 问题 思路 方法 On-Policy learning MC Sarsa Off-policy learning Q-learning On-Policy learning ...
- verilog学习笔记- 12)触摸按键控制LED灯实验
目录 简介: 实验任务: 硬件设计: 程序设计: 下载验证: 简介: 触摸按键主要可分为四大类:电阻式.电容式.红外感应式以及表面声波式.根据其属性的不同,每种触摸按键都有其合适的使用领域. 电阻式触 ...
- 学习随笔#15 MPC控制MATLAB代码详解
MPC控制的详细数学推导可以参照文章:一个MPC详细建模的例子.MATLAB/SIMULINK中自带有MPC相关的工具,但本文给出MPC控制的MATLAB程序. function [M, C, Q ...
- 【DR_CAN-MPC学习笔记】1.最优化控制和MPC基本概念
准研一,准备做混动方向,先学一下MPC相关知识 DR_CAN的视频:[MPC模型预测控制器]1_最优化控制和基本概念: [MPC模型预测控制器]1 1.最优化控制 Optimal Control 最优 ...
- 强化学习总结(1-2)——model-base(policy evaluation;policy control)
文章目录 强化学习总结(1-4) 马尔科夫决策过程 policy evaluation policy control policy iteration value iteration 两种方法的区别 ...
- C#程序集Assembly学习随笔(第一版)_AX
①什么是程序集? 可以把程序集简单理解为你的.NET项目在编译后生成的*.exe或*.dll文件. 嗯,这个确实简单了些,但我是这么理解的.详细: http://blog.csdn.net/sws83 ...
- 深度学习Spring5底层原理(黑马学习随笔)
学习随笔简介 跟随着黑马满老师的<黑马程序员Spring视频教程,全面深度讲解spring5底层原理>学习,视频教程地址:黑马程序员Spring视频教程,全面深度讲解spring5底层原理 ...
- 【Paper】2019_Distributed Optimal Control of Energy Storages in a DC Microgrid with Communication Dela
M. Shi, X. Chen, J. Zhou, Y. Chen, J. Wen and H. He, "Distributed Optimal Control of Energy Sto ...
- 【Paper】2010_Distributed optimal control of multiple systems
Dong W. Distributed optimal control of multiple systems[J]. International Journal of Control, 2010, ...
最新文章
- Pyhton 操作MySQL数据库
- Javascript元编程创建DOM节点
- Druid:数据库连接池实现技术
- Sqlserver 查询语句性能测试
- poj - 2503 Babelfish
- Python_模块_Day_
- ASP.NET Ajax In Action!读书笔记1
- CentOS 7.6 安装 nginx,配置端口访问网站,切换root目录
- Android 颜色表
- 捷联惯导系统ETest半实物仿真系统试验方法
- 计算机设置启动恢复出厂设置密码,bios怎么恢复出厂设置方法
- python写法教程_Python的表达式写法
- win7升级win10正式版_Win7免费升级Win10
- Android11.0(R) MTK6771 平板横屏方案修改(强制app横屏 + 开机logo/动画+关机充电横屏 + RecoveryUI 横屏)
- Windows下利用N2N访问内网资源,点对网的实现
- 用c++实现蓝桥杯超级玛丽
- Linux内核常见分配函数
- 攻防世界之Web新手练习篇
- 2020暑期腾讯小程序开发训练营结课心得
- 【JVM】CMS简述
热门文章
- 程序员副业之无货源闲鱼
- POSIX 是什么?让我们听听 Richard Stallman 的诠释
- pn532中遇到的坑-----Mifare1 Card(一)
- C++小作业-设计一个用于人事管理的People(人员)类
- 东北大学计算机a类吗,东北大学在985大学中水平怎么样?东北大学2020能回归双一流A类吗?...
- 2022年全球及中国天然橡胶产业供需趋势及行业期货市场走势:预计供需双增长,价格上行[图]
- 关于负数的除法和余数的结果
- 计算机之父阿兰·图灵(图灵诞辰104周年)
- 电脑系统怎么重装?保姆级Windows 8系统安装教程
- 夜来风雨声,“网络”知多少?