第1章 回到目录 第3章

《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

  • 第2章 最优控制中的变分法
    • 2.1 泛函与变分
      • 2.1.1 线性赋范空间
      • 2.1.2 泛函及其定义域
      • 2.1.3 泛函的变分
        • 定义2-13
      • 2.1.4 泛函极值与变分引理
    • 2.2 欧拉方程
      • 2.2.1 无约束泛函极值的必要条件
        • 定理2-6
      • 2.2.2 有等式约束的泛函极值的必要条件
      • 2.2.3 泛函极小值的充分条件
    • 2.3 横截条件
      • 2.3.1 末端时刻固定时
      • 2.3.2 末端时刻自由时
      • 2.3.3 初始时刻自由时
    • 2.4 用变分法解最优控制问题
      • 2.4.1 可用变分法求解的最优控制问题
      • 2.4.2 末端时刻固定时的最优解
      • 2.4.3 末端时刻自由时的最优解
    • 2.5 角点条件与内点约束
      • 2.5.1 维尔斯特拉斯-欧特曼条件(角点条件)
      • 2.5.2 内点约束条件

第2章 最优控制中的变分法

2.1 泛函与变分

2.1.1 线性赋范空间

2.1.2 泛函及其定义域

2.1.3 泛函的变分

泛函的变分与函数的微分,其定义几乎完全相当。

定义2-13

设 J(x)J(x)J(x) 是线性赋范空间 RnR^nRn 上的连续泛函,若其增量可表示为
ΔJ(x)=J(x+δx)−J(x)=L(x,δx)+r(x,δx)\begin{aligned} \Delta J(x) &= J(x + \delta x) - J(x) \\ &= L(x, \delta x) + r(x, \delta x) \end{aligned}ΔJ(x)​=J(x+δx)−J(x)=L(x,δx)+r(x,δx)​

式中 L(x,δx)L(x, \delta x)L(x,δx) 是关于 δx\delta xδx 的线性连续泛函, r(x,δx)r(x, \delta x)r(x,δx) 是关于 δx\delta xδx 的高阶无穷小,则
δJ=L(x,δx)\delta J = L (x, \delta x)δJ=L(x,δx)

称为泛函 J(x)J(x)J(x) 的变分。

泛函的变分就是泛函增量的线性主部。当一个泛函具有变分时,也称该泛函可微。像函数的微分一样,泛函的变分可以利用求导方法来确定。

2.1.4 泛函极值与变分引理

2.2 欧拉方程

2.2.1 无约束泛函极值的必要条件

定理2-6

对于无约束泛函极值,使二次型性能泛函取极致的必要条件,是轨线 x(t)x(t)x(t) 满足下列欧拉方程:
∂L∂x−ddt∂L∂x˙=0\frac{\partial L}{\partial x} - \frac{d}{dt} \frac{\partial L}{\partial \dot{x}} = 0∂x∂L​−dtd​∂x˙∂L​=0

求解上式欧拉方程所需的两点边界值就是问题描述中已知的端点条件:
x(t0)=x0,x(tf)=xfx(t_0) = x_0,\quad x(t_f) = x_fx(t0​)=x0​,x(tf​)=xf​

2.2.2 有等式约束的泛函极值的必要条件

对于有约束条件 f(x,x˙,t)=0f(x, \dot{x}, t) = 0f(x,x˙,t)=0,使泛函取极值的必要条件,是轨线 x(t)x(t)x(t) 满足下列欧拉方程:
∂L∂x−ddt∂L∂x˙=0\frac{\partial L}{\partial x} - \frac{d}{dt} \frac{\partial L}{\partial \dot{x}} = 0∂x∂L​−dtd​∂x˙∂L​=0

其中,L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)L(x, \dot{x}, \lambda, t) = g(x, \dot{x}, t) + \lambda^T(t) f(x, \dot{x}, t)L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)

2.2.3 泛函极小值的充分条件

由于欧拉方程只是泛函能取极值的必要条件。下面给出泛函取极值的充分条件。

(1)无约束情况,除欧拉方程成立外,还需以下三个勒让德条件之一成立,
[∂2L∂x2∂2L∂x∂x˙(∂2L∂x∂x˙)T∂2L∂x˙2]>0\left[\begin{matrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x}} \\ (\frac{\partial^2 L}{\partial x \partial \dot{x}})^T & \frac{\partial^2 L}{\partial \dot{x}^2} \\ \end{matrix}\right] > 0[∂x2∂2L​(∂x∂x˙∂2L​)T​∂x∂x˙∂2L​∂x˙2∂2L​​]>0


∂2L∂x2−ddt∂2L∂x∂x˙≥0,∂2L∂x˙2>0\frac{\partial^2 L}{\partial x^2} - \frac{d}{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} \ge 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} > 0∂x2∂2L​−dtd​∂x∂x˙∂2L​≥0,∂x˙2∂2L​>0


∂2L∂x2−ddt∂2L∂x∂x˙>0,∂2L∂x˙2≥0\frac{\partial^2 L}{\partial x^2} - \frac{d}{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \ge 0∂x2∂2L​−dtd​∂x∂x˙∂2L​>0,∂x˙2∂2L​≥0

(2)有约束情况,相同的勒让德条件,只是 LLL 不同,LLL 是构造出来的含有拉格朗日乘子向量 λ\lambdaλ 的泛函。

2.3 横截条件

2.3.1 末端时刻固定时

横截条件的一般表达式为
(∂L∂x˙)T∣tfδx(tf)−(∂L∂x˙)T∣t0δx(t0)=0(\frac{\partial L}{\partial \dot{x}})^T |_{t_f} \delta x(t_f) - (\frac{\partial L}{\partial \dot{x}})^T |_{t_0} \delta x(t_0) = 0(∂x˙∂L​)T∣tf​​δx(tf​)−(∂x˙∂L​)T∣t0​​δx(t0​)=0

2.3.2 末端时刻自由时

(1)起点固定,末端自由
L−x˙T(t)∂L∂x˙∣tf=0(∂L∂x˙)∣tf=0x(t0)=x0}\left.\begin{aligned} L - \dot{x}^T(t) \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_f} = 0 \\ x(t_0) = x_0 \\ \end{aligned}\right\}L−x˙T(t)∂x˙∂L​∣tf​​=0(∂x˙∂L​)∣tf​​=0x(t0​)=x0​​⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫​

(2)起点固定,末端受约束
[L+(c˙−x˙)T∂L∂x˙∣tf=0x(tf)=c(tf)x(t0)=x0}\left.\begin{aligned} [L + (\dot{c} - \dot{x})^T \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ x(t_f) = c(t_f) \\ x(t_0) = x_0 \\ \end{aligned}\right\}[L+(c˙−x˙)T∂x˙∂L​∣tf​​=0x(tf​)=c(tf​)x(t0​)=x0​​⎭⎪⎪⎪⎬⎪⎪⎪⎫​

2.3.3 初始时刻自由时

(1)末端固定,起点受约束
[L+(Ψ˙0−x˙)T∂L∂x˙]∣t0=0x(t0)=Ψ0(t0)x(tf)=xf}\left.\begin{aligned} [L + (\dot{\Psi}_0 - \dot{x})^T \frac{\partial L}{\partial \dot{x}}] |_{t_0} = 0 \\ x(t_0) = \Psi_0(t_0) \\ x(t_f) = x_f \\ \end{aligned}\right\}[L+(Ψ˙0​−x˙)T∂x˙∂L​]∣t0​​=0x(t0​)=Ψ0​(t0​)x(tf​)=xf​​⎭⎪⎪⎪⎬⎪⎪⎪⎫​

(2)末端固定,起点自由
(L−x˙T∂L∂x˙)∣t0=0(∂L∂x˙)∣t0=0x(tf)=xf}\left.\begin{aligned} (L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ x(t_f) = x_f \\ \end{aligned}\right\}(L−x˙T∂x˙∂L​)∣t0​​=0(∂x˙∂L​)∣t0​​=0x(tf​)=xf​​⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫​

2.4 用变分法解最优控制问题

变分法是处理泛函的数学领域,和处理函数的普通微积分相对。 … 在寻找函数的极大和极小值时,在一个解附近的微小变化的分析给出一阶的一个近似。 它不能分辨是找到了最大值或者最小值(或者都不是)。 变分法在理论物理中非常重要:在拉格朗日力学中,以及在最小作用量原理在量子力学的应用中。

宗量是来自泛函和复变函数的概念,在讨论泛函的连续以及其他性质的时候就要引出这个概念,它的 Taylor 展开式就要这个概念,实际上通俗的理解这个概念,就是自变量。为了防止与函数的自变量引起误会,那就出现这个概念了。

2.4.1 可用变分法求解的最优控制问题

最优控制问题是:寻找最优解 x∗(t)x^*(t)x∗(t) 和 u∗(t)u^*(t)u∗(t),使系统(微分方程)从已知初态,转移到要求的目标集,并使给定的性能泛函达到极值。

至于变分法,可以结合微分法来理解,就是目标函数相较于自变量(也叫宗量)的微分(也叫变分)为零时,目标函数达到极值。

2.4.2 末端时刻固定时的最优解

(1)末端时刻固定时最优解的必要条件
1)末端受约束
2)末端自由
3)末端固定

(2)末端时刻固定时的最优解的充分条件
等价勒让德条件之一成立

2.4.3 末端时刻自由时的最优解

(1)末端受约束时最优解的必要条件

(2)末端自由时最优解的必要条件

(3)末端固定时最优解的必要条件

2.5 角点条件与内点约束

用变分法求解最优控制时,要求容许轨线 x(t)x(t)x(t) 连续可微。

但是实际上常有轨线为分段光滑情况,即 x(t)x(t)x(t) 在有限个点上连续但不可微,这种点称为角点。

2.5.1 维尔斯特拉斯-欧特曼条件(角点条件)

∂L∂x˙∣t1−=∂L∂x˙∣t1+\frac{\partial L}{\partial \dot{x}} | _{t_1^-} = \frac{\partial L}{\partial \dot{x}} | _{t_1^+}∂x˙∂L​∣t1−​​=∂x˙∂L​∣t1+​​

(L−x˙T∂L∂x˙)∣t1−=−(L−x˙T∂L∂x˙)∣t1+(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^-} = -(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^+}(L−x˙T∂x˙∂L​)∣t1−​​=−(L−x˙T∂x˙∂L​)∣t1+​​

2.5.2 内点约束条件

状态轨线的中间点称为内点。

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法相关推荐

  1. 【控制】《最优控制理论与系统》-胡寿松老师-第1章-导论

    无 回到目录 第2章 <最优控制理论与系统>-胡寿松老师-第1章-导论 第1章 导论 1.1 引言 1.2 最有控制问题 1.2.1 最优控制实例 1.2.2 最优控制问题的基本组成 1. ...

  2. 【控制】《最优控制理论与系统》-胡寿松老师-第5章-线性最优状态调节器

    第4章 回到目录 第6章 <最优控制理论与系统>-胡寿松老师-第5章-线性最优状态调节器 第5章 线性最优状态调节器 5.1 线性二次型问题 5.2 状态调节器 5.2.1 有限时间状态调 ...

  3. 【控制】《自动控制原理》胡寿松老师-第10章-动态系统的最优控制方法

    第9章 回到目录 无 第10章-动态系统的最优控制方法 10.1 最优控制的一般概念 10.2 最优控制中的变分法 10.3 极小值原理及其应用 10.4 线性二次型问题的最优控制 1. 线性二次型问 ...

  4. 【控制】《自动控制原理》胡寿松老师-第9章-线性系统的状态空间分析与综合

    第8章 回到目录 第10章 [控制]第九章-线性系统的状态空间描述 9.1 线性系统的状态空间描述 1. 系统数学描述的两种基本类型 2. 系统状态空间描述常用的基本概念 3. 线性定常连续系统状态空 ...

  5. 【控制】《自动控制原理》胡寿松老师-第7章-线性离散系统的分析与校正

    第6章 回到目录 第8章 第7章-线性离散系统的分析与校正 7.1 离散系统的基本概念 7.2 信号的采样与保持 7.3 Z 变换理论 7.4 离散系统的数学模型 7.5 离散系统的稳定性与稳态误差 ...

  6. 【控制】《自动控制原理》胡寿松老师-第6章-线性系统的校正方法

    第5章 回到目录 第7章 第6章-线性系统的校正方法 6.1 系统的设计与校正问题 6.2 常用校正装置及其特性 6.3 串联校正 6.4 前馈校正 6.5 复合校正 6.6 控制系统校正设计 6.1 ...

  7. 【控制】《自动控制原理》胡寿松老师-第5章-线性系统的频域分析法

    第4章 回到目录 第6章 第5章-线性系统的频域分析法 5.1 频率特性 5.2 典型环节与开环系统的频率特性 5.3 频率域稳定判据 5.3.1 奈氏判据的数学基础 5.3.2 奈奎斯特稳定判据(奈 ...

  8. 【控制】《自动控制原理》胡寿松老师-第3章-线性系统的时域分析法

    第2章 回到目录 第4章 第3章-线性系统的时域分析法 3.1 系统时间响应的性能指标 3.2 一阶系统的时域分析 3.3 二阶系统的时域分析 3.4 高阶系统的时域分析 3.5 线性系统的稳定性分析 ...

  9. 【控制】《自动控制原理》胡寿松老师-第2章-控制系统的数学模型

    第1章 回到目录 第3章 第2章-控制系统的数学模型 2.1 控制系统的时域数学模型 2.2 控制系统的复数域数学模型 2.3 控制系统的结构图与信号流图 2.4 控制系统建模实例 2.1 控制系统的 ...

最新文章

  1. 进击的UI--------------------GETPOST
  2. python 统计list中各个元素出现的次数
  3. auuc 评估指标_广告中增益模型理解
  4. SpringBoot_数据访问-JDBC自动配置原理
  5. AppSettings和ConnectionStrings的区别
  6. 8支团队正在努力构建下一代Ethereum
  7. 新版易支付源码支持即时到账功能
  8. std中稳定排序算法_排序算法问题:稳定排序与不稳定排序
  9. UnityShader17:光照属性与阴影
  10. 错误代码: 1005 Can't create table 'hibernate.bill' (errno: 150)
  11. 吴恩达教授机器学习课程笔记【七】- Part 7 最优模型选择
  12. ZigBee-CC2530单片机 - LED呼吸灯
  13. ANSYS 有限元分析 坐标系/工作平面
  14. 【路径规划】基于蚁群求解多旅行商MTSP问题matlab源码
  15. 小文件治理之hive文件合并:hive小文件合并的三种方法
  16. 【Cartographer参数详解,调参,降低计算量调优笔记记录】
  17. 关于在ARM中的函数调用问题
  18. iOS 保证视频的清晰度和流畅度
  19. 搭建MPI并行计算环境并计算pi值[windows 和 Ubuntu]
  20. 亚马逊为什么能够成为创新力最强的公司

热门文章

  1. Unity Shader 屏幕后效果——高斯模糊
  2. 2.7 HBase架构深入剖析
  3. 基础知识:什么是ASP.NET Razor页面?
  4. njust 1927 谁才是最强战舰!(anti-nim博弈论)
  5. 老王学java之This()的用法
  6. WCF RIA Service中 POCO实体含有复杂类型怎么处理?
  7. Linux硬链接 软链接
  8. UA OPTI501 电磁波 LIH介质中的平面波1 平面波的性质
  9. UA OPTI570 量子力学 公式与结论总结1 角动量基础
  10. 脑与神经科学3 脑神经影像上