第1章	回到目录	第3章

《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

第2章最优控制中的变分法
- 2.1 泛函与变分
- - 2.1.1 线性赋范空间
  - 2.1.2 泛函及其定义域
  - 2.1.3 泛函的变分
  - - 定义2-13
  - 2.1.4 泛函极值与变分引理
- 2.2 欧拉方程
- - 2.2.1 无约束泛函极值的必要条件
  - - 定理2-6
  - 2.2.2 有等式约束的泛函极值的必要条件
  - 2.2.3 泛函极小值的充分条件
- 2.3 横截条件
- - 2.3.1 末端时刻固定时
  - 2.3.2 末端时刻自由时
  - 2.3.3 初始时刻自由时
- 2.4 用变分法解最优控制问题
- - 2.4.1 可用变分法求解的最优控制问题
  - 2.4.2 末端时刻固定时的最优解
  - 2.4.3 末端时刻自由时的最优解
- 2.5 角点条件与内点约束
- - 2.5.1 维尔斯特拉斯-欧特曼条件（角点条件）
  - 2.5.2 内点约束条件

第2章最优控制中的变分法

2.1 泛函与变分

2.1.1 线性赋范空间

2.1.2 泛函及其定义域

2.1.3 泛函的变分

泛函的变分与函数的微分，其定义几乎完全相当。

定义2-13

设 J(x)J(x)J(x) 是线性赋范空间 RnR^nRn 上的连续泛函，若其增量可表示为
ΔJ(x)=J(x+δx)−J(x)=L(x,δx)+r(x,δx)\begin{aligned} \Delta J(x) &= J(x + \delta x) - J(x) \\ &= L(x, \delta x) + r(x, \delta x) \end{aligned}ΔJ(x)=J(x+δx)−J(x)=L(x,δx)+r(x,δx)

式中 L(x,δx)L(x, \delta x)L(x,δx) 是关于 δx\delta xδx 的线性连续泛函， r(x,δx)r(x, \delta x)r(x,δx) 是关于 δx\delta xδx 的高阶无穷小，则
δJ=L(x,δx)\delta J = L (x, \delta x)δJ=L(x,δx)

称为泛函 J(x)J(x)J(x) 的变分。

泛函的变分就是泛函增量的线性主部。当一个泛函具有变分时，也称该泛函可微。像函数的微分一样，泛函的变分可以利用求导方法来确定。

2.1.4 泛函极值与变分引理

2.2 欧拉方程

2.2.1 无约束泛函极值的必要条件

定理2-6

对于无约束泛函极值，使二次型性能泛函取极致的必要条件，是轨线 x(t)x(t)x(t) 满足下列欧拉方程：
∂L∂x−ddt∂L∂x˙=0\frac{\partial L}{\partial x} - \frac{d}{dt} \frac{\partial L}{\partial \dot{x}} = 0∂x∂L−dtd∂x˙∂L=0

求解上式欧拉方程所需的两点边界值就是问题描述中已知的端点条件：
x(t0)=x0,x(tf)=xfx(t_0) = x_0,\quad x(t_f) = x_fx(t0)=x0,x(tf)=xf

2.2.2 有等式约束的泛函极值的必要条件

对于有约束条件 f(x,x˙,t)=0f(x, \dot{x}, t) = 0f(x,x˙,t)=0，使泛函取极值的必要条件，是轨线 x(t)x(t)x(t) 满足下列欧拉方程：
∂L∂x−ddt∂L∂x˙=0\frac{\partial L}{\partial x} - \frac{d}{dt} \frac{\partial L}{\partial \dot{x}} = 0∂x∂L−dtd∂x˙∂L=0

其中，L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)L(x, \dot{x}, \lambda, t) = g(x, \dot{x}, t) + \lambda^T(t) f(x, \dot{x}, t)L(x,x˙,λ,t)=g(x,x˙,t)+λT(t)f(x,x˙,t)

2.2.3 泛函极小值的充分条件

由于欧拉方程只是泛函能取极值的必要条件。下面给出泛函取极值的充分条件。

（1）无约束情况，除欧拉方程成立外，还需以下三个勒让德条件之一成立，
[∂2L∂x2∂2L∂x∂x˙(∂2L∂x∂x˙)T∂2L∂x˙2]>0\left[\begin{matrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x}} \\ (\frac{\partial^2 L}{\partial x \partial \dot{x}})^T & \frac{\partial^2 L}{\partial \dot{x}^2} \\ \end{matrix}\right] > 0[∂x2∂2L(∂x∂x˙∂2L)T∂x∂x˙∂2L∂x˙2∂2L]>0

或
∂2L∂x2−ddt∂2L∂x∂x˙≥0,∂2L∂x˙2>0\frac{\partial^2 L}{\partial x^2} - \frac{d}{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} \ge 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} > 0∂x2∂2L−dtd∂x∂x˙∂2L≥0,∂x˙2∂2L>0

或
∂2L∂x2−ddt∂2L∂x∂x˙>0,∂2L∂x˙2≥0\frac{\partial^2 L}{\partial x^2} - \frac{d}{dt}\frac{\partial^2 L}{\partial x \partial \dot{x}} > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \ge 0∂x2∂2L−dtd∂x∂x˙∂2L>0,∂x˙2∂2L≥0

（2）有约束情况，相同的勒让德条件，只是 LLL 不同，LLL 是构造出来的含有拉格朗日乘子向量 λ\lambdaλ 的泛函。

2.3 横截条件

2.3.1 末端时刻固定时

横截条件的一般表达式为
(∂L∂x˙)T∣tfδx(tf)−(∂L∂x˙)T∣t0δx(t0)=0(\frac{\partial L}{\partial \dot{x}})^T |_{t_f} \delta x(t_f) - (\frac{\partial L}{\partial \dot{x}})^T |_{t_0} \delta x(t_0) = 0(∂x˙∂L)T∣tfδx(tf)−(∂x˙∂L)T∣t0δx(t0)=0

2.3.2 末端时刻自由时

（1）起点固定，末端自由
L−x˙T(t)∂L∂x˙∣tf=0(∂L∂x˙)∣tf=0x(t0)=x0}\left.\begin{aligned} L - \dot{x}^T(t) \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_f} = 0 \\ x(t_0) = x_0 \\ \end{aligned}\right\}L−x˙T(t)∂x˙∂L∣tf=0(∂x˙∂L)∣tf=0x(t0)=x0⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫

（2）起点固定，末端受约束
[L+(c˙−x˙)T∂L∂x˙∣tf=0x(tf)=c(tf)x(t0)=x0}\left.\begin{aligned} [L + (\dot{c} - \dot{x})^T \frac{\partial L}{\partial \dot{x}} |_{t_f} = 0 \\ x(t_f) = c(t_f) \\ x(t_0) = x_0 \\ \end{aligned}\right\}[L+(c˙−x˙)T∂x˙∂L∣tf=0x(tf)=c(tf)x(t0)=x0⎭⎪⎪⎪⎬⎪⎪⎪⎫

2.3.3 初始时刻自由时

（1）末端固定，起点受约束
[L+(Ψ˙0−x˙)T∂L∂x˙]∣t0=0x(t0)=Ψ0(t0)x(tf)=xf}\left.\begin{aligned} [L + (\dot{\Psi}_0 - \dot{x})^T \frac{\partial L}{\partial \dot{x}}] |_{t_0} = 0 \\ x(t_0) = \Psi_0(t_0) \\ x(t_f) = x_f \\ \end{aligned}\right\}[L+(Ψ˙0−x˙)T∂x˙∂L]∣t0=0x(t0)=Ψ0(t0)x(tf)=xf⎭⎪⎪⎪⎬⎪⎪⎪⎫

（2）末端固定，起点自由
(L−x˙T∂L∂x˙)∣t0=0(∂L∂x˙)∣t0=0x(tf)=xf}\left.\begin{aligned} (L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ (\frac{\partial L}{\partial \dot{x}}) |_{t_0} = 0 \\ x(t_f) = x_f \\ \end{aligned}\right\}(L−x˙T∂x˙∂L)∣t0=0(∂x˙∂L)∣t0=0x(tf)=xf⎭⎪⎪⎪⎪⎬⎪⎪⎪⎪⎫

2.4 用变分法解最优控制问题

变分法是处理泛函的数学领域，和处理函数的普通微积分相对。 … 在寻找函数的极大和极小值时，在一个解附近的微小变化的分析给出一阶的一个近似。它不能分辨是找到了最大值或者最小值（或者都不是）。变分法在理论物理中非常重要：在拉格朗日力学中，以及在最小作用量原理在量子力学的应用中。

宗量是来自泛函和复变函数的概念，在讨论泛函的连续以及其他性质的时候就要引出这个概念，它的 Taylor 展开式就要这个概念，实际上通俗的理解这个概念，就是自变量。为了防止与函数的自变量引起误会，那就出现这个概念了。

2.4.1 可用变分法求解的最优控制问题

最优控制问题是：寻找最优解 x∗(t)x^*(t)x∗(t) 和 u∗(t)u^*(t)u∗(t)，使系统（微分方程）从已知初态，转移到要求的目标集，并使给定的性能泛函达到极值。

至于变分法，可以结合微分法来理解，就是目标函数相较于自变量（也叫宗量）的微分（也叫变分）为零时，目标函数达到极值。

2.4.2 末端时刻固定时的最优解

（1）末端时刻固定时最优解的必要条件
1）末端受约束
2）末端自由
3）末端固定

（2）末端时刻固定时的最优解的充分条件
等价勒让德条件之一成立

2.4.3 末端时刻自由时的最优解

（1）末端受约束时最优解的必要条件

（2）末端自由时最优解的必要条件

（3）末端固定时最优解的必要条件

2.5 角点条件与内点约束

用变分法求解最优控制时，要求容许轨线 x(t)x(t)x(t) 连续可微。

但是实际上常有轨线为分段光滑情况，即 x(t)x(t)x(t) 在有限个点上连续但不可微，这种点称为角点。

2.5.1 维尔斯特拉斯-欧特曼条件（角点条件）

∂L∂x˙∣t1−=∂L∂x˙∣t1+\frac{\partial L}{\partial \dot{x}} | _{t_1^-} = \frac{\partial L}{\partial \dot{x}} | _{t_1^+}∂x˙∂L∣t1−=∂x˙∂L∣t1+

(L−x˙T∂L∂x˙)∣t1−=−(L−x˙T∂L∂x˙)∣t1+(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^-} = -(L - \dot{x}^T \frac{\partial L}{\partial \dot{x}}) | _{t_1^+}(L−x˙T∂x˙∂L)∣t1−=−(L−x˙T∂x˙∂L)∣t1+

2.5.2 内点约束条件

状态轨线的中间点称为内点。

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法相关推荐

【控制】《最优控制理论与系统》-胡寿松老师-第1章-导论
无回到目录第2章 <最优控制理论与系统>-胡寿松老师-第1章-导论第1章导论 1.1 引言 1.2 最有控制问题 1.2.1 最优控制实例 1.2.2 最优控制问题的基本组成 1. ...
【控制】《最优控制理论与系统》-胡寿松老师-第5章-线性最优状态调节器
第4章回到目录第6章 <最优控制理论与系统>-胡寿松老师-第5章-线性最优状态调节器第5章线性最优状态调节器 5.1 线性二次型问题 5.2 状态调节器 5.2.1 有限时间状态调 ...
【控制】《自动控制原理》胡寿松老师-第10章-动态系统的最优控制方法
第9章回到目录无第10章-动态系统的最优控制方法 10.1 最优控制的一般概念 10.2 最优控制中的变分法 10.3 极小值原理及其应用 10.4 线性二次型问题的最优控制 1. 线性二次型问 ...
【控制】《自动控制原理》胡寿松老师-第9章-线性系统的状态空间分析与综合
第8章回到目录第10章 [控制]第九章-线性系统的状态空间描述 9.1 线性系统的状态空间描述 1. 系统数学描述的两种基本类型 2. 系统状态空间描述常用的基本概念 3. 线性定常连续系统状态空 ...
【控制】《自动控制原理》胡寿松老师-第7章-线性离散系统的分析与校正
第6章回到目录第8章第7章-线性离散系统的分析与校正 7.1 离散系统的基本概念 7.2 信号的采样与保持 7.3 Z 变换理论 7.4 离散系统的数学模型 7.5 离散系统的稳定性与稳态误差 ...
【控制】《自动控制原理》胡寿松老师-第6章-线性系统的校正方法
第5章回到目录第7章第6章-线性系统的校正方法 6.1 系统的设计与校正问题 6.2 常用校正装置及其特性 6.3 串联校正 6.4 前馈校正 6.5 复合校正 6.6 控制系统校正设计 6.1 ...
【控制】《自动控制原理》胡寿松老师-第5章-线性系统的频域分析法
第4章回到目录第6章第5章-线性系统的频域分析法 5.1 频率特性 5.2 典型环节与开环系统的频率特性 5.3 频率域稳定判据 5.3.1 奈氏判据的数学基础 5.3.2 奈奎斯特稳定判据(奈 ...
【控制】《自动控制原理》胡寿松老师-第3章-线性系统的时域分析法
第2章回到目录第4章第3章-线性系统的时域分析法 3.1 系统时间响应的性能指标 3.2 一阶系统的时域分析 3.3 二阶系统的时域分析 3.4 高阶系统的时域分析 3.5 线性系统的稳定性分析 ...
【控制】《自动控制原理》胡寿松老师-第2章-控制系统的数学模型
第1章回到目录第3章第2章-控制系统的数学模型 2.1 控制系统的时域数学模型 2.2 控制系统的复数域数学模型 2.3 控制系统的结构图与信号流图 2.4 控制系统建模实例 2.1 控制系统的 ...

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

第2章最优控制中的变分法

2.1 泛函与变分

2.1.1 线性赋范空间

2.1.2 泛函及其定义域

2.1.3 泛函的变分

定义2-13

2.1.4 泛函极值与变分引理

2.2 欧拉方程

2.2.1 无约束泛函极值的必要条件

定理2-6

2.2.2 有等式约束的泛函极值的必要条件

2.2.3 泛函极小值的充分条件

2.3 横截条件

2.3.1 末端时刻固定时

2.3.2 末端时刻自由时

2.3.3 初始时刻自由时

2.4 用变分法解最优控制问题

2.4.1 可用变分法求解的最优控制问题

2.4.2 末端时刻固定时的最优解

2.4.3 末端时刻自由时的最优解

2.5 角点条件与内点约束

2.5.1 维尔斯特拉斯-欧特曼条件（角点条件）

2.5.2 内点约束条件

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法相关推荐

最新文章

热门文章

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法

第2章 最优控制中的变分法

2.1 泛函与变分

2.1.1 线性赋范空间

2.1.2 泛函及其定义域

2.1.3 泛函的变分

定义2-13

2.1.4 泛函极值与变分引理

2.2 欧拉方程

2.2.1 无约束泛函极值的必要条件

定理2-6

2.2.2 有等式约束的泛函极值的必要条件

2.2.3 泛函极小值的充分条件

2.3 横截条件

2.3.1 末端时刻固定时

2.3.2 末端时刻自由时

2.3.3 初始时刻自由时

2.4 用变分法解最优控制问题

2.4.1 可用变分法求解的最优控制问题

2.4.2 末端时刻固定时的最优解

2.4.3 末端时刻自由时的最优解

2.5 角点条件与内点约束

2.5.1 维尔斯特拉斯-欧特曼条件（角点条件）

2.5.2 内点约束条件

【控制】《最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法相关推荐

最新文章

热门文章

第2章最优控制中的变分法