扩张状态观测器(extended state observer, ESO)是自抗扰控制(active disturbance rejection control, ADRC)的核心组成部分,在自抗扰控制的相关文献中大都会反复出现ESO和ADRC这两个英文缩写词。关于ADRC的具体思想和设计方法可以参见其发明者韩京清的专著[1],不过,专著[1]中更多地从工程角度对ADRC进行分析,而本文则主要是分析ESO论文证明的套路,也作为自己学习ADRC的一个总结,涉及到的文献则主要为[2]和[3]。

ESO的主要思想在于将包括干扰在内的系统中所有不确定的部分统一视为系统的一个新状态,即对原系统扩张了一个状态,然后设计观测器去估计这个状态。一旦实现对这个新状态的估计,那么在后面的控制律中直接将这个估计值减去,就认为达到了消除不确定性的目的,然后就可以采用任何能够保证剩下已知部分模型稳定的控制律来保证控制性能。从这个角度说,ESO其实承担了ADRC的绝大部分压力,ADRC有效的前提是ESO能够实现对扩张状态快速有效的估计。需要指出的是,ESO在设计过程中也借鉴了现有观测器的经验,而且与HK Khalil的专著[4]中提到的高增益观测器有类似之处,本质上均属于奇异摄动,即需要观测器的状态足够快。特别地,在线性情形下,ESO与文献[5]中的扩张高增益观测器具有相同形式,可见奇妙的思想总是相通的。

下面以文献[2]为主要内容,对ESO的收敛性分析进行说明。控制理论方面的论文喜欢利用微分方程(包括常微分方程和偏微分方程)作为工具进行数学公式推导,从这个角度来说,我一直将控制理论的研究等效描述成微分方程解的稳定性,过分关注数学模型也是导致控制理论和控制工程存在巨大gap很重要的原因,这里不展开说了,毕竟我们这里的关注重点是ESO论文的思路,为想自己撰写ADRC方面论文的读者提供借鉴和参考。

我们主要考虑如下nnn阶常微分方程描述的模型(或者所谓的积分形式系统):

(1){x˙1(t)=x2(t),  x1(0)=x10,x˙2(t)=x3(t),  x2(0)=x20,⋮x˙n(t)=f(t,x1(t),x2(t),…,xn(t))+w(t)+u(t),  xn(0)=xn0,y(t)=x1(t),\left\{\begin{aligned} &\dot{x}_1(t)=x_2(t),\;x_1(0)=x_{10},\\ &\dot{x}_2(t)=x_3(t),\;x_2(0)=x_{20},\\ &\vdots\\ &\dot{x}_n(t)=f(t,x_1(t),x_2(t),\ldots,x_n(t))+w(t)+u(t),\;x_n(0)=x_{n0},\\ &y(t)=x_1(t), \end{aligned}\right.\tag{1}⎩⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎧​​x˙1​(t)=x2​(t),x1​(0)=x10​,x˙2​(t)=x3​(t),x2​(0)=x20​,⋮x˙n​(t)=f(t,x1​(t),x2​(t),…,xn​(t))+w(t)+u(t),xn​(0)=xn0​,y(t)=x1​(t),​(1)

其中,x1,…,xnx_1,\ldots,x_nx1​,…,xn​为状态,uuu为控制输入,yyy为输出,fff为未知非线性函数,www为外部干扰,x10,…,xn0x_{10},\ldots,x_{n0}x10​,…,xn0​为状态初值,式(1)也称为单输入单输出系统。ESO将f+wf+wf+w称为“总扰动”,并令xn+1=f+wx_{n+1}=f+wxn+1​=f+wxn+1x_{n+1}xn+1​ 称为扩张状态(即相对于原系统多出了一阶),进而设计观测器去估计这个扩张状态,这就是ESO名称的主要由来。为了理论推导可以继续,首先需要假设 可导,具体地,有

假设1 :fff和www对各自的自变量连续可导,且有

∣u∣+∣f∣+∣w˙∣+∣∂f∂t∣+∑i=1n∣∂f∂xi∣≤c0+∑j=1ncj∣xj∣k,\left\vert u\right\vert+\left\vert f\right\vert+\left\vert\dot{w}\right\vert+\left\vert\frac{\partial f}{\partial t}\right\vert +\sum\limits_{i=1}^{n}\left\vert\frac{\partial f}{\partial x_i}\right\vert\leq c_0+\sum\limits_{j=1}^{n}c_j\left\vert x_j\right\vert^k,∣u∣+∣f∣+∣w˙∣+∣∣∣∣​∂t∂f​∣∣∣∣​+i=1∑n​∣∣∣∣​∂xi​∂f​∣∣∣∣​≤c0​+j=1∑n​cj​∣xj​∣k,

其中,cjc_jcj​,j=0,1,…,nj=0,1,\ldots,nj=0,1,…,n为正常数,kkk为正整数。

在假设1的前提下,系统(1)可重新写为
(2){x˙1(t)=x2(t),  x1(0)=x10,x˙2(t)=x3(t),  x2(0)=x20,⋮x˙n(t)=xn+1(t),  xn(0)=xn0,x˙n+1(t)=L˙(t),  xn+1(0)=L(0),y(t)=x1(t),\left\{\begin{aligned} &\dot{x}_1(t)=x_2(t),\;x_1(0)=x_{10},\\ &\dot{x}_2(t)=x_3(t),\;x_2(0)=x_{20},\\ &\vdots\\ &\dot{x}_n(t)=x_{n+1}(t),\;x_n(0)=x_{n0},\\ &\dot{x}_{n+1}(t)=\dot{L}(t),\;x_{n+1}(0)=L(0),\\ &y(t)=x_1(t), \end{aligned}\right.\tag{2}⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​x˙1​(t)=x2​(t),x1​(0)=x10​,x˙2​(t)=x3​(t),x2​(0)=x20​,⋮x˙n​(t)=xn+1​(t),xn​(0)=xn0​,x˙n+1​(t)=L˙(t),xn+1​(0)=L(0),y(t)=x1​(t),​(2)
其中,L(t)=f(t,x1(t),x2(t),…,xn(t))+w(t)L(t)=f(t,x_1(t),x_2(t),\ldots,x_n(t))+w(t)L(t)=f(t,x1​(t),x2​(t),…,xn​(t))+w(t)。针对系统(2),ESO设计为如下形式:
(3){x^˙1(t)=x^2(t)+ϵn−1g1(y(t)−x^1(t)εn),x^˙2(t)=x^3(t)+ϵn−2g2(y(t)−x^1(t)εn),⋮x^˙n(t)=xn+1(t)+gn(y(t)−x^1(t)εn)+u(t),x^˙n+1(t)=1ϵgn+1(y(t)−x^1(t)εn),\left\{\begin{aligned} &\dot{\hat{x}}_1(t)=\hat{x}_2(t)+\epsilon^{n-1}g_1\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right),\\ &\dot{\hat{x}}_2(t)=\hat{x}_3(t)+\epsilon^{n-2}g_2\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right),\\ &\vdots\\ &\dot{\hat{x}}_n(t)=x_{n+1}(t)+g_n\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right)+u(t),\\ &\dot{\hat{x}}_{n+1}(t)=\frac{1}{\epsilon}g_{n+1}\left(\frac{y(t)-\hat{x}_1(t)}{\varepsilon^n}\right), \end{aligned}\right.\tag{3}⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​x^˙1​(t)=x^2​(t)+ϵn−1g1​(εny(t)−x^1​(t)​),x^˙2​(t)=x^3​(t)+ϵn−2g2​(εny(t)−x^1​(t)​),⋮x^˙n​(t)=xn+1​(t)+gn​(εny(t)−x^1​(t)​)+u(t),x^˙n+1​(t)=ϵ1​gn+1​(εny(t)−x^1​(t)​),​(3)
其中,gig_igi​,i=1,2,…,n+1i=1,2,\ldots,n+1i=1,2,…,n+1为设计函数,ε\varepsilonε为增益,当gig_igi​取线性形式时,即可得到扩张高增益观测器:
(4){x^˙1(t)=x^2(t)+α1ϵ(y(t)−x^1(t)),x^˙2(t)=x^3(t)+α2ϵ2(y(t)−x^1(t)),⋮x^˙n(t)=xn+1(t)+αnϵn(y(t)−x^1(t))+u(t),x^˙n+1(t)=αn+1ϵn+1(y(t)−x^1(t)),\left\{\begin{aligned} &\dot{\hat{x}}_1(t)=\hat{x}_2(t)+\frac{\alpha_1}{\epsilon}\left(y(t)-\hat{x}_1(t)\right),\\ &\dot{\hat{x}}_2(t)=\hat{x}_3(t)+\frac{\alpha_2}{\epsilon^2}\left(y(t)-\hat{x}_1(t)\right),\\ &\vdots\\ &\dot{\hat{x}}_n(t)=x_{n+1}(t)+\frac{\alpha_n}{\epsilon^n}\left(y(t)-\hat{x}_1(t)\right)+u(t),\\ &\dot{\hat{x}}_{n+1}(t)=\frac{\alpha_{n+1}}{\epsilon^{n+1}}\left(y(t)-\hat{x}_1(t)\right), \end{aligned}\right.\tag{4}⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​x^˙1​(t)=x^2​(t)+ϵα1​​(y(t)−x^1​(t)),x^˙2​(t)=x^3​(t)+ϵ2α2​​(y(t)−x^1​(t)),⋮x^˙n​(t)=xn+1​(t)+ϵnαn​​(y(t)−x^1​(t))+u(t),x^˙n+1​(t)=ϵn+1αn+1​​(y(t)−x^1​(t)),​(4)
其中,αi\alpha_iαi​,i=1,2,…,n+1i=1,2,\ldots,n+1i=1,2,…,n+1为设计常数。

下面开始分析ESO(3)的收敛性,为此,进一步有下面两个假设,在后面可以看到作出这两个假设的作用,简单来说就是先用Lyapunov函数推导稳定性,然后发现如果不作这样的假设就推导不下去,因此就这样假设了(可以说这是大部分控制理论领域论文偏离工程实际的主要原因,一切为Lyapunov稳定性推导服务,最后演变成做数学习题模式,颇有自娱自乐之意):

假设2:www和系统(1)的解满足对各自的自变量连续可导,且对i=1,2,…,ni=1,2,\ldots,ni=1,2,…,n均有∣w∣+∣xi(t)∣≤B\left\vert w\right\vert+\left\vert x_i(t)\right\vert\leq B∣w∣+∣xi​(t)∣≤B,B>0B>0B>0为常数,t≥0t\geq 0t≥0。

假设3:存在常数λi(i=1,2,3,4)\lambda_i(i=1,2,3,4)λi​(i=1,2,3,4),α\alphaα,β\betaβ和正定连续可微函数VVV,WWW:Rn+1→R\mathbb{R}^{n+1}\rightarrow\mathbb{R}Rn+1→R使得

  • λ1∥y∥2≤V(y)≤λ2∥y∥2\lambda_1\Vert y\Vert^2\leq V(y)\leq\lambda_2\Vert y\Vert^2λ1​∥y∥2≤V(y)≤λ2​∥y∥2,λ3∥y∥2≤W(y)≤λ4∥y∥2\lambda_3\Vert y\Vert^2\leq W(y)\leq\lambda_4\Vert y\Vert^2λ3​∥y∥2≤W(y)≤λ4​∥y∥2,
  • ∑i=1n∂V∂yi(yi+1−gi(y1))−∂V∂yn+1gn+1(y1)≤−W(y)\sum\limits_{i=1}^{n}\frac{\partial V}{\partial y_i}(y_{i+1}-g_i(y_1))- \frac{\partial V}{\partial y_{n+1}}g_{n+1}(y_1)\leq -W(y)i=1∑n​∂yi​∂V​(yi+1​−gi​(y1​))−∂yn+1​∂V​gn+1​(y1​)≤−W(y),
  • ∣∂V∂yn+1∣≤β∥y∥\left\vert\frac{\partial V}{\partial y_{n+1}}\right\vert\leq\beta \Vert y\Vert∣∣∣​∂yn+1​∂V​∣∣∣​≤β∥y∥,

其中,y=(y1,y2,…,yn+1)y=(y_1,y_2,\ldots,y_{n+1})y=(y1​,y2​,…,yn+1​),∥⋅∥\Vert\cdot\Vert∥⋅∥为Euclid范数。

下面就可以提出定理了(控制理论论文的通常模式就是提出一个定理,然后用大量篇幅去证明,各种秀公式,当然,为了使得公式能秀下去,先在前面作出一大堆假设,事实上,一般是先推导,根据推导进行的程度作出假设,因此可以说是先有证明,后有假设)。

定理1:若假设1-假设3成立,则有
(i) 对每一个正常数aaa,lim⁡ε→0∣xi(t)−x^i(t)∣=0\lim\limits_{\varepsilon\rightarrow 0}\vert x_i(t)-\hat{x}_i(t)\vert=0ε→0lim​∣xi​(t)−x^i​(t)∣=0对t∈[a,∞)t\in[a,\infty)t∈[a,∞)一致成立;
(ii)lim⁡t→∞∣xi(t)−x^i(t)∣≤O(εn+2−i)\lim\limits_{t\rightarrow \infty}\vert x_i(t)-\hat{x}_i(t)\vert\leq O(\varepsilon^{n+2-i})t→∞lim​∣xi​(t)−x^i​(t)∣≤O(εn+2−i)。
其中,xix_ixi​,x^i\hat{x}_ix^i​分别为系统(1)和ESO(3)的解,i=1,2,…,n+1i=1,2,\ldots,n+1i=1,2,…,n+1,xn+1=f+wx_{n+1}=f+wxn+1​=f+w为系统(1)的扩张状态。

证明:首先分析L˙(t)\dot{L}(t)L˙(t)(或者说是x˙n+1(t)\dot{x}_{n+1}(t)x˙n+1​(t))的有界性,写出其表达式且变换时间坐标,有
(5)Δ(t)=ddsf(s,x1(s),…,xn(s))∣s=εt+w˙(εt)=∂∂tf(εt,x1(εt),…,xn(εt))+∑i=1nxi+1(εt)∂∂xif(εt,x1(εt),…,xn(εt))+u(εt)∂∂xnf(εt,x1(εt),…,xn(εt))+w˙(εt).\begin{aligned} \Delta(t)=&\left.\frac{\mathrm{d}}{\mathrm{d}s}f(s,x_1(s),\ldots,x_n(s))\right|_{s=\varepsilon t}+\dot{w}(\varepsilon t)\\ =&\frac{\partial}{\partial t}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t)) +\sum_{i=1}^{n}x_{i+1}(\varepsilon t)\frac{\partial}{\partial x_i}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t))\\ &+u(\varepsilon t)\frac{\partial}{\partial x_n}f(\varepsilon t,x_1(\varepsilon t),\ldots,x_n(\varepsilon t)) +\dot{w}(\varepsilon t). \end{aligned}\tag{5}Δ(t)==​dsd​f(s,x1​(s),…,xn​(s))∣∣∣∣​s=εt​+w˙(εt)∂t∂​f(εt,x1​(εt),…,xn​(εt))+i=1∑n​xi+1​(εt)∂xi​∂​f(εt,x1​(εt),…,xn​(εt))+u(εt)∂xn​∂​f(εt,x1​(εt),…,xn​(εt))+w˙(εt).​(5)

发现了没有?Δ(t)\Delta(t)Δ(t)其实就是L(t)L(t)L(t)(或者说是xn+1(t)x_{n+1}(t)xn+1​(t))在εt\varepsilon tεt处导数的取值。根据假设1和假设2,只要ε\varepsilonε为正,不管ε\varepsilonε取值多小,Δ(t)\Delta(t)Δ(t)都是有界的,也就是说存在ε\varepsilonε和无关的正常数M>0M>0M>0使得∥Δ(t)∥≤M\Vert\Delta (t)\Vert\leq M∥Δ(t)∥≤M对所有t≥0t\geq 0t≥0均成立。注意到“不确定项L(t)L(t)L(t)导数的界和Δ(t)\Delta(t)Δ(t)无关”这个性质相当重要,是证明ESO收敛和整个ADRC稳定的关键,该性质表明,在Lyapunov稳定性框架下,理论上可以通过任意改变ε\varepsilonε的取值(前提是ε\varepsilonε为正)来压缩与不确定项有关的交叉项来使得闭环系统稳定,在下面的分析中可以很明显地看到这一点。

既然要分析ESO的收敛性,自然要看估计误差的表现,因此定义

(6)ei(t)=xi(t)−x^i(t),  ηi(t)=ei(εt)εn+1−i,  i=1,2,…,n+1,e_i(t)=x_i(t)-\hat{x}_i(t),\;\eta_i(t)=\frac{e_i(\varepsilon t)}{\varepsilon^{n+1-i}},\;i=1,2,\ldots,n+1,\tag{6}ei​(t)=xi​(t)−x^i​(t),ηi​(t)=εn+1−iei​(εt)​,i=1,2,…,n+1,(6)

其中,定义ηi(t)\eta_i(t)ηi​(t)的技巧来自于文献[4],这里对时间坐标稍作改变,不影响实质,或者说ei(t)e_i(t)ei​(t)是直接的估计误差,而ηi(t)\eta_i(t)ηi​(t)则是处于收敛性分析需要而定义的一种尺度化估计误差,令η=[η1,η2,…,ηn+1]T\eta=[\eta_1,\eta_2,\ldots,\eta_{n+1}]^\mathrm{T}η=[η1​,η2​,…,ηn+1​]T,写出η\etaη系统应满足的微分方程,则有

(7){η˙1(t)=η2(t)−g1(η1(t)),η1(0)=e1(0)εn,η˙2(t)=η3(t)−g2(η1(t)),η2(0)=e2(0)εn−1,⋮η˙n(t)=ηn+1(t)−gn(η1(t)),ηn(0)=en(0)ε,η˙n+1(t)=−gn+1(η1(t))+εΔ(t),ηn+1(0)=en+1(0).\left\{\begin{aligned} &\dot{\eta}_1(t)=\eta_2(t)-g_1(\eta_1(t)),\eta_1(0)=\frac{e_1(0)}{\varepsilon^n},\\ &\dot{\eta}_2(t)=\eta_3(t)-g_2(\eta_1(t)),\eta_2(0)=\frac{e_2(0)}{\varepsilon^{n-1}},\\ &\vdots\\ &\dot{\eta}_n(t)=\eta_{n+1}(t)-g_n(\eta_1(t)),\eta_n(0)=\frac{e_n(0)}{\varepsilon},\\ &\dot{\eta}_{n+1}(t)=-g_{n+1}(\eta_1(t))+\varepsilon\Delta(t),\eta_{n+1}(0)=e_{n+1}(0). \end{aligned}\right.\tag{7}⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​η˙​1​(t)=η2​(t)−g1​(η1​(t)),η1​(0)=εne1​(0)​,η˙​2​(t)=η3​(t)−g2​(η1​(t)),η2​(0)=εn−1e2​(0)​,⋮η˙​n​(t)=ηn+1​(t)−gn​(η1​(t)),ηn​(0)=εen​(0)​,η˙​n+1​(t)=−gn+1​(η1​(t))+εΔ(t),ηn+1​(0)=en+1​(0).​(7)

现在可以看到假设3的作用了,假设3是在Lyapunov稳定性框架下作出的,即相当于认为一旦设计选取的函数gig_igi​,i=1,2,…,n+1i=1,2,\ldots,n+1i=1,2,…,n+1确定好以后,就存在一个合适的Lyapunov函数VVV,使得该Lyapunov函数VVV沿着η\etaη系统的导数满足一定性质,这是Lyapunov稳定性证明的常用套路。有些论文为了所谓的严谨性,会在证明中说选取一个准Lyapunov函数,因为它们认为只有最后证明了一个函数沿系统的导数满足Lyapunov稳定性框架下的性质,才能称之为Lyapunov函数,不过这也只是玩玩文字游戏罢了,不改变问题实质。为了在理论上凸显逼格,这里没有限定gig_igi​的具体形式,因此也无法给出Lyapunov函数的一般形式。根据假设3,可以得到

(8)ddtV(η(t))=∑i=1n∂V∂ηi(ηi+1−gi(η1))−∂V∂ηn+1gn+1(η1)+∂V∂ηn+1εΔ≤−W(η)+εMβ∥η∥≤−λ3λ2V(η)+λ1λ1εMβV(η).\begin{aligned}\frac{\mathrm{d}}{\mathrm{d}t}V(\eta(t)) =&\sum_{i=1}^{n}\frac{\partial V}{\partial \eta_i}(\eta_{i+1}-g_i(\eta_1)) -\frac{\partial V}{\partial \eta_{n+1}}g_{n+1}(\eta_1) +\frac{\partial V}{\partial \eta_{n+1}}\varepsilon\Delta\\ \leq&-W(\eta)+\varepsilon M\beta\Vert\eta\Vert \leq-\frac{\lambda_3}{\lambda_2}V(\eta)+\frac{\sqrt{\lambda_1}}{\lambda_1}\varepsilon M\beta\sqrt{V(\eta)}.\end{aligned}\tag{8}dtd​V(η(t))=≤​i=1∑n​∂ηi​∂V​(ηi+1​−gi​(η1​))−∂ηn+1​∂V​gn+1​(η1​)+∂ηn+1​∂V​εΔ−W(η)+εMβ∥η∥≤−λ2​λ3​​V(η)+λ1​λ1​​​εMβV(η)​.​(8)

根据V(η(t))\sqrt{V(\eta(t))}V(η(t))​和V(η(t))V(\eta(t))V(η(t))的关系,进一步有

(9)ddtV(η(t))≤−λ32λ2V(η(t))+λ1εMβ2λ1.\frac{\mathrm{d}}{\mathrm{d}t}\sqrt{V(\eta(t))} \leq -\frac{\lambda_3}{2\lambda_2}\sqrt{V(\eta(t))}+\frac{\sqrt{\lambda_1}\varepsilon M\beta}{2\lambda_1}.\tag{9}dtd​V(η(t))​≤−2λ2​λ3​​V(η(t))​+2λ1​λ1​​εMβ​.(9)

再一次根据假设3,有

(10)∥η(t)∥≤V(η(t))λ1≤λ1V(η(0))λ1e−λ32λ2t+εMβ2λ1∫0te−λ32λ2(t−s)ds.\Vert\eta(t)\Vert\leq\sqrt{\frac{V(\eta(t))}{\lambda_1}} \leq\frac{\sqrt{\lambda_1V(\eta(0))}}{\lambda_1}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}t} +\frac{\varepsilon M\beta}{2\lambda_1}\int_{0}^{t}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}(t-s)}\mathrm{d}s.\tag{10}∥η(t)∥≤λ1​V(η(t))​​≤λ1​λ1​V(η(0))​​e−2λ2​λ3​​t+2λ1​εMβ​∫0t​e−2λ2​λ3​​(t−s)ds.(10)

最后根据η(t)\eta(t)η(t)和e(t)e(t)e(t)的关系可得

(11)∣ei(t)∣=εn+1−i∣ηi(tε)∣≤εn+1−i∥η(tε)∥≤εn+1−i[λ1V(η(0))λ1e−λ3t2λ2ε+εMβ2λ1∫0tεe−λ32λ2(t/ε−s)ds].\begin{aligned} \vert e_i(t)\vert&=\varepsilon^{n+1-i}\left\vert\eta_i\left(\frac{t}{\varepsilon}\right)\right\vert \leq\varepsilon^{n+1-i}\left\Vert\eta\left(\frac{t}{\varepsilon}\right)\right\Vert\\ &\leq\varepsilon^{n+1-i}\left[ \frac{\sqrt{\lambda_1V(\eta(0))}}{\lambda_1}\mathrm{e}^{-\frac{\lambda_3 t}{2\lambda_2\varepsilon}} +\frac{\varepsilon M\beta}{2\lambda_1}\int_{0}^{\frac{t}{\varepsilon}}\mathrm{e}^{-\frac{\lambda_3}{2\lambda_2}(t/\varepsilon-s)}\mathrm{d}s\right].\end{aligned}\tag{11}∣ei​(t)∣​=εn+1−i∣∣∣∣​ηi​(εt​)∣∣∣∣​≤εn+1−i∥∥∥∥​η(εt​)∥∥∥∥​≤εn+1−i[λ1​λ1​V(η(0))​​e−2λ2​ελ3​t​+2λ1​εMβ​∫0εt​​e−2λ2​λ3​​(t/ε−s)ds].​(11)

可见对t∈[a,∞)t\in[a,\infty)t∈[a,∞),当ε→0\varepsilon\rightarrow 0ε→0时∣ei(t)∣→0\vert e_i(t)\vert\rightarrow 0∣ei​(t)∣→0一致成立,定理1的两个结论都可以从上式推得,证毕。

需要说明的是,当gig_igi​取为线性形式时,Lyapunov函数可以取为 系统状态的二次函数,因为此时η\etaη系统可以写为

(12){η˙1(t)=η2(t)−α1η1(t),η1(0)=e1(0)εn,η˙2(t)=η3(t)−α2η1(t),η2(0)=e2(0)εn−1,⋮η˙n(t)=ηn+1(t)−αnη1(t),ηn(0)=en(0)ε,η˙n+1(t)=−αn+1η1(t)+εΔ(t),ηn+1(0)=en+1(0).\left\{\begin{aligned} &\dot{\eta}_1(t)=\eta_2(t)-\alpha_1\eta_1(t),\eta_1(0)=\frac{e_1(0)}{\varepsilon^n},\\ &\dot{\eta}_2(t)=\eta_3(t)-\alpha_2\eta_1(t),\eta_2(0)=\frac{e_2(0)}{\varepsilon^{n-1}},\\ &\vdots\\ &\dot{\eta}_n(t)=\eta_{n+1}(t)-\alpha_n\eta_1(t),\eta_n(0)=\frac{e_n(0)}{\varepsilon},\\ &\dot{\eta}_{n+1}(t)=-\alpha_{n+1}\eta_1(t)+\varepsilon\Delta(t),\eta_{n+1}(0)=e_{n+1}(0). \end{aligned}\right.\tag{12}⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎧​​η˙​1​(t)=η2​(t)−α1​η1​(t),η1​(0)=εne1​(0)​,η˙​2​(t)=η3​(t)−α2​η1​(t),η2​(0)=εn−1e2​(0)​,⋮η˙​n​(t)=ηn+1​(t)−αn​η1​(t),ηn​(0)=εen​(0)​,η˙​n+1​(t)=−αn+1​η1​(t)+εΔ(t),ηn+1​(0)=en+1​(0).​(12)

此时,只要如下矩阵为Hurwitz:

(13)E=[−α110⋯0−α201⋯0⋮⋮⋮⋱⋮−αn00⋯1−αn+100⋯0],E=\left[\begin{matrix} -\alpha_1 & 1 & 0 & \cdots & 0\\ -\alpha_2 & 0 & 1 & \cdots & 0\\ \vdots & \vdots & \vdots &\ddots &\vdots\\ -\alpha_n & 0 & 0 & \cdots & 1\\ -\alpha_{n+1} & 0 & 0 & \cdots & 0\\ \end{matrix}\right],\tag{13}E=⎣⎢⎢⎢⎢⎢⎡​−α1​−α2​⋮−αn​−αn+1​​10⋮00​01⋮00​⋯⋯⋱⋯⋯​00⋮10​⎦⎥⎥⎥⎥⎥⎤​,(13)

令PPP为满足Lyapunov方程PE+ETP=−IPE+E^\mathrm{T}P=-IPE+ETP=−I的正定矩阵,III为n+1n+1n+1维单位矩阵,则假设3中的函数VVV,WWW:Rn+1→R\mathbb{R}^{n+1}\rightarrow\mathbb{R}Rn+1→R可以定义为

(14)V(η)=ηTPη,    W(η)=ηTη,    ∀η∈Rn+1.V(\eta)=\eta^\mathrm{T}P\eta,\;\;W(\eta)=\eta^\mathrm{T}\eta,\;\;\forall \eta\in\mathbb{R}^{n+1}.\tag{14}V(η)=ηTPη,W(η)=ηTη,∀η∈Rn+1.(14)

则有
λmin⁡(P)∥η∥2≤V(η)≤λmax⁡(P)∥η∥2,\lambda_{\min}(P)\Vert\eta\Vert^2\leq V(\eta)\leq\lambda_{\max}(P)\Vert\eta\Vert^2,λmin​(P)∥η∥2≤V(η)≤λmax​(P)∥η∥2,

∑i=1n∂V∂ηi(ηi+1−αiη1)−∂V∂ηn+1αn+1η1=−ηTη=−∥η∥2=−W(y),\sum_{i=1}^{n}\frac{\partial V}{\partial \eta_i}(\eta_{i+1}-\alpha_i\eta_1)- \frac{\partial V}{\partial \eta_{n+1}}\alpha_{n+1}\eta_1 =-\eta^\mathrm{T}\eta=-\Vert\eta\Vert^2=-W(y),i=1∑n​∂ηi​∂V​(ηi+1​−αi​η1​)−∂ηn+1​∂V​αn+1​η1​=−ηTη=−∥η∥2=−W(y),

以及

∣∂V∂ηn+1∣≤∥∂V∂η∥=∥2ηTP∥≤2∥P∥∥η∥=2λmax⁡(P)∥η∥,\left\vert\frac{\partial V}{\partial \eta_{n+1}}\right\vert \leq\left\Vert\frac{\partial V}{\partial \eta}\right\Vert =\Vert2\eta^\mathrm{T}P\Vert\leq 2\Vert P\Vert \Vert\eta\Vert =2\lambda_{\max}(P)\Vert \eta\Vert,∣∣∣∣​∂ηn+1​∂V​∣∣∣∣​≤∥∥∥∥​∂η∂V​∥∥∥∥​=∥2ηTP∥≤2∥P∥∥η∥=2λmax​(P)∥η∥,

其中,λmax⁡(P)\lambda_{\max}(P)λmax​(P)和λmin⁡(P)\lambda_{\min}(P)λmin​(P)分别为PPP的最大和最小特征值。可见此时假设3中的条件是满足的,因此对于线性形式的ESO可以直接利用上面的证明过程得到收敛性结论。

到这里,关于ESO的收敛性分析已经完成了第一部分,文献[2]进一步放宽了假设3的条件,将ESO的收敛性分析进行推广,而文献[3]则进一步考虑了下三角形式系统的ESO设计和收敛性分析,我们将在下一篇博客中再详细分析。

参考文献

[1]韩京清. 自抗扰控制技术: 估计补偿不确定因素的控制技术[M]. 国防工业出版社, 2008.

[2]Guo B Z, Zhao Z. On the convergence of an extended state observer for nonlinear systems with uncertainty[J]. Systems & Control Letters, 2011, 60(6): 420-430.

[3]Zhao Z L, Guo B Z. Extended state observer for uncertain lower triangular nonlinear systems[J]. Systems & Control Letters, 2015, 85: 100-108.

[4]Khalil H K. Nonlinear systems[M]. Prentice-Hall, 2001.

[5]Freidovich L B, Khalil H K. Performance recovery of feedback-linearization-based designs[J]. IEEE Transactions on automatic control, 2008, 53(10): 2324-2334.

自抗扰控制中的扩张状态观测器收敛性分析1相关推荐

  1. 永磁同步电机自抗扰无位置传感器控制仿真,同时实现自抗扰和基于eso扩张状态观测器的无位置控制仿真

    永磁同步电机自抗扰无位置传感器控制仿真,同时实现自抗扰和基于eso扩张状态观测器的无位置控制仿真. ID:6950670038985136

  2. 扩张状态观测器matlab函数,基于Matlab的扩张状态观测器仿真及分析探究.pdf

    2015年4月15日 现代电子技术 Apr.2015 第38卷第8期 ModernElectronicsTechnique Vol.38No.8 41 41 基于Matlab的扩张状态观测器仿真及分析 ...

  3. 直立车模控制中三种滤波算法简单分析(清华卓晴)

    摘自:https://mp.weixin.qq.com/s/WbCh0NFAnsf9y2blQenf7g 让我想起余义的一篇文章也是说到平衡车有三种滤波,我想和卓晴说的是一样的吧. https://b ...

  4. 扩张状态观测器matlab函数,基于Matlab的扩张状态观测器仿真及分析

    状态观测器是现代控制理论的重要组成部分[1-2],它是从系统状态空间方程出发,利用原系统的输入和输出信号获得原系统状态变量估值的方法,在传感器噪声处理.系统相移抑制以及高性能控制系统的设计中应用得非常 ...

  5. 梯度下降(Gradient Descent)的收敛性分析

    ©作者 | 黄秋实 单位 | 香港中文大学(深圳) 研究方向 | 智能电网 梯度下降是一种简单且常用的优化方法,它可以被用来求解很多可导的凸优化问题(如逻辑回归,线性回归等).同时,梯度下降在非凸优化 ...

  6. 2018-3-22论文一种新型的智能算法--狼群算法(笔记三)算法的步骤+收敛性分析

    首先整体的系统: 来源:[图文]狼群智能算法简述_百度文库 https://wenku.baidu.com/view/e4f45d6c04a1b0717fd5ddaf.html 算法的步骤: 公式:上 ...

  7. 自抗扰控制ADRC之扩张观测器

    目录 前言 1. 被控对象(被观测对象) 2.非线性观测器 2.1仿真分析 2.2仿真模型 2.3仿真结果 3.线性观测器 3.1仿真模型 3.2仿真结果 4.总结和学习问题 前言 什么叫观测器?为什 ...

  8. 遗传算法的收敛性分析

    基本遗传算法可描述为一个齐次Markov链P= {P(t),t≥0},因为基本遗传算法的选择.交叉和变异操作都是独立随机进行的,新群体仅与其父代群体及遗传操作算子有关,而与其父代群体之前的各代群体无关 ...

  9. LADRC线性自抗扰,三阶ESO状态扩张观测器,boost升压电路,双闭环控制,双LADRC控制,电压外环采用LADRC线性自抗扰控制

    LADRC线性自抗扰,三阶ESO状态扩张观测器,boost升压电路,双闭环控制,双LADRC控制,电压外环采用LADRC线性自抗扰控制(ESO扩张状态观测器采用三阶,自己搭建),电流内环同样采用LAD ...

  10. 【ADRC】扩张状态观测器(ESO)

    扩张状态观测器是自抗扰控制中非常重要的一个环节,在我学习这部分内容后,在写本篇文章时,大致可以按照三个步骤来做实验,推导,由这三个步骤来由浅入深地去理解扩张状态观测器(ESO),即:线性状态观测器,非 ...

最新文章

  1. FastThreadLocal吞吐量居然是ThreadLocal的3倍
  2. 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.4 数据量太大了怎么办
  3. Framework7 4.1.0 发布,全功能 HTML 框架
  4. Oracle Explain Plan,hint解释与示例
  5. python产生10个不同的随机数组成列表并求平均值_计算多个随机数的平均数Python...
  6. centos 6.0 rpm 包编译环境的搭建
  7. html文本框自动填充,html利用文本框input自动填写当前日期
  8. php_redis配置安装php_redis-5.1.1-7.4-nts-vc15-x64.zip
  9. 世界以痛吻我,我要报之以歌
  10. 数据包络(DEA)分析法python实现
  11. uni-app的checkbox多选和全选
  12. 詹姆斯•高斯林/关于Java的故事
  13. 苹果手机微信声音小怎么调大声_苹果手机xr对方听不到我说话,通话质量差的问题...
  14. 牛客小白月赛1分元宵
  15. 西门子step7安装注册表删除_西门子的软件如何卸载干净
  16. 设计模式学习笔记--访问者(Visitor)模式
  17. php 统计文章字符,PHP统计文章内容字符数
  18. 如何用VScode 进行调试
  19. Shor’s Algorithm 学习笔记
  20. PHP免费发短信飞信类实现

热门文章

  1. 200724 EXCEL
  2. java读取Excel文件并各方案对比
  3. 使用OpenCV和Python构建自己的车辆检测模型
  4. 思科路由器和交换机的硬件结构
  5. 前端要点总结1(2021-12)
  6. Android模拟器不支持蓝牙
  7. 什么是广域网(WAN)?
  8. 程序员的副业:我的第一本书出版啦!
  9. SageMath矩阵操作及解线性方程组
  10. CCITT对媒体的分类