好久不见的拉格朗日乘数法
1 引例
我想大多数人对于朗格朗日乘数法的学习已经是好多年前的事情,其中的细节也自然是慢慢模糊了起来,但是对于它的作用我想几乎是不会忘记的,那就是用来求解条件极值。既然大多数人的记忆都停留在这个地方,那么我们就从这个开始重新拾起拉格朗日乘数法。下面就以一个例题来重温一下求解过程:
求解目标函数z=xyz=xyz=xy在约束条件下x+y=1x+y=1x+y=1的条件极值。
解:作拉格朗日函数
F(x,y,λ)=xy+λ(x+y−1)(1)F(x,y,\lambda)=xy+\lambda(x+y-1)\tag 1 F(x,y,λ)=xy+λ(x+y−1)(1)
由式子(1)(1)(1)可得FFF的驻点:
Fx=y+λ=0Fy=x+λ=0Fλ=x+y−1=0(2)\begin{aligned} F_x&=y+\lambda=0\\ F_y&=x+\lambda=0\\ F_{\lambda}&=x+y-1=0 \end{aligned}\tag 2 FxFyFλ=y+λ=0=x+λ=0=x+y−1=0(2)
解方程组(2)(2)(2)便可以求得x,y,λx,y,\lambdax,y,λ:
⟹x=12;y=12;λ=−12\implies x=\frac{1}{2};y=\frac{1}{2};\lambda=-\frac{1}{2} ⟹x=21;y=21;λ=−21
由此我们便可以知道,目标函数z=xyz=xyz=xy在约束条件下x+y=1x+y=1x+y=1的条件极值为z=12∗12=14z=\frac{1}{2}\ast\frac{1}{2}=\frac{1}{4}z=21∗21=41。那为什么可以通过这样的方法来求得条件极值呢?
2 什么是拉格朗日乘数法
在数学优化问题中,拉格朗日乘数法(Lagrange multipliers )是一种用于求解等式约束条件下局部最小(最大)值的策略。它的基本思想是通过将含约束条件的优化问题转化为无约束条件下的优化问题,以便于得到各个未知变量的梯度,进而求得极值点[1]。因此,一句话就是拉格朗日乘数法是一种用来求解条件极值的工具。那么什么又是条件极值呢?
2.1 条件极值
所谓条件极值是指,在一定约束条件下(通常为方程)目标函数的极值就称为条件极值。
如图所示,函数z=f(x,y)z=f(x,y)z=f(x,y)在其定义域上的极大值(也是最大值)为z=f(x1,y1)z=f(x_1,y_1)z=f(x1,y1);但如果此时对其施加一个约束条件φ(x,y)=0\varphi(x,y)=0φ(x,y)=0,那这就等价的告诉函数z=f(x,y)z=f(x,y)z=f(x,y)极值点同时还要满足约束条件。因此,z=f(x,y)z=f(x,y)z=f(x,y)在约束条件φ(x,y)=0\varphi(x,y)=0φ(x,y)=0下的极值点只能在(x0,y0)(x_0,y_0)(x0,y0)处获得(因为此时的φ(x0,y0)=0\varphi(x_0,y_0)=0φ(x0,y0)=0,而φ(x1,y1)≠0\varphi(x_1,y_1)\neq0φ(x1,y1)=0即不满足约束条件)。现在我们已经对条件极值有了一个直观上的理解,那么接下来要探究的就是怎么才能找到这个极值。
2.2 如何求解条件极值
我们知道在一元函数f(x)f(x)f(x)中可以利用极值的必要条件来求解f(x)f(x)f(x)的极值。一元函数极值的必要条件为:若f(x)f(x)f(x)在x=x0x=x_0x=x0处取得极值,且f′(x0)f^{\prime}(x_0)f′(x0)存在,那么立即有f′(x0)=0f^{\prime}(x_0)=0f′(x0)=0。也就是说,我们可以通过令f′(x)=0f^{\prime}(x)=0f′(x)=0来求得极值点x0x_0x0。那如果函数z=f(x,y)z=f(x,y)z=f(x,y)在约束条件φ(x,y)=0\varphi(x,y)=0φ(x,y)=0下取得了条件极值f(x0,y0)f(x_0,y_0)f(x0,y0),那么我们该怎么求解其极值点呢?换句话说条件极值的必要条件是什么呢?
设z0=f(x0,y0)z_0=f(x_0,y_0)z0=f(x0,y0)是z=f(x,y)z=f(x,y)z=f(x,y)在条件φ(x,y)=0\varphi(x,y)=0φ(x,y)=0下的条件极值,同时等式φ(x,y)=0\varphi(x,y)=0φ(x,y)=0确定了一个一元隐函数y=y(x)y=y(x)y=y(x);则此时有一元函数z=f(x,y(x))z=f(x,y(x))z=f(x,y(x))将在x=x0x=x_0x=x0处取得极值。
根据一元函数极值的必要条件有:
dzdx=fx⋅1+fy⋅dydx=0⟹fx(x0,y0)+fy(x0,y0)⋅y′(x0)=0⟹y′(x0)=−fx(x0,y0)fy(x0,y0)(3)\begin{aligned} \frac{dz}{dx}&=f_x\cdot1+f_y\cdot\frac{dy}{dx}=0 \\[1ex] \implies&f_x(x_0,y_0)+f_y(x_0,y_0)\cdot y'(x_0)=0 \\[1ex] \implies &y'(x_0)=-\frac{f_x(x_0,y_0)}{f_y(x_0,y_0)} \end{aligned}\tag 3 dxdz⟹⟹=fx⋅1+fy⋅dxdy=0fx(x0,y0)+fy(x0,y0)⋅y′(x0)=0y′(x0)=−fy(x0,y0)fx(x0,y0)(3)
同时,根据隐函数的求导公式可知:
y′(x0)=−φx(x0,y0)φy(x0,y0)(4)y'(x_0)=-\frac{\varphi_x(x_0,y_0)}{\varphi_y(x_0,y_0)}\tag 4 y′(x0)=−φy(x0,y0)φx(x0,y0)(4)
由式子(3)(4)(3)(4)(3)(4)可得:
fx(x0,y0)fy(x0,y0)=φx(x0,y0)φy(x0,y0)(5)\frac{f_x(x_0,y_0)}{f_y(x_0,y_0)}=\frac{\varphi_x(x_0,y_0)}{\varphi_y(x_0,y_0)}\tag 5 fy(x0,y0)fx(x0,y0)=φy(x0,y0)φx(x0,y0)(5)
由(5)(5)(5)可得:
fx(x0,y0)φx(x0,y0)=fy(x0,y0)φy(x0,y0)(6)\frac{f_x(x_0,y_0)}{\varphi_x(x_0,y_0)}=\frac{f_y(x_0,y_0)}{\varphi_y(x_0,y_0)}\tag 6 φx(x0,y0)fx(x0,y0)=φy(x0,y0)fy(x0,y0)(6)
那么,此时我们便可以理解成{fx(x0,y0),fy(x0,y0)}//{φx(x0,y0),φy(x0,y0)}\{f_x(x_0,y_0),f_y(x_0,y_0)\}//\{\varphi_x( x_0,y_0),\varphi_y( x_0,y_0)\}{fx(x0,y0),fy(x0,y0)}//{φx(x0,y0),φy(x0,y0)},即目标函数和约束条件在取得条件极值处的梯度平行。由此可知,取得条件极值的必要条件为:Δf(x0,y0)//Δφ(x0,y0)\Delta f(x_0,y_0)//\Delta \varphi(x_0,y_0)Δf(x0,y0)//Δφ(x0,y0)。
由Δf(x0,y0)//Δφ(x0,y0)\Delta f(x_0,y_0)//\Delta \varphi(x_0,y_0)Δf(x0,y0)//Δφ(x0,y0)可知:
∃λ0,使得Δf(x0,y0)=−λ0⋅Δφ(x0,y0)⟹Δf(x0,y0)+λ0⋅Δφ(x0,y0)=0⃗⟹Δ{f(x0,y0)+λ0⋅φ(x0,y0)}=0⃗⟹Δ(f+λ0φ)=0⃗(7)\begin{aligned} \exists \lambda_0,\text{使得}&\Delta f(x_0,y_0)=-\lambda_0\cdot\Delta \varphi(x_0,y_0) \\ \\ \implies&\Delta f(x_0,y_0)+\lambda_0\cdot\Delta \varphi(x_0,y_0) =\vec{0}\\ \\ \implies&\Delta \{f(x_0,y_0)+\lambda_0\cdot\varphi(x_0,y_0)\} =\vec{0}\\ \\ \implies&\Delta(f+\lambda_0\varphi)=\vec{0} \end{aligned}\tag 7 ∃λ0,使得⟹⟹⟹Δf(x0,y0)=−λ0⋅Δφ(x0,y0)Δf(x0,y0)+λ0⋅Δφ(x0,y0)=0Δ{f(x0,y0)+λ0⋅φ(x0,y0)}=0Δ(f+λ0φ)=0(7)
进一步,如果我们令F(x,y,λ)=f(x,y)+λφ(x,y)F(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y)F(x,y,λ)=f(x,y)+λφ(x,y),那么由(7)(7)(7)可得ΔF(x0,y0,λ0)=0⃗\Delta F(x_0,y_0,\lambda_0)=\vec{0}ΔF(x0,y0,λ0)=0,即(x0,y0,λ0)(x_0,y_0,\lambda_0)(x0,y0,λ0)是函数F(x,y,λ)F(x,y,\lambda)F(x,y,λ)的驻点。因此,求f(x,y)f(x,y)f(x,y)的条件极值就可以转换为求F(x,y,λ)F(x,y,\lambda)F(x,y,λ)驻点的问题。
同时,我们称F(x,y,λ)=f(x,y)+λφ(x,y)F(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y)F(x,y,λ)=f(x,y)+λφ(x,y)为条件极值的拉格朗日函数,λ\lambdaλ称为拉格朗日乘数。因此,函数f(x,y)f(x,y)f(x,y)在点(x0,y0)(x_0,y_0)(x0,y0)处取得条件φ(x,y)=0\varphi(x,y)=0φ(x,y)=0条件下极值的必要条件为:∃λ0\exists\; \lambda_0∃λ0使得(x0,y0,λ0)(x_0,y_0,\lambda_0)(x0,y0,λ0)为拉格朗日函数的F(x,y,λ)F(x,y,\lambda)F(x,y,λ)的驻点。
2.3 拉格朗日乘数法的求解步骤
求多元函数Z=f(x,y,z,...)Z=f(x,y,z,...)Z=f(x,y,z,...)在条件φ(x,y,...)=0,ϕ(x,y,...)=0,...\varphi(x,y,...)=0,\phi(x,y,...)=0,...φ(x,y,...)=0,ϕ(x,y,...)=0,...下的极值:
第一步:作拉格朗日函数
F(x,y,z,...,λ,μ,...)=f(x,y,z,...)+λφ(x,y,...)+μϕ(x,y,...)+...F(x,y,z,...,\lambda,\mu,...)=f(x,y,z,...)+\lambda\varphi(x,y,...)+\mu\phi(x,y,...)+... F(x,y,z,...,λ,μ,...)=f(x,y,z,...)+λφ(x,y,...)+μϕ(x,y,...)+...
第二步:求F(x,y,z,...,λ,μ,...)F(x,y,z,...,\lambda,\mu,...)F(x,y,z,...,λ,μ,...)的驻点(x0,y0,z0,...,λ0,μ0,...)(x_0,y_0,z_0,...,\lambda_0,\mu_0,...)(x0,y0,z0,...,λ0,μ0,...),即解如下方程组:
{Fx=0Fy=0⋯Fλ=0⋯\begin{aligned} \begin{cases} F_x=0\\ F_y=0\\ \cdots\\ F_\lambda=0\\ \cdots \end{cases} \end{aligned} ⎩⎪⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎪⎧Fx=0Fy=0⋯Fλ=0⋯
第三步:(x0,y0,z0,...,λ0,μ0,...)(x_0,y_0,z_0,...,\lambda_0,\mu_0,...)(x0,y0,z0,...,λ0,μ0,...)便是可能的条件极值点
3 总结
在本篇文章中,笔者首先介绍通过一个引例介绍了如何通过拉格朗日乘数法来求解条件极值;然后通过一元函数极值的必要条件推导出了拉格朗日乘数法的原理;最后再推广得到了如何用拉格朗日乘数法来求解多元函数的条件极值。本次内容就到此结束,感谢阅读!
若有任何疑问与见解,请发邮件至moon-hotel@hotmail.com并附上文章链接,青山不改,绿水长流,月来客栈见!
引用
[1]https://en.wikipedia.org/wiki/Lagrange_multiplier
[2]《高等数学学习手册》徐小湛
好久不见的拉格朗日乘数法相关推荐
- 拉格朗日乘数法的原理,我用10幅图把它讲清楚了
机器学习是一个目标函数优化问题,给定目标函数f,约束条件会有一般包括以下三类: 仅含等式约束 仅含不等式约束 等式和不等式约束混合型 当然还有一类没有任何约束条件的最优化问题 关于最优化问题,大都令人 ...
- CodeForces - 813C The Tag Game(拉格朗日乘数法,限制条件求最值)
[传送门]http://codeforces.com/problemset/problem/813/C [题意]给定整数a,b,c,s,求使得 xa yb zc值最大的实数 x,y,z , 其中x ...
- CodeChef TWOROADS(计算几何+拉格朗日乘数法)
题面 传送门 简要题意:给出\(n\)个点,请求出两条直线,并最小化每个点到离它最近的那条直线的距离的平方和,\(n\leq 100\) orz Shinbokuow 前置芝士 给出\(n\)个点,请 ...
- 拉格朗日乘数法学习笔记
对于一个多元函数\(f(x_1,x_2,x_3,..,x_n)\),如果它必须满足某一些限制\(g_i(x_1,x_2,x_3,...,x_n)=0\),我们可以使用拉格朗日乘数法来求它的最值 首先你 ...
- 拉格朗日乘数法(一种寻找变量受一个或多个条件所限制的多元函数的极值的方法)
拉格朗日乘数法 在数学最优问题中,拉格朗日乘数法(以数学家约瑟夫·路易斯·拉格朗日命名)是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法.这种方法将一个有n 个变量与k 个约束条件的最优化问 ...
- BZOJ2876 [Noi2012]骑行川藏 【拉格朗日乘数法】
题目链接 BZOJ 题解 拉格朗日乘数法 拉格朗日乘数法用以求多元函数在约束下的极值 我们设多元函数\(f(x_1,x_2,x_3,\dots,x_n)\) 以及限制\(g(x_1,x_2,x_3,\ ...
- 【NOI2012】骑行川藏【拉格朗日乘数法】【二分套二分】
传送门 拉格朗日乘数法裸题 限制 f({v})=∑i=1nkisi(vi−vi′)=EUf(\{v\})=\sum_{i=1}^nk_is_i(v_i-v_i')=E_Uf({v})=i=1∑nki ...
- 从拉格朗日乘数法到KKT条件
从拉格朗日乘数法到KKT条件 最近看论文遇到了Karush–Kuhn–Tucker (KKT)条件,想搞清楚这是个什么东东,因此就把这个东西认真学习一下并且分享出来,希望对大家有用.学习KKT就不得不 ...
- 不等式约束的拉格朗日乘数法_Abaqus血管支架仿真|接触约束执行方式
根据支架的建模基础.几何和网格划分.单元选择.材料和截面属性.分析步设置.载荷接触和约束.收敛调整,以及后处理.参数优化等内容.接着Abaqus血管支架仿真|建模基础.Abaqus血管支架仿真|几何和 ...
最新文章
- Redis实战之限制操作频率
- intellij_使用IntelliJ ..已经2周了,到目前为止还算不错
- android8 静音震动,iPhone8开启静音后手机振动怎么办?苹果8关闭静音模式震动的两种方法...
- python列表get方法_python的get set方法示例
- 软件使用 excel
- JS实现全选、反选、不选
- 如图所示是一种轧钢计算机控制系统,高速线材厂轧钢工艺培训(活套)
- 男子趁前女友熟睡翻开眼皮,刷脸转走15万!支付宝:几率很小
- nginx upstream 代理 负载
- 最全SolidWorks安装教程(附下载地址)-亲测可用
- jquery 批量生成二维码并打印
- jsp管理系统页面模板_管理后台原型设计分享- 政务管理系统
- OpenCV实战 | 低对比度缺陷检测应用实例--LCD屏幕脏污检测
- echarts 世界地图标点_echarts中国地图3D各个城市标点demo
- nginx配置域名指向ip
- Qt应用程序图标设置任务栏图标设置
- ①编写一个程序,从键盘接收一个字符串,然后按照字符顺序从小到大进行排序,并删除重复的字符。②集合A、B的差集③对分行输入的若干字符串按字典序(由小到大)进行排序并输出。
- 不是java的原始数据类型6_以下哪个不是 Java 的原始数据类型_________。_中药鉴别技术答案_学小易找答案...
- 【ZYNQ】黑金教程_OV5640加LCD显示实验的Bug分享
- 计算机怎么删除共享地址,取消共享文件夹_怎么清理所有共享文件夹
热门文章
- 表空间自动增长,导致磁盘空间不足,给数据库表空间瘦身
- 数智随行 | 探想未来工厂数字化,强化智能设备管理
- 【数据库-3】dbSNP数据库
- insmod: error inserting 'myvivi.ko': -1 Unknown symbol in module 问题解决办法
- Java:24节气计算
- 关于CPU漏洞的思考——别太把自己当回事
- 详述ViewState用法
- OpenGL 学习系列--基础的绘制流程
- 圣诞节祝福小Demo:JingleBells背景音乐+礼物闪烁下落+跑马灯效果
- 微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务