【阅读时间】8min - 10mun

【内容简介】直观的解读了什么是拉格朗日乘子法,以及如何求解拉格朗日方程,并且给出几个直观的例子,针对不等式约束解读了KKT条件的必要条件和充分条件

What & Why

拉格朗日乘法(Lagrange multiplier)是一种在最优化的问题中寻找多元函数在其变量受到一个或多个条件的相等约束时的求局部极值的方法。这种方法可以将一个有 n 个变量和 k 个约束条件的最优化问题转换为一个解有 n+k 个变量的方程组的解的问题

考虑一个最优化问题

$$

\operatorname*{max}_{x,y} f(x,y) \qquad s.t.\;\; g(x,y)=c

$$

为了求 $x$ 和 $y$ ,引入一个新的变量 $\lambda$ 称为拉格朗日乘数,再引入朗格朗日函数的极值

$$

\mathcal{L}(x,y,\lambda)=f(x,y)-\lambda \cdot \bigl( g(x,y) - c\bigl) \tag 1

$$

红线表示 $g(x,y) = c$ ,蓝线是 $f(x,y)$ 的等高线,所有箭头表示梯度下降最快的方向。图中红线与等高线相切的位置就是待求的极大值

How

那么如何求这个极值点呢?

单约束

对(1)式直接求微分,并令其为零,计算出鞍点

$$

\nabla_{x,y,\lambda} \mathcal{L}(x,y,\lambda) = 0

$$

有三个未知数,所以需要3个方程。求 $\lambda$ 的偏微分有 $\nabla_{\lambda} \mathcal{L}(x,y,\lambda) = 0 \implies g(x,y)=0$,则总结得

$$

\nabla_{x,y,\lambda} \mathcal{L}(x,y,\lambda) = 0 \iff

\begin{cases}

\nabla_{x,y} f(x,y) = \lambda \nabla_{x,y} g(x,y) \\

g(x,y)=0

\end{cases}

$$

例子1

设一个具体的例子,我们需要求下列问题

$$

\operatorname*{max}_{x,y} f(x,y) = x^2y \qquad s.t.\;\; g(x,y): x^2+y^2-3=0

$$

只有一个约束,使用一个乘子,设为 $\lambda$,列出拉格朗日函数

$$

\mathcal{L}(x,y,\lambda)=f(x,y)-\lambda \cdot \bigl( g(x,y) - c\bigl) = x^2y + \lambda(x^2+y^2-3)

$$

接下来求解上式,分别对三个待求量偏微分

$$

\begin{align}

\nabla_{x,y,\lambda} \mathcal{L}(x,y,\lambda) & = \left( \frac{\partial \mathcal{L}}{\partial x},\frac{\partial \mathcal{L}}{\partial y},\frac{\partial \mathcal{L}}{\partial \lambda}\right)\\

& = (2xy + 2\lambda x, x^2 + 2\lambda y, x^2 + y^2 - 3)

\end{align}

$$

令偏微分分别等于0,得到

$$

\nabla_{x,y,\lambda} \mathcal{L}(x,y,\lambda) = 0 \iff

\begin{cases}

2xy+2\lambda x = 0 \\

x^2 + 2\lambda y = 0 \\

x^2 + y^2 - 3 = 0

\end{cases}

\iff

\begin{cases}

x(y + \lambda) = 0 & (i)\\

x^2 = -2\lambda y & (ii)\\

x^2 +y^2 = 3 & (iii)

\end{cases}

$$

根据上式,我们可以解得 $\mathcal{L}$:

$$

(\pm \sqrt{2},1,-1 ); (\pm \sqrt{2},-1,1 );(0,\pm \sqrt{3},0)

$$

根据几个不同的解带入 $f(x,y)$ 得到,2,-2,0,也就是我们需要的最大值,最小值,对应的直观图像解释如下图所示(非常直观的展现约束和等高线的含义)

例子2

关于拉格朗日乘子法的应用,有一个十分著名的:求离散概率分布 $p_1,p_2,\cdots,p_n$ 的最大信息熵

$$

f(p1,p2,\cdots,p_n) = - \sum_{j=1}^n p_j log_2{p_j} \\

s.t. \quad g(p1,p2,\cdots,p_n) = \sum_{k=1}^n p_k = 1 \text{(概率和为1)}

$$

单约束问题,引入一个乘子 $\lambda$ ,对于 $k \in [1,n]$ ,要求

$$

\frac{\partial}{\partial p_k} (f + \lambda(g - 1)) = 0

$$

将 $f$ 和 $g$ 带入有

$$

\frac{\partial}{\partial p_k} \left( -\sum_{k=1}^np_klog_2{p_k} + \lambda (\sum_{k=1}^n p_k - 1)\right) = 0

$$

计算这 n 个等式的偏微分,我们可以得到:

$$

-\left( \frac{1}{\ln(2)} + log_2p_k \right) + \lambda = 0

$$

这说明所有的 $p_i$ 都相等,所以得到 $p_k = \frac{1}{n}$

我们可以得到一个结论是:均匀分布的信息熵是最大的

多约束

既然可以解决单约束,继续思考一下多约束情况的直观表现,假设我们的约束是两条线,如下图所示

和单约束的解决方法类似,我们画出等高线图,目的就是在约束线上找到一个点可以和等高线相切,所得的值实在约束范围内的最大值或者最小值,直观表示如下图

解算方法是讲单约束的扩展到多约束的情况,较为类似,可举一反三

KKT条件

已经解决的在等式约束条件下的求函数极值的问题,那不等式约束条件下,应该如何解决呢?

这就需要引出KKT条件(Karush-Kuhn-Tucker Conditions),它是在满足一些有规则的条件下,一个非线性规划问题能有最优化解法的一个必要和充分条件

考虑以下非线性最优化问题,含有 $m$ 个不等式约束,$l$ 个等式约束

$$

\operatorname*{min}_{x}f(x) \qquad s.t. \; g_i(x) \leqslant 0,\; h_j(x) =0

$$

必要条件

假设 $f,g_i,h_j$ 三个函数为实数集映射,再者,他们都在 $x^$ 这点连续可微,如果 $x^$ 是一个局部极值,那么将会存在一组称为乘子的常数 $\lambda \geqslant 0,\mu_i \geqslant0, \nu_j$ 令

$$

\lambda + \sum_{i=1}^m \mu_i + \sum_{j=1}^l |\nu_i| \gt 0, \\

\lambda \nabla f(x^*) + \sum_{i=1}^m \mu_i \nabla g_i(x^*) + \sum_{j=1}^l \nu_i \nabla h_j(x^*) = 0, \\

\mu_i g_i(x^*) =0 \; \text{for all} \; i=1,\ldots,m

$$

这里有一些正则性条件或约束规范能保证解法不是退化的(比如$\lambda$为0),详见

充分条件

假设 $f,g_i$ 为凸函数,$h_j$ 函数是仿射函数(平移变换),假设有一个可行点 $x^*$,如果有常数 $\mu_i \geqslant 0$ 及 $\nu_j$ 满足

$$

\nabla f(x^*) + \sum_{i=1}^m \mu_i \nabla g_i(x^*) + \sum_{j=1}^l \nu_i \nabla h_j(x^*) = 0 \\

\mu_i g_i(x^*) =0 \; \text{for all} \; i=1,\ldots,m

$$

那么 $x^*$ 就是全局极小值

总结

总的来说,拉格朗日乘子法是一个工具(手段或方法),来解决在有约束情况的求函数极值的问题

如何用计算机解kkt条件,【直观详解】拉格朗日乘法和KKT条件相关推荐

  1. 条件控制与条件传送详解

    条件控制与条件传送详解 提要 CSAPP3e中文译本 3.6.5 用条件控制来实现条件分支 3.6.6 用条件传送来实现条件分支 CSAPP3e第三章前面主要是介绍了机器级代码的二进制形式和汇编形式. ...

  2. JScript中的条件注释详解(转载自网络)

    JScript中的条件注释详解-转载 这篇文章主要介绍了JScript中的条件注释详解,本文讲解了@cc_on.@if.@set.@_win32.@_win16.@_mac等条件注释语句及可用于条件编 ...

  3. 计算机三级网络技术知识点cn,计算机等级三级网络技术考试详解

    首页 > 办公休闲手游 计算机等级三级网络技术考试详解 一.基本知识 1.具有计算机软件及 应用的基本知识 2.掌握操作系统的基 本知识 3.掌握计算机网络的基本概念与基 本工作原理 4.掌握I ...

  4. 计算机组成原理课设题目详解

    计算机组成原理课设题目详解 一.实验一 1.实验名称: 验证74LS181运算和逻辑功能 2.实验目的: (1) 掌握算术逻辑单元(ALU)的工作原理: (2) 熟悉简单运算器的数据传送通路: (3) ...

  5. 计算机三级网络技术大题详解,教你快速拿到60分,附三级题库绿色免安装

    计算机三级大题,详解,通俗易懂 博主今天亲自参加了NCRE的三级网络技术,感觉题目还可以,现在迫不及待的给你们大家分享了自己在网上找的资源,感觉大题就是这些题中的几道,覆盖的特全面,再次声明这个是我在 ...

  6. 学计算机基础word题,大学计算机基础word练习题及详解答案.doc

    大学计算机基础word练习题及详解答案 操作要求 1. 对正文进行排版,其中: (1)章名使用样式"标题1",并居中: 编号格式为:第X章,其中X为自动排序.(本小题1分) (2) ...

  7. 计算机组成原理数据线引脚,计算机组成原理复习题及问题详解.doc

    <计算机组成原理复习题及问题详解.doc>由会员分享,提供在线免费全文阅读可下载,此文档格式为doc,更多相关<计算机组成原理复习题及问题详解.doc>文档请在天天文库搜索. ...

  8. Linux 条件变量详解

    LINUX条件变量详解 一.条件变量概述 1.1 函数API讲解 二.函数使用 三.结果展示与分析 一.条件变量概述   条件变量不是一个把锁,它实质上一个类似信号的东西,与锁相互配合使用,因为锁所能 ...

  9. 【Linux】shell脚本实战-if多分支条件语句详解

    文章目录 前言 多分支语句的语法 多分支语句举例: 1. 出嫁的条件 2. 管理http服务实战脚本 3. 猜数字游戏v1版本-if版本 总结 前言 前面我们已经学习过单分支语句和双分支语句的使用. ...

  10. 计算机组成原理计编知识点,计算机组成原理考研计大纲详解

    一.计算机组成原理考查目标 20xx年的统考大纲对组成原理的考查目标定位为理解单处理器计算机系统中各部件的内部工作原理.组成结构以及相互连接方式,具有完整的计算机系统的整机概念;理解计算机系统层次化结 ...

最新文章

  1. as3中TextFormat类的使用
  2. python下载的库要放到哪里-python库在哪里下载?怎么安装?
  3. One Day-XML:XSLT
  4. Spark Executor内幕
  5. JS 几种数据类型及其转换
  6. [ZJJOI2013]K大数查询 整体二分
  7. C#如何使用httpwebrequest通过代理访问网页
  8. ibatis中#和$符号的区别
  9. 1_反向代理【跨域】
  10. java 图片居中裁剪_Java图片居中裁剪代码详解
  11. python+java家庭理财个人理财管理系统记账系统
  12. Hive存储格式之RCFile详解,RCFile的过去现在和未来
  13. 【期末大作业】简单的学生网页作业源码 基于html css javascript南京大学网页校园教育网站html模板(3页)
  14. 关于log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.li)的问题
  15. 内网渗透测试:内网横向移动基础总结
  16. 网易邮箱大师如何注册邮箱 注册邮箱方法步骤介绍
  17. 3D游戏编程大师技巧+源码
  18. 李理:详解卷积神经网络
  19. 三本计算机的专业需要考研嘛,三本计算机考研难吗
  20. JS怎么处理有些网页禁止选中复制方法过程详解

热门文章

  1. Win8系统下VS2012添加MSComm控件
  2. linux网卡启停,Linux程序启停脚本
  3. 计算机学院的方阵口号,方阵口号
  4. 基于java的企业门户网站
  5. wikioi-天梯-提高一等-并查集-1074:食物链
  6. viper4android 3D,中国设计之窗--The Viper 3D播放器界面设计图文综合
  7. 惠普g6服务器支持多大内存,惠普ProLiant DL380 G6服务器常见问题
  8. Windows无法调节亮度
  9. 最新开源的图像识别算法来了!
  10. 直播提醒 |如何用GAN让你的女朋友美得万里挑一!