介绍拉格朗日乘子和KTT条件,转载自  

http://www.cnblogs.com/ooon/p/5721119.html


引言

本篇文章将详解带有约束条件的最优化问题,约束条件分为等式约束与不等式约束,对于等式约束的优化问题,可以直接应用拉格朗日乘子法去求取最优值;对于含有不等式约束的优化问题,可以转化为在满足 KKT 约束条件下应用拉格朗日乘子法求解。拉格朗日求得的并不一定是最优解,只有在凸优化的情况下,才能保证得到的是最优解,所以本文称拉格朗日乘子法得到的为可行解,其实就是局部极小值,接下来从无约束优化开始一一讲解。

无约束优化

首先考虑一个不带任何约束的优化问题,对于变量 x∈RN的函数 f(x) ,无约束优化问题如下

min

xf(x)minxf(x)

该问题很好解,根据 Fermat 定理,直接找到使目标函数得 0 的点即可 即 ∇xf(x)=0∇xf(x)=0 ,如果没有解析解的话,可以使用梯度下降或牛顿方法等迭代的手段来使 xx 沿负梯度方向逐步逼近极小值点。

等式约束优化

当目标函数加上约束条件之后,问题就变成如下形式:

minx f(x)s.t.   hi(x)=0,i=1,2,...,m

约束条件会将解的范围限定在一个可行域,此时不一定能找到使得 ∇xf(x)∇xf(x) 为 0 的点,只需找到在可行域内使得 f(x)f(x) 最小的值即可,常用的方法即为拉格朗日乘子法,该方法首先引入 Lagrange Multiplierα∈Rmα∈Rm ,构建 Lagrangian 如下:

L(x,α)=f(x)+∑i=1mαihi(x)L(x,α)=f(x)+∑i=1mαihi(x)

求解方法如下:首先对 Lagrangian  关于 αα 与 xx 求 :

{∇xL(x,α)=0∇αL(x,α)=0{∇xL(x,α)=0∇αL(x,α)=0

令导数为 0 ,求得 xx 、αα  的值后,将 xx 带入 f(x)f(x) 即为在约束条件 hi(x)hi(x) 下的可行解。这样做的意义是什么呢? 接下来看一个直观的示例,对于二维情况下的目标函数是 f(x,y)f(x,y),在平面中画出f(x,y)f(x,y) 的等高线,如下图的虚线所示, 并只给出一个约束等式 h(x,y)=0h(x,y)=0 ,如下图的绿线所示,目标函数 f(x,y)f(x,y) 与约束 g(x,y)g(x,y) 只有三种情况,相交、相切或者没有交集,没交集肯定不是解,只有相交或者相切可能是解,但相交得到的一定不是最优值,因为相交意味着肯定还存在其它的等高线在该条等高线的内部或者外部,使得新的等高线与目标函数的交点的值更大或者更小,这就意味着只有等高线与目标函数的曲线相切的时候,才可能得到可行解.

因此给出结论:拉格朗日乘子法取得极值的必要条件是目标函数与约束函数相切,这时两者的法向量是平行的,即

∇xf(x)–α∇xh(x)=0∇xf(x)–α∇xh(x)=0

所以只要满足上述等式,且满足之前的约束 hi(x)=0,i=1,2,…,mhi(x)=0,i=1,2,…,m ,即可得到解,联立起来,正好得到就是拉格朗日乘子法。这里只是直观展示了一下拉格朗日乘子法的几何推导 ,并没有给出详细的证明。

不等式约束优化

当约束加上不等式之后,情况变得更加复杂,首先来看一个简单的情况,给定如下不等式约束问题:

minx f(x) s.t.  g(x)≤0

对应的 Lagrangian 与图形分别如下所示:

L(x,λ)=f(x)+λg(x)L(x,λ)=f(x)+λg(x)

这时的可行解必须落在约束区域 g(x)g(x) 之内,下图给出了目标函数的等高线与约束:

由图可见可行解 xx 只能在 g(x)<0g(x)<0 或者 g(x)=0g(x)=0  的区域里取得:

  • 当可行解 xx 落在 g(x)<0g(x)<0 的区域内,此时直接极小化 f(x)f(x) 即可;
  • 当可行解 xx 落在 g(x)=0g(x)=0 即边界上,此时等价于等式约束优化问题.

当约束区域包含目标函数原有的的可行解时,此时加上约束可行解扔落在约束区域内部,对应 g(x)<0g(x)<0 的情况,这时约束条件不起作用;当约束区域不包含目标函数原有的可行解时,此时加上约束后可行解落在边界 g(x)=0g(x)=0 上。下图分别描述了两种情况,右图表示加上约束可行解会落在约束区域的边界上。

以上两种情况就是说,要么可行解落在约束边界上即得 g(x)=0g(x)=0 ,要么可行解落在约束区域内部,此时约束不起作用,另 λ=0λ=0 消去约束即可,所以无论哪种情况都会得到:

λg(x)=0λg(x)=0

还有一个问题是 λλ 的取值,在等式约束优化中,约束函数与目标函数的梯度只要满足平行即可,而在不等式约束中则不然,若 λ≠0λ≠0,这便说明 可行解 xx 是落在约束区域的边界上的,这时可行解应尽量靠近无约束时的解,所以在约束边界上,目标函数的负梯度方向应该远离约束区域朝向无约束时的解,此时正好可得约束函数的梯度方向与目标函数的负梯度方向应相同:

−∇xf(x)=λ∇xg(x)−∇xf(x)=λ∇xg(x)

上式需要满足的要求是拉格朗日乘子 λ>0λ>0 ,这个问题可以举一个形象的例子,假设你去爬山,目标是山顶,但有一个障碍挡住了通向山顶的路,所以只能沿着障碍爬到尽可能靠近山顶的位置,然后望着山顶叹叹气,这里山顶便是目标函数的可行解,障碍便是约束函数的边界,此时的梯度方向一定是指向山顶的,与障碍的梯度同向,下图描述了这种情况 :

可见对于不等式约束,只要满足一定的条件,依然可以使用拉格朗日乘子法解决,这里的条件便是 KKT 条件。接下来给出形式化的 KKT 条件 首先给出形式化的不等式约束优化问题:

minx f(x)s.t.   hi(x)=0, i=1,2,...,m           gj(x)≤0, j=1,2,...,n

列出 Lagrangian 得到无约束优化问题:

L(x,α,β)=f(x)+∑i=1mαihi(x)+∑j=1nβigi(x)L(x,α,β)=f(x)+∑i=1mαihi(x)+∑j=1nβigi(x)

经过之前的分析,便得知加上不等式约束后可行解 xx 需要满足的就是以下的 KKT 条件:

=0(1)∇xL(x,α,β)=0(2)βjgj(x)=0, j=1,2,...,n(3)hi(x)=0, i=1,2,...,m(4)gj(x)≤0, j=1,2,...,n(5)βj≥0, j=1,2,...,n

满足 KKT 条件后极小化 Lagrangian 即可得到在不等式约束条件下的可行解。KKT 条件看起来很多,其实很好理解:

(1) :拉格朗日取得可行解的必要条件;

(2) :这就是以上分析的一个比较有意思的约束,称作松弛互补条件;

(3) ∼∼ (4) :初始的约束条件;

(5) :不等式约束的 Lagrange Multiplier 需满足的条件。

主要的KKT条件便是 (3) 和 (5) ,只要满足这俩个条件便可直接用拉格朗日乘子法, SVM 中的支持向量便是来自于此,需要注意的是 KKT 条件与对偶问题也有很大的联系,下一篇文章就是拉格朗日对偶。

参考文献:

1. 书:PRML | 《机器学习方法》-李航 |《机器学习》-周志华

2. http://blog.csdn.net/xianlingmao/article/details/7919597

3. http://blog.csdn.net/timingspace/article/details/50966105

4. http://blog.csdn.net/loadstar_kun/article/details/25369017

5. http://blog.csdn.net/johnnyconstantine/article/details/46335763

6. http://www.csc.kth.se/utbildning/kth/kurser/DD3364/Lectures/KKT.pdf nice PPT

http://www.csc.kth.se/utbildning/kth/kurser/DD3364/Lectures/Duality.pdf

7. http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982684.html

拉格朗日乘子和KTT条件相关推荐

  1. SVM笔记(二)拉格朗日对偶、KTT条件、软间隔SVM

    上一篇:SVM笔记(一) 上一篇写到讲硬间隔的SVM转化为凸二次规划问题,也就是QP问题,之后可以是用现成的软件求解QP问题.但是如果样本数量大和维度比较高,会导致问题求解困难或不可解,因此引入了拉格 ...

  2. 机器学习算法——支持向量机SVM4(SMO算法及KTT条件)

    上节中我们得出了原问题的对偶问题为:  公式(4.1) 那如何求解公式4.1呢?即解出,求出w和b即可得到原型:(公式4.2) 显然,公式4.1是二次规划(QP)问题,可使用二次规划算法进行求解.然而 ...

  3. 拉格朗日乘数和KTT条件

    拉格朗日乘数和KTT条件 通常来说最优化问题是指:对于给定的某一函数,求其在指定作用域上的全局最优解.在求解数学的最优化问题中,Lagrange Multiplier (拉格朗日乘子法)和 Karus ...

  4. Lagrange乘子法与KTT条件

    Lagrange乘子法与KTT条件 Date: 2021.11.20. 参考文献: https://blog.csdn.net/lijil168/article/details/69395023 文章 ...

  5. 拉格朗日乘数法 和 KTT条件

    预备知识 令 \(X\) 表示一个变量组(向量) \((x_1, x_2, \cdots, x_n)\) 考虑一个处处可导的函数 \(f(X)\), 为了方便描述, 这里以二元函数为例 对于微分, 考 ...

  6. SVM中对偶、凸优化与KTT条件问题

    对偶问题:http://blog.csdn.net/wuwuwuwuwuwuwuwu/article/details/8252056 最优化与KTT条件:http://blog.csdn.net/wu ...

  7. 拉格朗日乘子法和KTT条件

        这篇博文中直观上讲解了拉格朗日乘子法和 KKT 条件,对偶问题等内容.     首先从无约束的优化问题讲起,一般就是要使一个表达式取到最小值: minf(x)minf(x)     如果问题是 ...

  8. 如何用计算机解kkt条件,【直观详解】拉格朗日乘法和KKT条件

    [阅读时间]8min - 10mun [内容简介]直观的解读了什么是拉格朗日乘子法,以及如何求解拉格朗日方程,并且给出几个直观的例子,针对不等式约束解读了KKT条件的必要条件和充分条件 What &a ...

  9. 非线性优化中的KTT条件(知乎文章的理解)

    知乎原文 对于优化问题: max(f(x))或者min(f(x))hj(x)=0,j=1,2,3...gi(x)<=0,i=1,2,3...max(f(x)) 或者 min(f(x))\\ h_ ...

最新文章

  1. React 开始制作 6
  2. 问题 “No mapping found for HTTP request with URI [/fileupload/upload.do]” 的解决
  3. C#反射技术之一动态读取和设置对象的属性值
  4. OpenGL Compute Shader Particle System计算着色器粒子系统的实例
  5. C++实现剔除不能识别的非ASCIII、非中文字符
  6. 夜神模拟器模拟安卓测试_使用模拟进行测试
  7. c++,c.c#区别
  8. 中国移动研究院人力群面
  9. ApacheCN C/C++ 译文集(二) 20211204 更新
  10. qt 获取用户缩放_Qt-如何创建随窗口缩放并保持纵横比的图像?
  11. Sql Server远程连接
  12. 写给《我也能做CTO》作者的一封信
  13. Bitset的一些总结
  14. Linux下查看和停止所有java进程
  15. 【语音去噪】基于matlab低通+自适应滤波去噪【含Matlab源码 352期】
  16. 【光纤通信】实验二、C语言实现HDB3编码
  17. 24考研数学复习方法、全年规划
  18. 深入理解Android相机体系结构之十
  19. eclipse的plugins导入hadoop-eclipse-plugin-2.6.0.jar后Preference下没有hadoop Map/Reduce的解决方法
  20. Lora中信息码片,编码率解释

热门文章

  1. Artifact ssmbuildFinal:war exploded: Artifact is being deployed SSM整合
  2. DataNucleus JDO基础入门
  3. 读书的意义—献给第19个世界读书日
  4. 安装计算机的显卡出现问题,电脑显卡驱动安装失败如何解决
  5. 关于Android studio Translation插件提示“更新 TKK 失败,请检查网络连接”问题
  6. Google Earth Engine(GEE)计算热度(LST)
  7. Oracle EBS APP-FND-02901: you don‘t have privilege to any operating unit
  8. 怎么删除微信的手机充值服务器,微信如何一键清空账单?全部删除的方法
  9. Java 标准输入输出流(System.in,System.out)使用
  10. sc2017新高二高一模拟赛7 总结