来源:https://www.cnblogs.com/ooon/p/5721119.html

引言

本篇文章将详解带有约束条件的最优化问题,约束条件分为等式约束与不等式约束,对于等式约束的优化问题,可以直接应用拉格朗日乘子法去求取最优值;对于含有不等式约束的优化问题,可以转化为在满足 KKT 约束条件下应用拉格朗日乘子法求解。拉格朗日求得的并不一定是最优解,只有在凸优化的情况下,才能保证得到的是最优解,所以本文称拉格朗日乘子法得到的为可行解,其实就是局部极小值,接下来从无约束优化开始一一讲解。

无约束优化

首先考虑一个不带任何约束的优化问题,对于变量 x∈RN

的函数 f(x)

,无约束优化问题如下:

minxf(x)

该问题很好解,根据 Fermat 定理,直接找到使目标函数得 0 的点即可 即 ∇xf(x)=0

,如果没有解析解的话,可以使用梯度下降或牛顿方法等迭代的手段来使 x

沿负梯度方向逐步逼近极小值点。

等式约束优化

当目标函数加上约束条件之后,问题就变成如下形式:

minx f(x)s.t.   hi(x)=0,i=1,2,...,m

约束条件会将解的范围限定在一个可行域,此时不一定能找到使得 ∇xf(x)

为 0 的点,只需找到在可行域内使得 f(x) 最小的值即可,常用的方法即为拉格朗日乘子法,该方法首先引入 Lagrange Multiplier α∈Rm

,构建 Lagrangian 如下:

L(x,α)=f(x)+∑i=1mαihi(x)

求解方法如下:首先对 Lagrangian  关于 α

与 x

求 :

{∇xL(x,α)=0∇αL(x,α)=0

令导数为 0 ,求得 x

、α  的值后,将 x 带入 f(x) 即为在约束条件 hi(x) 下的可行解。这样做的意义是什么呢? 接下来看一个直观的示例,对于二维情况下的目标函数是 f(x,y),在平面中画出 f(x,y) 的等高线,如下图的虚线所示, 并只给出一个约束等式 h(x,y)=0 ,如下图的绿线所示,目标函数 f(x,y) 与约束 g(x,y)

只有三种情况,相交、相切或者没有交集,没交集肯定不是解,只有相交或者相切可能是解,但相交得到的一定不是最优值,因为相交意味着肯定还存在其它的等高线在该条等高线的内部或者外部,使得新的等高线与目标函数的交点的值更大或者更小,这就意味着只有等高线与目标函数的曲线相切的时候,才可能得到可行解.

因此给出结论:拉格朗日乘子法取得极值的必要条件是目标函数与约束函数相切,这时两者的法向量是平行的,即

∇xf(x)–α∇xh(x)=0

所以只要满足上述等式,且满足之前的约束 hi(x)=0,i=1,2,…,m

,即可得到解,联立起来,正好得到就是拉格朗日乘子法。这里只是直观展示了一下拉格朗日乘子法的几何推导 ,并没有给出详细的证明。

不等式约束优化

当约束加上不等式之后,情况变得更加复杂,首先来看一个简单的情况,给定如下不等式约束问题:

minx f(x) s.t.  g(x)≤0

对应的 Lagrangian 与图形分别如下所示:

L(x,λ)=f(x)+λg(x)

这时的可行解必须落在约束区域 g(x)

之内,下图给出了目标函数的等高线与约束:

由图可见可行解 x

只能在 g(x)<0 或者 g(x)=0

的区域里取得:

  • 当可行解 x

落在 g(x)<0 的区域内,此时直接极小化 f(x)

  • 即可;
  • 当可行解 x

落在 g(x)=0

  • 即边界上,此时等价于等式约束优化问题.

当约束区域包含目标函数原有的的可行解时,此时加上约束可行解扔落在约束区域内部,对应 g(x)<0

的情况,这时约束条件不起作用;当约束区域不包含目标函数原有的可行解时,此时加上约束后可行解落在边界 g(x)=0

上。下图分别描述了两种情况,右图表示加上约束可行解会落在约束区域的边界上。

以上两种情况就是说,要么可行解落在约束边界上即得 g(x)=0

,要么可行解落在约束区域内部,此时约束不起作用,另 λ=0

消去约束即可,所以无论哪种情况都会得到:

λg(x)=0

还有一个问题是 λ

的取值,在等式约束优化中,约束函数与目标函数的梯度只要满足平行即可,而在不等式约束中则不然,若 λ≠0,这便说明 可行解 x

是落在约束区域的边界上的,这时可行解应尽量靠近无约束时的解,所以在约束边界上,目标函数的负梯度方向应该远离约束区域朝向无约束时的解,此时正好可得约束函数的梯度方向与目标函数的负梯度方向应相同:

−∇xf(x)=λ∇xg(x)

上式需要满足的要求是拉格朗日乘子 λ>0

,这个问题可以举一个形象的例子,假设你去爬山,目标是山顶,但有一个障碍挡住了通向山顶的路,所以只能沿着障碍爬到尽可能靠近山顶的位置,然后望着山顶叹叹气,这里山顶便是目标函数的可行解,障碍便是约束函数的边界,此时的梯度方向一定是指向山顶的,与障碍的梯度同向,下图描述了这种情况 :

可见对于不等式约束,只要满足一定的条件,依然可以使用拉格朗日乘子法解决,这里的条件便是 KKT 条件。接下来给出形式化的 KKT 条件 首先给出形式化的不等式约束优化问题:

minx f(x)s.t.   hi(x)=0, i=1,2,...,m           gj(x)≤0, j=1,2,...,n

列出 Lagrangian 得到无约束优化问题:

L(x,α,β)=f(x)+∑i=1mαihi(x)+∑j=1nβigi(x)

经过之前的分析,便得知加上不等式约束后可行解 x

需要满足的就是以下的 KKT 条件:

∇xL(x,α,β)βjgj(x)hi(x)gj(x)βj=0=0, j=1,2,...,n=0, i=1,2,...,m≤0, j=1,2,...,n≥0, j=1,2,...,n(1)(2)(3)(4)(5)

满足 KKT 条件后极小化 Lagrangian 即可得到在不等式约束条件下的可行解。 KKT 条件看起来很多,其实很好理解:

(1) :拉格朗日取得可行解的必要条件;

(2) :这就是以上分析的一个比较有意思的约束,称作松弛互补条件;

(3) ∼

(4) :初始的约束条件;

(5) :不等式约束的 Lagrange Multiplier 需满足的条件。

主要的KKT条件便是 (3) 和 (5) ,只要满足这俩个条件便可直接用拉格朗日乘子法, SVM 中的支持向量便是来自于此,需要注意的是 KKT 条件与对偶问题也有很大的联系,下一篇文章就是拉格朗日对偶。

参考文献:

1. 书:PRML | 《机器学习方法》-李航 |《机器学习》-周志华

2. http://blog.csdn.net/xianlingmao/article/details/7919597

3. http://blog.csdn.net/timingspace/article/details/50966105

4. http://blog.csdn.net/loadstar_kun/article/details/25369017

5. http://blog.csdn.net/johnnyconstantine/article/details/46335763

6. http://www.csc.kth.se/utbildning/kth/kurser/DD3364/Lectures/KKT.pdf nice PPT

http://www.csc.kth.se/utbildning/kth/kurser/DD3364/Lectures/Duality.pdf

7. http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982684.html

转载于:https://www.cnblogs.com/lantingg/p/9088665.html

约束优化方法之拉格朗日乘子法与KKT条件相关推荐

  1. 拉格朗日乘子法、KKT条件、拉格朗日对偶性

    拉格朗日乘子法.KKT条件.拉格朗日对偶性 转载于http://blog.csdn.net/sinat_17496535/article/details/52103852 笔记主要来源于维基百科和&l ...

  2. SVM中拉格朗日乘子法、KKT条件、对偶问题详解

    SVM中拉格朗日乘子法.KKT条件.对偶问题详解 创作目的 1.SVM回顾 2.拉格朗日乘子法 3.KKT条件 4.对偶问题 强对偶性证明 总结 创作目的 我是机器学习初学者,目前正在上机器学习课,老 ...

  3. 拉格朗日乘子法与KKT条件

    欢迎转载,转载请注明出处:https://blog.csdn.net/qq_41709378/article/details/106599811 --------------------------- ...

  4. 最优化之凸集、凸函数、上确界、Jensen不等式、共轭函数、Fenchel不等式、拉格朗日乘子法、KKT条件

    最优化之凸集.凸函数.上确界.Jensen不等式.共轭函数.Fenchel不等式.拉格朗日乘子法.KKT条件.拉格朗日对偶 1.直线的向量表达 1.1 共线定理 对于任意两个向量a⃗,b⃗\vec{a ...

  5. 一文看懂拉格朗日乘子法、KKT条件和对偶问题

    因为想申请 CSDN 博客认证需要一定的粉丝量,而我写了五年博客才 700 多粉丝,本文开启关注才可阅读全文,很抱歉影响您的阅读体验 拉格朗日乘子法是解约束优化问题的常用方法,它和 KKT 条件.Sl ...

  6. 转 机器学习系列 08:深入理解拉格朗日乘子法、KKT 条件和拉格朗日对偶性

    深度理解拉格朗日乘子法.KKT条件与线性规划对偶理论的微妙关系 https://blog.csdn.net/benzhujie1245com/article/details/85270058?utm_ ...

  7. 一文详解从拉格朗日乘子法、KKT条件、对偶上升法到罚函数与增广Lagrangian乘子法再到ADMM算法(交替方向乘子法)

    最近看了ADMM算法,发现这个算法需要用到许多不少前备知识,在搜索补齐这些知识的过程中感觉网上的资料与总结在零散的同时又不够清晰,在此本文对这一块的内容进行汇总,同时表达自己的一些理解. 目录 拉格朗 ...

  8. 【数学理论】最优化问题:拉格朗日乘子法、KKT条件以及对偶问题

    前言 最优化问题的求解方法在机器学习算法中是经常被用到的.下面是一个最优化问题的一个简单概述: 求解f(x)f(x)f(x)最小值时的x∗x^*x∗,即: min⁡xf(x)\mathop {\min ...

  9. 砥志研思SVM(二) 拉格朗日乘子法与KKT条件

    [1]最优化问题中的对偶性理论 [2]拉格朗日乘子法(上) [3]拉格朗日乘子法(下)

最新文章

  1. hadoop完全分布式集群群起
  2. linux命令行ps1变量_利用Shell中变量PS1定制Linux Shell命令主提示符
  3. 眼睛很疼(2005-5-10)
  4. 去某大厂三面总监面,因为迟到了5分钟,面试官当着我的面把简历扔垃圾桶了
  5. vs连接mysql出错解决方法
  6. 回归分析加不加常数项_时间序列分析基础(一)
  7. 设置php缓存失效,PHP使用Memcache时模拟命名空间及缓存失效问题的解决
  8. 汇编试验四:[bx] 和 loop 的使用
  9. 主题:spring集成quartz,出现2次重复调用的问题
  10. 7z增量更新参数使用
  11. IHttpHandler给图片加水印
  12. 阅读软件怎么添加书源_认识一波苹果安卓手机上,那些以一敌百的小说漫画软件...
  13. 使用Clion进行Qt项目开发
  14. 【论文阅读】Multi-Modal Sarcasm Detection Based on Contrastive Attention Mechanism
  15. 计算机网络汇聚层,31. 接入层 汇聚层 核心层 三层典型网络架构
  16. SWFObject是什么
  17. mysql如何创建组合索引
  18. TP5后端,VUE前端请求聚合数据新闻接口
  19. Revit获取平面视图参照标高及视图范围
  20. python字符串与字符串抑或解析(natas11 python解法)

热门文章

  1. anaconda tensorflow 2.3_TensorFlow 速成 | 统计师的Python日记 第13天
  2. wps android qq 群,手机WPS怎样发送文档给QQ?WPS怎样发送文档给QQ教程
  3. android app增加内存大小,android – 增加分配给应用程序的内存
  4. android如何避免内存泄露,Android开发中应该避免的内存泄露
  5. python2.0教程_django2.0入门教程第一节
  6. apache mysql 连接数 winnt,APACHE PHP MYSQL PHPMYADMIN超详细配置教程
  7. php的Traits属性以及基本用法
  8. 每天一个linux命令(22):find 命令的参数详解
  9. 【操作系统】考研の处理机调度算法(看不懂你来打我~!)
  10. python【力扣LeetCode算法题库】面试题62- 圆圈中最后剩下的数字(约瑟夫环)