1.什么是共轭向量

对于正定矩阵Q,如果有
xTQy=0x^TQy = 0xTQy=0
那么我们可以称x, y是关于Q-conjugate。

2.线性方程组求解与二次函数求极小值转化

最初,共轭梯度法是用来求解线性方程Ax=bAx = bAx=b的一种方法,特别是稀疏线性方程组迭代求解法里面最优秀的方法,其被称为线性共轭梯度法。后来,人们把这种方法慢慢推广到了非线性问题求解中,称为非线性共轭梯度法。

求解Ax=bAx = bAx=b时,最简单粗暴的方式为x=A−1bx = A^{-1}bx=A−1b。但是这种方法的问题很明显:求逆矩阵的计算复杂度非常高。即使我们考虑用矩阵分解的方式,仍然会很慢。因此,我们尽可能考虑用迭代的方式,而不是直接求逆的方式来解这个问题。

如果构造一个二次函数:
f(x)=12xTAx−bTxf(x) = \frac{1}{2}x^TAx - b^Txf(x)=21​xTAx−bTx

对其求最小值,即令导数为零:
∇f(x)=Ax−bT=0\nabla f(x) = Ax - b^T = 0∇f(x)=Ax−bT=0

此时,正好是线性方程组Ax−b=0Ax - b = 0Ax−b=0的解。因此,我们可以将线性方程组求解问题转化为二次函数求极小值问题。

3.求解过程

根据第二部分推导,将求线性方程组解的问题转化为求二次函数极小值
f(x)=12xTQx−bTxf(x) = \frac{1}{2}x^TQx - b^Txf(x)=21​xTQx−bTx

结合第一部分,我们找到n个相互Q-conjugate的向量d1,d2,d3,⋯,dnd_1, d_2, d_3, \cdots, d_nd1​,d2​,d3​,⋯,dn​,他们相互共轭且线性无关,则空间任意向量x可以用该组基向量表示:
x=∑i=1naidix = \sum_{i=1} ^n a_i d_ix=i=1∑n​ai​di​

上面的目标函数f(x)可以表示为如下

注意因为d是一组共轭向量,所以当i≠ji \neq ji​=j时,有diTQdj=0d_i^TQd_j=0diT​Qdj​=0

上面的公式可以变为
mina1,⋯,an∈Rn12∑i=1nai2diTQdi−∑i=1naibTdi\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} \sum_{i=1}^n a_i ^ 2 d_i ^TQd_i - \sum_{i=1}^na_ib^Td_ia1,⋯,an​∈Rnmin​21​i=1∑n​ai2​diT​Qdi​−i=1∑n​ai​bTdi​
进一步化简,
mina1,⋯,an∈Rn12∑i=1n(ai2diTQdi−aibTdi)\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} \sum_{i=1}^n (a_i ^ 2 d_i ^TQd_i - a_ib^Td_i)a1,⋯,an​∈Rnmin​21​i=1∑n​(ai2​diT​Qdi​−ai​bTdi​)

现在变量a1,a2,⋯,ana_1, a_2, \cdots, a_na1​,a2​,⋯,an​已经被分开了,将上面的式子再改写一下

mina1,⋯,an∈Rn12(a12d1TQd1−a1bTd1)+12(a22d2TQd2−a2bTd2)+⋯+12(an2dnTQdn−anbTdn)\underset {a1,\cdots,a_n \in R^n}{min} \frac{1}{2} (a_1 ^ 2 d_1 ^TQd_1 - a_1b^Td_1) + \frac{1}{2} (a_2 ^ 2 d_2 ^TQd_2 - a_2b^Td_2) + \cdots + \frac{1}{2} (a_n ^ 2 d_n ^TQd_n - a_nb^Td_n)a1,⋯,an​∈Rnmin​21​(a12​d1T​Qd1​−a1​bTd1​)+21​(a22​d2T​Qd2​−a2​bTd2​)+⋯+21​(an2​dnT​Qdn​−an​bTdn​)

这样,我们可以分别求每一项的最小值。比如第一项求最小值,直接求导即可:
a1d1TQd1−bTd1=0a_1 d_1^TQ d_1 - b^T d_1 = 0 a1​d1T​Qd1​−bTd1​=0
则可得:
a1=bTd1d1TQd1a_1 = \frac{b^T d_1}{d_1^TQ d_1}a1​=d1T​Qd1​bTd1​​

对于每一项,都有

ai=bTdidiTQdia_i = \frac{b^T d_i}{d_i^TQ d_i}ai​=diT​Qdi​bTdi​​

所以最终的最优解为:
x∗=∑i=1naidix^* = \sum_{i=1}^n a_i d_ix∗=i=1∑n​ai​di​
即:
x∗=∑i=1nbTdidiTQdidix^* = \sum_{i=1}^n \frac{b^T d_i}{d_i^TQ d_i} d_ix∗=i=1∑n​diT​Qdi​bTdi​​di​

4.共轭梯度法的精髓

回顾上述的推导过程来看,共轭梯度法就是把目标函数分成许多方向,然后不同方向分别求出极值在综合起来。

如果是二次优化问题,共轭梯度法理论上是可以保证最多n步一定找到最优解。

共轭梯度法仅利用了函数的一阶导数信息,但是克服了梯度下降收敛慢的缺点,同时又避免了牛顿法求二阶导计算量大的问题,不仅是解决大型线性方程组最有用的方法之一,也是解大型非线性最优化最有效的算法之一。当然,缺点就是前面我们提到的,是专门针对二次优化问题,其他场景不太适用。

共轭梯度法(Conjugate gradient)详解相关推荐

  1. 共轭梯度法(Conjugate Gradient Method)

    我们要求解线性方程组 Ax=b Ax=b 其中 A A 是对称正定矩阵(spd),给定RnR^n中n个线性无关的向量 r0,r1,⋯,rn−1 r_0,r_1,\cdots,r_{n-1}, 我们想要 ...

  2. Proximal Policy Optimization (PPO)详解

    文章目录 On-policy v.s. Off-policy 将On-policy变为Off-policy PPO算法/TRPO算法 PPO2 总结 On-policy v.s. Off-policy ...

  3. 共轭梯度法(Conjugate Gradient)

    共轭梯度法(Conjugate Gradient)是介于最速下降法与牛顿法之间的一个方法,它仅需利用一阶导数信息,但克服了最速下降法收敛慢的缺点,又避免了牛顿法需要存储和计算Hesse矩阵并求逆的缺点 ...

  4. 机器学习、深度学习中常用的优化算法详解——梯度下降法、牛顿法、共轭梯度法

    一.梯度下降法 1.总述: 在机器学习中,基于基本的梯度下降法发展了三种梯度下降方法,分别为随机梯度下降法,批量梯度下降法以及小批量梯度下降法. (1)批量梯度下降法(Batch Gradient D ...

  5. 深度学习优化函数详解(5)-- Nesterov accelerated gradient (NAG) 优化算法

    深度学习优化函数详解系列目录 深度学习优化函数详解(0)– 线性回归问题 深度学习优化函数详解(1)– Gradient Descent 梯度下降法 深度学习优化函数详解(2)– SGD 随机梯度下降 ...

  6. 系列 《使用sklearn进行集成学习——理论》 《使用sklearn进行集成学习——实践》 目录 1 Random Forest和Gradient Tree Boosting参数详解 2 如何调参?

    系列 <使用sklearn进行集成学习--理论> <使用sklearn进行集成学习--实践> 目录 1 Random Forest和Gradient Tree Boosting ...

  7. 方向梯度直方图(Histogram Of Gradient)详解

    特征描述子(Feature Descriptor) 特征描述子就是图像的表示,抽取了有用的信息,丢掉了不相关的信息.通常特征描述子会把一个w*h*3(宽高3,3个channel)的图像转换成一个长度为 ...

  8. 深度学习优化函数详解(5)-- Nesterov accelerated gradient (NAG)

    深度学习优化函数详解系列目录 本系列课程代码,欢迎star: https://github.com/tsycnh/mlbasic 深度学习优化函数详解(0)-- 线性回归问题 深度学习优化函数详解(1 ...

  9. 【强化学习】DDPG(Deep Deterministic Policy Gradient)算法详解

    http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html 引用莫凡老师的素材 https://morvanzhou.github.io/tut ...

  10. 【强化学习】Policy Gradient算法详解

    DeepMind公开课https://sites.google.com/view/deep-rl-bootcamp/lectures David Silver教程 http://www0.cs.ucl ...

最新文章

  1. 如何创建计算机视觉场景训练数据
  2. 一个Java应届生从上海离职,附项目源码
  3. ubuntu安装WPS
  4. 学长毕业日记 :本科毕业论文写成博士论文的神操作20170408
  5. EndNote 20.1 for Win/MacOS 完美稳定版安装 重大更新,修复BUG听取用户反馈更易用
  6. mysql 主备及时_MySQL高可用(二)主备延时如何解决?
  7. Provisioning Services 7.8 入门系列教程之十一 通过版本控制自动更新虚拟磁盘
  8. spring aop的两种写法aspect和advisor
  9. 计算机二,八,十,十六进制转换
  10. 使用Spring Boot开发邮件系统
  11. 可以写在简历上的22个轻松上手的Java经典项目教程(含源码and笔记)
  12. YUV444、YUV422、YUV420占用字节数
  13. 冯小刚“开撕”崔永元,娱乐圈炒作就要进入3.0时代
  14. 蓝牙地址BD_ADDR组成
  15. 【Ubuntu】 Ubuntu16.04中设置使用root用户登录图形界面
  16. 如何录制屏幕视频?有哪些录制技巧?
  17. py语言和php,php和python什么区别
  18. 使用VB.Net操作Excel输出重复内容的表格
  19. c语言中格式符号错误,C语言中符号格式说明
  20. MG-SOFT 导入MIB文件

热门文章

  1. Flask入门学习---进一步了解模板
  2. 手机浏览器自动播放视频video(设置autoplay无效)的解决方案
  3. js 的强制 类型 转换cast, 伪对象?
  4. AS3类库资源大集合
  5. 谷歌浏览器设置新标签页地址的方法
  6. lamda表达式对list各种处理
  7. redis 的 key 设计原则
  8. 服务器宕机可能的原因以及服务器宕机解决办法
  9. redis系列二: linux下安装redis
  10. Linux FTP文件服务器共享/匿名访问。别名访问。用户访问