Matrix Differentiation(矩阵求导)

References: Matrix Differentiation,Rabdak J.Barnes

: 本文直接从Matrix Differentiation开始记录,之前的乘法等基础部分不表。

Convention 3

m维向量对n维向量求导所得的结果是一个mxn矩阵,即Jacobian Matrix
具体形式见上公式。

命题5 Proposition 5

即:Axx求导,结果为A

Proof

命题6 Proposition 6

即:y=Ax,而xz的函数,那么便有∂y∂z=A∂x∂z\frac{{\partial {\rm{y}}}}{{\partial z}} = A\frac{{\partial x}}{{\partial z}}∂z∂y​=A∂z∂x​

Proof

命题7 Proposition 7

对于α=yTAx\alpha = y^TAxα=yTAx分别对xy求导的结论。

Proof

命题8 Proposition 8

对于α=xTAx\alpha = x^TAxα=xTAx对x求导的结论。

Proof

命题9 Proposition 9

即命题8的特例,A是对称矩阵。

命题10 Proposition 10

即α=yTx\alpha = y^Txα=yTx,而yx均为向量z的函数,对z求导的结果。

Proof

命题11 Proposition 11

命题10的特例,y=xy=xy=x

命题12 Proposition 12

对于α=yTAx\alpha = y^TAxα=yTAx,xy都是向量z的函数,对z求导的结果。

Proof

命题13 Proposition 13

命题12的特例:y=xy=xy=x

命题14 Proposition 14

命题13的特例:A是对称矩阵

命题15 Propostion 15

Proof


如果觉得文章对您有帮助的话,可以点个赞,是对博主最大的肯定!

Matrix Differentiation(矩阵求导)以及矩阵求导常用公式相关推荐

  1. 机器学习中的矩阵向量求导(一) 求导定义与求导布局

    在之前写的上百篇机器学习博客中,不时会使用矩阵向量求导的方法来简化公式推演,但是并没有系统性的进行过讲解,因此让很多朋友迷惑矩阵向量求导的具体过程为什么会是这样的.这里准备用几篇博文来讨论下机器学习中 ...

  2. 【机器学习】汇总详解:矩阵基本知识以及矩阵求导

    1.矩阵的基本概念 1.1矩阵的迹(matrix trace) 存在方阵A=(aij)n×n,其主对角线上的所有元素的和,称为此方阵的迹,记作tr(A) tr(A)=a11+a22+--+ann tr ...

  3. 矩阵的 Frobenius 范数及其求偏导法则

    矩阵的迹求导法则 1. 复杂矩阵问题求导方法:可以从小到大,从scalar到vector再到matrix 2. x is a column vector, A is a matrix d(A∗x)/d ...

  4. 机器学习中的矩阵向量求导(四) 矩阵向量求导链式法则

    在机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法中,我们讨论了使用微分法来求解矩阵向量求导的方法.但是很多时候,求导的自变量和因变量直接有复杂的多层链式求导的关系,此时微分法使用起来也有些麻烦. ...

  5. 机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法

    在机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法中,我们讨论了定义法求解矩阵向量求导的方法,但是这个方法对于比较复杂的求导式子,中间运算会很复杂,同时排列求导出的结果也很麻烦.因此我们需要其他的 ...

  6. 机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法

    在机器学习中的矩阵向量求导(一) 求导定义与求导布局中,我们讨论了向量矩阵求导的9种定义与求导布局的概念.今天我们就讨论下其中的标量对向量求导,标量对矩阵求导, 以及向量对向量求导这三种场景的基本求解 ...

  7. 矩阵论思维导图_矩阵求导与矩阵微分

    矩阵求导与矩阵微分 符号定义 ​ 使用大写的粗体字母表示矩阵 ​ 使用小写的粗体字母表示向量 ,这里默认为列向量 ​ 使用小写的正体字母表示标量 需要明白的是,矩阵求导的意义在哪来,我们回想一下函数求 ...

  8. 机器学习中的矩阵向量求导(五) 矩阵对矩阵的求导

    在矩阵向量求导前4篇文章中,我们主要讨论了标量对向量矩阵的求导,以及向量对向量的求导.本文我们就讨论下之前没有涉及到的矩阵对矩阵的求导,还有矩阵对向量,向量对矩阵求导这几种形式的求导方法. 本文所有求 ...

  9. 矩阵/向量/标量间相互求导

    矩阵.向量都可以表示成张量的形式,向量是矩阵的特殊形式,按实际应用可分为标量对向量求导,标量对矩阵求导.向量对向量求导.矩阵对标量求导.矩阵对向量求导.矩阵对矩阵求导等,在深度学习的反向传播(BP)中 ...

最新文章

  1. mysql 错误:1166 解决办法
  2. 验证mongodb副本集并实现自动切换primary~记录过程
  3. php正则截取富文本编辑器中路径字符串_php使用正则表达式获取字符串中的URL
  4. 简单易用的倒计时js代码
  5. Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
  6. 产品经理的四个重要阶段
  7. 大型的labview程序实例_【学院推荐】LabVIEW的核心要素——数据流
  8. mysql 索引长度tips innodb和myisam引擎
  9. SQLServer事务的隔离级别
  10. 五桌面工具来创建优秀的Windows环境
  11. 从源代码中加载res / values / dimension.xml中的维度值
  12. HDU 1500(经典的恶心DP)
  13. Astute Graphics for Mac(ai创意插件合集)
  14. linux服务器raid逻辑盘迁移,raid空闲盘的热迁移
  15. 移动硬盘测试扩容卡软件,U盘扩容检测教程,优盘容量真实性检测,TF卡移动硬盘SD卡内存卡...
  16. 提供给JAVA程序员的QQ群
  17. oracle的sid如何修改,Oracle数据库修改实例名SID的方法步骤
  18. python双击py一闪_python双击py一闪 python编程
  19. Game101课程笔记_lecture06_光栅化2
  20. 计算机打字不盲打可以吗,能盲打了,为什么打字速度还不快?现在才40左右,怎样才能达到60以上呢?...

热门文章

  1. 在iis6.0上配置Gzip
  2. Windows XP Embedded with Service Pack 2 开发包光盘 3CD
  3. Fedora的systemctl命令详解 Fedora配置IP地址/DNS/Networking
  4. linux 内核系统优化,Linux高并发应用类型对系统内核的优化
  5. 概率统计23——假设检验理论(2)
  6. LayoutInflater.inflate()方法两个参数和三个参数
  7. leetcode 两个数组的交集 II
  8. [NOIP]数字三角形
  9. 快速上手Linux核心命令(四):文件内容相关命令
  10. windows下的终端工具和产品力