在之前写的上百篇机器学习博客中,不时会使用矩阵向量求导的方法来简化公式推演,但是并没有系统性的进行过讲解,因此让很多朋友迷惑矩阵向量求导的具体过程为什么会是这样的。这里准备用几篇博文来讨论下机器学习中的矩阵向量求导,今天是第一篇。

    本系列主要参考文献为维基百科的Matrix Caculas和张贤达的《矩阵分析与应用》。

1. 矩阵向量求导引入

    在高等数学里面,我们已经学过了标量对标量的求导,比如标量yy对标量xx的求导,可以表示为∂y∂x∂y∂x。

    有些时候,我们会有一组标量yi,i=1,2,...,myi,i=1,2,...,m来对一个标量xx的求导,那么我们会得到一组标量求导的结果:

∂yi∂x,i=1,2.,,,m∂yi∂x,i=1,2.,,,m

    如果我们把这组标量写成向量的形式,即得到维度为m的一个向量yy对一个标量xx的求导,那么结果也是一个m维的向量:∂y∂x∂y∂x

    可见,所谓向量对标量的求导,其实就是向量里的每个分量分别对标量求导,最后把求导的结果排列在一起,按一个向量表示而已。类似的结论也存在于标量对向量的求导,向量对向量的求导,向量对矩阵的求导,矩阵对向量的求导,以及矩阵对矩阵的求导等。

    总而言之,所谓的向量矩阵求导本质上就是多元函数求导,仅仅是把把函数的自变量,因变量以及标量求导的结果排列成了向量矩阵的形式,方便表达与计算,更加简洁而已。

    为了便于描述,后面如果没有指明,则求导的自变量用xx表示标量,

机器学习中的矩阵向量求导(一) 求导定义与求导布局相关推荐

  1. 机器学习中的矩阵向量求导(四) 矩阵向量求导链式法则

    在机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法中,我们讨论了使用微分法来求解矩阵向量求导的方法.但是很多时候,求导的自变量和因变量直接有复杂的多层链式求导的关系,此时微分法使用起来也有些麻烦. ...

  2. 机器学习中的矩阵向量求导(三) 矩阵向量求导之微分法

    在机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法中,我们讨论了定义法求解矩阵向量求导的方法,但是这个方法对于比较复杂的求导式子,中间运算会很复杂,同时排列求导出的结果也很麻烦.因此我们需要其他的 ...

  3. 机器学习中的矩阵向量求导(二) 矩阵向量求导之定义法

    在机器学习中的矩阵向量求导(一) 求导定义与求导布局中,我们讨论了向量矩阵求导的9种定义与求导布局的概念.今天我们就讨论下其中的标量对向量求导,标量对矩阵求导, 以及向量对向量求导这三种场景的基本求解 ...

  4. 机器学习中的矩阵向量求导(五) 矩阵对矩阵的求导

    在矩阵向量求导前4篇文章中,我们主要讨论了标量对向量矩阵的求导,以及向量对向量的求导.本文我们就讨论下之前没有涉及到的矩阵对矩阵的求导,还有矩阵对向量,向量对矩阵求导这几种形式的求导方法. 本文所有求 ...

  5. 机器之心最干的文章:机器学习中的矩阵、向量求导

    作者:七月 本文的目标读者是想快速掌握矩阵.向量求导法则的学习者,主要面向矩阵.向量求导在机器学习中的应用.因此,本教程而非一份严格的数学教材,而是希望帮助读者尽快熟悉相关的求导方法并在实践中应用.另 ...

  6. 机器学习中的矩阵求导的一点总结(三种方法求线性回归最佳参数)

    机器学习中的矩阵求导的一点总结(三种方法求线性回归最佳参数) 转载于:https://blog.csdn.net/promisejia/article/details/80159619?ops_req ...

  7. 机器学习(十一)——机器学习中的矩阵方法(1)LU分解、QR分解

    http://antkillerfarm.github.io/ 因子分析的EM估计(续) 去掉和各参数无关的部分后,可得: ∑i=1mE[logp(x(i)|z(i);μ,Λ,Ψ)]=∑i=1mE[1 ...

  8. MIT18.065 数据分析、信号处理和机器学习中的矩阵方法-学习笔记

    文章目录 MIT18.065 数据分析.信号处理和机器学习中的矩阵方法 Lecture 1 The Column Space of A Contains All Vectors Ax A=CR A=C ...

  9. lu分解法matlab_MIT 18.065—机器学习中的矩阵方法02 矩阵乘法与矩阵分解

    数据分析.信号处理和机器学习中的矩阵方法 第02讲 矩阵乘法与矩阵分解 新MIT 线性代数|机器学习(中英机翻字幕)18.065 by Gilbert Strang_哔哩哔哩 (゜-゜)つロ 干杯~- ...

最新文章

  1. WinAPI: GetTickCount - 获取系统已启动的时间
  2. (五) 定点迭代法求根
  3. numpy实现神经网络代码(mnist手写体识别)
  4. html5标签及属性大全,HTML5 标签 和属性 列表.pdf
  5. Netty(一)——Netty入门程序
  6. Spring和Junit整合
  7. java多线程区别_Java中实现多线程的两种方式之间的区别
  8. Chapter1-5_Speech_Recognition(Alignment of HMM, CTC and RNN-T)
  9. 好饭不怕晚,扒一下 Redis 的配置文件
  10. 【开卷故意】JAVA正則表達式模版
  11. 网址收藏 2020.12.11
  12. 单片机 驱动 标签打印机tsc_指令打印与驱动打印随笔
  13. PADS Layout 滴泪、敷铜和删除
  14. 基于stm32单片机外文文献_基于STM32的智能家居系统设计毕业论文+任务书+开题报告+文献综述+外文翻译及原文+程序+原理图+参考资料+答辩PPT+仿真设计...
  15. 苹果花期行情结束见顶?铁矿石认沽次末日25倍,纯碱09-01季节性反套?2022.5.10
  16. 黑马点评项目-UV 统计
  17. twitter数据爬取
  18. 《Python语言程序设计基础》嵩天著-第3章程序部分练习题答案
  19. UE4使用MixAmo中的角色与动画
  20. 阿里云装mysql选择版本_mysql学习之-三种安装方式与版本介绍

热门文章

  1. Linux C获取当前时间(精确到微秒)
  2. 递推算法6——逆推法之存取问题
  3. Java开发 - 树(二叉树,二叉排序树,红黑树)
  4. python项目对接腾讯云发送短信
  5. 人生有两种境界:一是痛而不言,二是笑而不语(zt)
  6. mysql 启动 pid update_MySql服务器启动错误“服务器退出而不更新PID文件”
  7. android动态请求权限
  8. Unity-技术美术 199-208
  9. C++的四种强制转换
  10. 重新运行一次阿里云服务器.从零开始搭建.?log-换-服务器