矩阵微分与向量函数Taylor展开
第一部分:矩阵微分
计算∂F∂X\frac{\partial F}{\partial X}时,根据F和X的类型有不同的微分公式。F和X可以分别是标量、向量和矩阵。
1. 当X是标量时
- 当F是X的标量函数时,则∂F∂X\frac{\partial F}{\partial X}就是一元函数的导数。
- 当F是函数向量时,设
F={F1(x),F1(x),...,Fn(x)}T,
F=\left \{ F_{1}(x),F_{1}(x),...,F_{n}(x) \right \}^{T},
则∂F∂X={∂F1(x)∂x,∂F2(x)∂x,...,∂Fn(x)∂x}T\frac{\partial F}{\partial X}=\left \{ \frac{\partial F_{1}(x)}{\partial x},\frac{\partial F_{2}(x)}{\partial x},...,\frac{\partial F_{n}(x)}{\partial x} \right \}^{T}
- 当F是函数矩阵时,设
F=⎧⎩⎨⎪⎪f11...fn1.........f1m...fnm⎫⎭⎬⎪⎪,
F=\begin{Bmatrix}f_{11} & ... & f_{1m}\\ ... & ... & ...\\ f_{n1} & ... & f_{nm}\end{Bmatrix},
则∂F∂X=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪∂f11∂X...∂fn1∂X.........∂f1m∂X...∂fnm∂X⎫⎭⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪\frac{\partial F}{\partial X}=\begin{Bmatrix}\frac{\partial f_{11}}{\partial X} & ... & \frac{\partial f_{1m}}{\partial X}\\ ... & ... &... \\ \frac{\partial f_{n1}}{\partial X} & ... & \frac{\partial f_{nm}}{\partial X}\end{Bmatrix}
- 求导法则
2. 当X是向量时
设X={x1,x2,...,xm}TX=\left \{ x_{1},x_{2},...,x_{m} \right \}^{T}
- 当F是X的标量函数时,则
\frac{\partial F}{\partial X}=\left \{ \frac{\partial F}{\partial x_{1}}, \frac{\partial F} {\partial x_{2}},...,\frac{\partial F}{\partial x_{m}}\right \}^{T}这叫做F(X)的梯度,记为 grad F(X)。
- 当F是函数向量时,设
F=\left \{ f_{1}(X),f_{2}(X),...,f_{n}(X) \right \}^{T},
则
\frac{\partial F}{\partial X}=\frac{\partial F}{\partial X^{T}}=\begin{Bmatrix}\frac{\partial F}{\partial x_{1}} & \frac{\partial F}{\partial x_{2}} & ... & \frac{\partial F}{\partial x_{m}}\end{Bmatrix}=\begin{Bmatrix}\frac{\partial f_{1}}{\partial x_{1}} & \frac{\partial f_{1}}{\partial x_{2}} & ... & \frac{\partial f_{1}}{\partial x_{m}}\\ ... & ... & ... & ...\\ \frac{\partial f_{n}}{\partial x_{1}} & \frac{\partial f_{n}}{\partial x_{2}} & ... & \frac{\partial f_{n}}{\partial x_{m}}\end{Bmatrix}
这是先展开X后展开F。还可以先展开F后展开X,结果是一样的。
上述求导结果又称为Jaccobi矩阵。
- 当F是函数矩阵时,设
F=\left\{f_{ij}\right\}_{nl}
则
\frac{\partial F}{\partial X}=\begin{Bmatrix}\frac{\partial F}{\partial x_{1}} & \frac{\partial F}{\partial x_{2}} & ... & \frac{\partial F}{\partial x_{m}}\end{Bmatrix}^{T}_{mn\times l}
结果是m个n*l的矩阵在垂直方向上的叠加。
3. 当X是矩阵时
设
X=\begin{Bmatrix} x_{11} & ... & x_{1m}\\ ... & ... & ...\\ x_{n1} & ... & x_{nm} \end{Bmatrix}
- 当F是X的标量函数,则
\frac{\partial F}{\partial X}=\begin{Bmatrix} \frac{\partial F}{\partial x_{11}} & ... & \frac{\partial F}{\partial x_{1m}}\\ ... & ... & ...\\ \frac{\partial F}{\partial x_{n1}} & ... & \frac{\partial F}{\partial x_{nm}} \end{Bmatrix}
- 当F是函数向量时,设
F=\left\{f_{1},f_{2},...,f_{l}\right\}^{T}则
F=\left\{\frac {\partial f_{1}}{\partial X},\frac {\partial f_{2}}{\partial X},...,\frac {\partial f_{l}}{\partial X}\right\}^{T}_{ln\times m}
- 当F是函数矩阵时,设
F=\begin{Bmatrix}f_{11} & ... & f_{1k}\\ ... & ... & ...\\ f_{l1} & ... & f_{lk}\end{Bmatrix}
则
\frac{\partial F}{\partial X}=\begin{Bmatrix} \frac{\partial f_{11}}{\partial X} & ... & \frac{\partial f_{1k}}{\partial X}\\ ... & ... & ...\\ \frac{\partial f_{l1}}{\partial X} & ... & \frac{\partial f_{lk}}{\partial X} \end{Bmatrix},其中矩阵的每个元素都是一个标量函数对矩阵的导数,每个元素都是一个nm的矩阵。
4. 复合函数的导数
第二部分:向量函数的Taylor展开
参考 :[https://wenku.baidu.com/view/bfb50cf09e314332396893cf.html]
矩阵微分与向量函数Taylor展开相关推荐
- [计算数学基础]矩阵微分
矩阵微分 函数对于变量的微分在高等数学里面讲的比较多,而矩阵微分在我印象中没有在高等代数中讲解.矩阵微分也是很常用的一个数学工具,我最早是在一门研究生课程"优化设计"中接触到,优化 ...
- 线性代数之 矩阵求导(4)矩阵微分,迹与求导
线性代数之 矩阵求导(4)迹与矩阵求导 前言 矩阵微分定义 矩阵微分计算法则 常矩阵 线性 乘积 转置 迹 通过矩阵微分进行求导 常用的矩阵微分 后记 前言 本次将记录如何进行矩阵求导(标量对矩阵). ...
- 矩阵论(八):矩阵微分与矩阵求导
矩阵论专栏:专栏(文章按照顺序排序) 做机器学习的几乎避免不了矩阵求导,尤其是神经网络方面的,反向传播算法说白了就是在做矩阵求导,拿到代价函数对模型中每个参数矩阵的导数,才能找到一个下降方向,进而更新 ...
- 矩阵论思维导图_矩阵求导与矩阵微分
矩阵求导与矩阵微分 符号定义 使用大写的粗体字母表示矩阵 使用小写的粗体字母表示向量 ,这里默认为列向量 使用小写的正体字母表示标量 需要明白的是,矩阵求导的意义在哪来,我们回想一下函数求 ...
- 最小二乘法矩阵微分偏导法证明
最小二乘法矩阵微分偏导法证明 向量范数回顾 向量1范数 向量1范数即是向量元素的绝对值.定义见: . 向量2范数 向量2范数即是向量里每个元素的平 ...
- 矩阵分析与应用(二)——矩阵微分
文章目录 部分符号约定 一阶偏导: Jacobian 矩阵与梯度矩阵 偏导算子 标量函数的Jacobian 矩阵 矩阵函数的Jacobian 梯度矩阵 二阶偏导: Hessian 矩阵 实Hessia ...
- 深度学习数学基础——矩阵微分篇
https://www.toutiao.com/a6641771475994952206/ 2019-01-02 13:45:27 深度学习是一个令人兴奋的领域,具有巨大的现实世界影响力. 本文是Te ...
- 11 - 向量微分、矩阵微分以及基于雅克比矩阵求导数
文章目录 1. 手推机器学习-矩阵求导 1.1 绪论 1.2 ML中为什么需要矩阵求导 1.3 向量函数与矩阵求导初印象 1.4 矩阵求导-YX拉伸术 1.5 常见矩阵求导公式举例 1.6 求导细节补 ...
- 二元函数对xy同时求导_矩阵求导与矩阵微分
矩阵求导与矩阵微分 符号定义 使用大写的粗体字母表示矩阵 使用小写的粗体字母表示向量 ,这里默认为列向量 使用小写的正体字母表示标量 需要明白的是,矩阵求导的意义在哪来,我们回想一下函数求 ...
- matlab常系数线性矩阵微分方程组,基于Matlab常系数线性微分方程组的求解
·基础数学· 基于 Matlab 常系数线性微分方程组的求解* 严水仙 (赣南师范大学 数学与计算机科学学院,江西 赣州 341000) 摘 要: 在常微分方程课程教学中,常系数线性微分方程组可以通过 ...
最新文章
- Python源码怎么读,听听顶级爬虫工程师的建议
- python 微信发送图片失败什么原因_[已解决] Appium-Python 测试聊天时同时发送 9 张图片的问题...
- 【php】函数重载问题
- JVM(六)为什么新生代有两个Survivor分区?
- oracle pivoting insert 用法简介
- 发生TM锁争用的情况
- en结尾的单词_以en结尾的英语单词
- Java连接mysql出现SQL异常,MySQL 这样连接为何出现这样的异常
- 《JSON笔记之二》----封装JSONUtil
- SWPU ROUND #6(DIV.3)
- Caffe︱构建lmdb数据集、binaryproto均值文件及各类难辨的文件路径名设置细解
- Python实战之12306抢票
- 什么是网络操作系统?网络操作系统具有那些基本功能?
- 讲讲MS08067红队培训班中的“毕业实战对抗”环节 + 视频
- VSCode搭建STM32开发环境(极简自我搭建懒人直接使用插件)
- SpringBoot-SSMP超详细整合案例
- 【修真院java小课堂】HashMap浅析
- transitive fanout与set_dont_touch_network
- 【全面掌握windowXP系统优化的四个步骤 】
- Oracle 12c 基于PDB种子数据库创建PDB
热门文章
- 十大经典排序算法--详解
- 软考中级软件设计师基础整理(1.计算机组成与体系结构)
- starting mysql error_Starting MySQL.. ERROR! The server quit without updating PID file
- Closest_Pair
- input file选择图片后显示(FileReader)
- python常用单词读法-Python常用单词
- 基于Cesium搭建单体化平台全流程简单记录
- 如何在网页下载腾讯视频为本地MP4格式
- Unity 分辨率框Config Dialog Banner尺寸要求
- jsp页面打开为空白页