【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(17):函数矩阵的微分和积分
目录
- 前言
- 往期文章
- 5.2 函数矩阵的微分和积分
- 5.2.1 函数矩阵对自变量的微分和积分
- 定义5.3:函数矩阵
- 定义5.4:函数矩阵的微分
- 单元函数矩阵的一些性质
- 例1
- 定义5.5 函数矩阵的积分(定积分与不定积分)
- 函数矩阵的积分的一些性质
- 结语
前言
Hello!小伙伴!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,有幸拿过一些国奖、省奖…已保研。目前正在学习C++/Linux/Python
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
机器学习小白阶段
文章仅作为自己的学习笔记 用于知识体系建立以及复习
知其然 知其所以然!
往期文章
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(2):线性空间定义及其性质
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(3):线性空间的基与坐标
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(4):基变换与坐标变换
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(5):线性子空间
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(7):欧氏空间
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(8):标准正交基与Gram-Schmidt过程
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(9):正交补与投影定理
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(10):线性变换定义
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(11):线性变换的矩阵表示
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(12):相似形理论
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(13):Hamliton-Cayley定理、最小多项式
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(14):向量范数及其性质
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(15):矩阵的范数
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(16):向量和矩阵的极限
5.2 函数矩阵的微分和积分
5.2.1 函数矩阵对自变量的微分和积分
定义5.3:函数矩阵
设矩阵
A(z)=[a11(z)a12(z)...a1n(z)a21(z)a22(z)...a2n(z)......an1(z)an2(z)...ann(z)]\boldsymbol A(z)=\begin{bmatrix} a_{11}(z) & a_{12}(z) &... & a_{1n}(z)\\ a_{21} (z)& a_{22}(z) & ... &a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ a_{n1}(z) & a_{n2}(z) &... & a_{nn}(z)\\ \end{bmatrix} A(z)=⎣⎢⎢⎢⎢⎡a11(z)a21(z)..an1(z)a12(z)a22(z)..an2(z).........a1n(z)a2n(z)..ann(z)⎦⎥⎥⎥⎥⎤
其中每个元素aij(z)a_{ij}(z)aij(z)都是复变量函数,称A(z)\boldsymbol A(z)A(z)为函数矩阵
定义5.4:函数矩阵的微分
若函数矩阵A(z)=(aij(z))m×n\boldsymbol A(z)=(a_{ij}(z))_{m×n}A(z)=(aij(z))m×n的每个元素aij(z)a_{ij}(z)aij(z)都是复变量zzz的函数,且都在z=z0z=z_0z=z0或变量zzz的某个区域DDD上可微
则称此函数矩阵A(z)\boldsymbol A(z)A(z)在z=z0z=z_0z=z0或区域DDD上是可微的
并规定A(z)\boldsymbol A(z)A(z)对zzz的导数为
ddzA(z)=(ddzaij(z))m×n=[ddza11(z)ddza12(z)...ddza1n(z)ddza21(z)ddza22(z)...ddza2n(z)......ddzam1(z)ddzam2(z)...ddzamn(z)]\frac{d}{dz}A(z)=(\frac{d}{dz}a_{ij}(z))_{m×n}=\begin{bmatrix} \frac{d}{dz}a_{11}(z) & \frac{d}{dz}a_{12}(z) &... & \frac{d}{dz}a_{1n}(z)\\ \frac{d}{dz}a_{21} (z)& \frac{d}{dz}a_{22}(z) & ... &\frac{d}{dz}a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ \frac{d}{dz}a_{m1}(z) & \frac{d}{dz}a_{m2}(z) &... & \frac{d}{dz}a_{mn}(z)\\ \end{bmatrix} dzdA(z)=(dzdaij(z))m×n=⎣⎢⎢⎢⎢⎡dzda11(z)dzda21(z)..dzdam1(z)dzda12(z)dzda22(z)..dzdam2(z).........dzda1n(z)dzda2n(z)..dzdamn(z)⎦⎥⎥⎥⎥⎤
单元函数矩阵的一些性质
性质1
若函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)是可微的,则它们的和也可微,且
ddz[A(z)+B(z)]=ddzA(z)+ddzB(z)\frac{d}{d_z}[\boldsymbol A(z)+\boldsymbol B(z)]=\frac{d}{dz}\boldsymbol A(z)+\frac{d}{dz}\boldsymbol B(z)dzd[A(z)+B(z)]=dzdA(z)+dzdB(z)
性质2
设函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)分别是m×nm×nm×n及n×sn×sn×s阶矩阵,且A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)都可微
ddz[A(z)B(z)]=[ddzA(z)]B(z)+A(z)[ddzB(z)]\frac{d}{dz}[\boldsymbol A(z)\boldsymbol B(z)]=[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol B(z)+\boldsymbol A(z)[\frac{d}{dz}\boldsymbol B(z)]dzd[A(z)B(z)]=[dzdA(z)]B(z)+A(z)[dzdB(z)]
性质3
设函数矩阵A(u)=(aij(u))m×n\boldsymbol A(u)=(a_{ij}(u))_{m×n}A(u)=(aij(u))m×n及变量zzz的函数u=f(z)u=f(z)u=f(z)都可微,则
ddzA[f(z)]=dduA(u)⋅ddzf(z)\frac{d}{dz}\boldsymbol A[f(z)]=\frac{d}{du}\boldsymbol A(u)\cdot\frac{d}{dz}f(z)dzdA[f(z)]=dudA(u)⋅dzdf(z)
性质4
若nnn阶函数矩阵A(z)\boldsymbol A(z)A(z)可逆,且A(z)\boldsymbol A(z)A(z)及其逆阵A−1(z)\boldsymbol A^{-1}(z)A−1(z)都可微,则
ddzA−1(z)=−A−1(z)[ddzA(z)]A−1(z)\frac{d}{dz}\boldsymbol A^{-1}(z)=-\boldsymbol A^{-1}(z)[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol A^{-1}(z)dzdA−1(z)=−A−1(z)[dzdA(z)]A−1(z)
例1
求二次型χTAχ\boldsymbol\chi^TA\boldsymbol\chiχTAχ对变量ttt的导数
其中
χ=[x1(t)x2(t)...xn(t)],A=(aij)n×n,aij=aij\boldsymbol\chi=\begin{bmatrix} x_1(t)\\ x_2(t)\\ .\\ .\\ .\\ x_n(t)\\ \end{bmatrix},\boldsymbol A=(a_{ij})_{n×n},a_{ij}=a{ij}χ=⎣⎢⎢⎢⎢⎢⎢⎡x1(t)x2(t)...xn(t)⎦⎥⎥⎥⎥⎥⎥⎤,A=(aij)n×n,aij=aij
解答
ddt[χTAχ]=(ddtχT)Aχ+χTAddtχ=(ddtχT)(χTAT)T+χTAddtχ=(ddtχ)T(χTAT)T+χTAddtχ=(χTAT)ddtχ+χTAddtχ=χTAddtχ+χTAddtχ=2χTAddtχ\frac{d}{dt}[\boldsymbol\chi^TA\boldsymbol\chi]=(\frac{d}{dt}\boldsymbol\chi^T)A\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi^T)(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi)^T(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\boldsymbol\chi^TA^T)\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=2\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chidtd[χTAχ]=(dtdχT)Aχ+χTAdtdχ=(dtdχT)(χTAT)T+χTAdtdχ=(dtdχ)T(χTAT)T+χTAdtdχ=(χTAT)dtdχ+χTAdtdχ=χTAdtdχ+χTAdtdχ=2χTAdtdχ
定义5.5 函数矩阵的积分(定积分与不定积分)
若函数矩阵A(t)=(aij(t))\boldsymbol A(t)=(a_{ij}(t))A(t)=(aij(t))的每个元素都是实变数ttt的函数,且都在[a,b][a,b][a,b]上可积
则称函数矩阵A(t)\boldsymbol A(t)A(t)在[a,b][a,b][a,b]上是可积的,并规定
∫abA(t)dt=[∫aba11(t)dt∫aba12(t)dt...∫aba1n(t)dt∫aba21(t)dt∫aba22(t)dt...∫aba2n(t)dt......∫abam1(t)dt∫abam2(t)dt...∫abamn(t)dt]\int_a^b\boldsymbol A(t)dt=\begin{bmatrix} \int_a^ba_{11}(t)dt & \int_a^ba_{12}(t)dt &... & \int_a^ba_{1n}(t)dt\\ \int_a^ba_{21}(t)dt & \int_a^ba_{22}(t)dt & ... &\int_a^ba_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int_a^ba_{m1}(t)dt & \int_a^ba_{m2}(t)dt &... & \int_a^ba_{mn}(t)dt\\ \end{bmatrix} ∫abA(t)dt=⎣⎢⎢⎢⎢⎢⎡∫aba11(t)dt∫aba21(t)dt..∫abam1(t)dt∫aba12(t)dt∫aba22(t)dt..∫abam2(t)dt.........∫aba1n(t)dt∫aba2n(t)dt..∫abamn(t)dt⎦⎥⎥⎥⎥⎥⎤
为A(t)\boldsymbol A(t)A(t)在[a,b][a,b][a,b]上的定积分
而
∫A(t)dt=[∫a11(t)dt∫a12(t)dt...∫a1n(t)dt∫a21(t)dt∫a22(t)dt...∫a2n(t)dt......∫am1(t)dt∫am2(t)dt...∫amn(t)dt]\int \boldsymbol A(t)dt=\begin{bmatrix} \int a_{11}(t)dt & \int a_{12}(t)dt &... & \int a_{1n}(t)dt\\ \int a_{21}(t)dt & \int a_{22}(t)dt & ... &\int a_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int a_{m1}(t)dt & \int a_{m2}(t)dt &... & \int a_{mn}(t)dt\\ \end{bmatrix} ∫A(t)dt=⎣⎢⎢⎢⎢⎡∫a11(t)dt∫a21(t)dt..∫am1(t)dt∫a12(t)dt∫a22(t)dt..∫am2(t)dt.........∫a1n(t)dt∫a2n(t)dt..∫amn(t)dt⎦⎥⎥⎥⎥⎤
称为A(t)\boldsymbol A(t)A(t)的不定积分
函数矩阵的积分的一些性质
性质1
对任何函数A(t)\boldsymbol A(t)A(t),有
∫AT(t)dt=[∫A(t)dt]T\int \boldsymbol A^T(t)dt=[\int \boldsymbol A(t)dt]^T∫AT(t)dt=[∫A(t)dt]T
性质2
对函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t)A(t),B(t)及a,b∈Ra,b\in Ra,b∈R,有
∫[aA(t)+bB(t)]dt=a∫A(t)dt+b∫B(t)dt\int[a\boldsymbol A(t)+b\boldsymbol B(t)]dt=a\int \boldsymbol A(t)dt+b\int \boldsymbol B(t)dt∫[aA(t)+bB(t)]dt=a∫A(t)dt+b∫B(t)dt
性质3
对函数矩阵A(t)\boldsymbol A(t)A(t)及常矩阵B,C\boldsymbol B,\boldsymbol CB,C,有
∫A(t)Bdt=[∫A(t)dt]B\int \boldsymbol A(t)\boldsymbol Bdt=[\int \boldsymbol A(t)dt]\boldsymbol B∫A(t)Bdt=[∫A(t)dt]B
∫CA(t)dt=C∫A(t)dt\int \boldsymbol C\boldsymbol A(t)dt=\boldsymbol C\int \boldsymbol A(t)dt∫CA(t)dt=C∫A(t)dt
性质4
对于函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t)A(t),B(t),有
∫[A(t)ddtB(t)]dt=A(t)B(t)−∫[ddtA(t)]B(t)dt\int[\boldsymbol A(t)\frac{d}{dt}\boldsymbol B(t)]dt=\boldsymbol A(t)\boldsymbol B(t)-\int[\frac{d}{dt}\boldsymbol A(t)]\boldsymbol B(t)dt∫[A(t)dtdB(t)]dt=A(t)B(t)−∫[dtdA(t)]B(t)dt
结语
说明:
- 参考于 课本《矩阵理论》
- 配合书中概念讲解 结合了自己的一些理解及思考
文章仅作为学习笔记,记录从0到1的一个过程
希望对您有一点点帮助,如有错误欢迎小伙伴指正
【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(17):函数矩阵的微分和积分相关推荐
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(14):向量范数及其性质
目录 前言 往期文章 4.1 向量范数及其性质 4.1.1 向量范数的概念及P-范数 定义4.1 例1 向量的几种范数 4.1.2 n n n维线性空间 V V V上的向量范数等价性 定理4.1.1 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(25):幂级数(补充知识)
目录 前言 往期文章 幂级数 一.函数项级数的概念 定义:(函数项)无穷级数 幂级数及其收敛性 幂级数 定理1(阿贝尔定理) 推论 定理2 结语 前言 Hello!小伙伴! 非常感谢您阅读海轰的文章, ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(8):标准正交基与Gram-Schmidt过程
目录 前言 往期文章 2.2 标准正交基与Gram-Schmidt过程 2.2.1 标准正交基 定义2.4 定理2.2.1 定义2.5 2.2.2 求标准正交基的Schmide方法 定理2.2.2 举 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(23):常数项级数的概念和性质(补充知识)
目录 前言 往期文章 常数项级数的概念和性质 一.常数项级数的概念 常数项无穷级数 定义:收敛与发散 例题 二.收敛级数的基本性质 性质1 性质2 性质3 性质4 性质5(级数收敛的必要条件) 三.柯 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(13):Hamliton-Cayley定理、最小多项式
目录 前言 往期文章 3.4 Hamliton-Cayley定理.最小多项式 定义3.19 Hamliton-Cayley定理 定义3.20 定理3.4.1 定理3.4.2 定理3.4.3 定理3.4 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(6):子空间的交与和
目录 前言 往期文章 1.6 子空间的交与和 1.6.1 子空间的交 定理1.6.1 1.6.2 子空间的和 定义1.8 定理1.6 .2 结语 前言 Hello!小伙伴! 非常感谢您阅读海轰的文章, ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(11):线性变换的矩阵表示
目录 前言 往期文章 3.2 线性变换的矩阵表示 定义3.7 命题 定理3.2.1 结语 前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出- 自我介绍 ଘ(੭ ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(24):常数项级数的审敛法(补充知识)
目录 前言 往期文章 常数项级数的审敛法 一.正项级数及其审敛法 定义:正项级数 定理1 定理2(比较审敛法) 推论 定理3 (比较审敛法的极限形式) 定理4(比值审敛法,达朗贝尔判别法) 定理5(比 ...
- 【机器学习|数学基础】Mathematics for Machine Learning系列之矩阵理论(1):集合与映射
目录 前言 1.1 集合与映射 平凡子集合 和集 映射 满射 单射 一一映射 举例 例 - 1 例 - 2 例 - 3 结语 前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方 ...
最新文章
- Go 语言同一个包内函数调用、包名和实际路径最后一个目录不一致问题
- 苹果M1芯片升级果然很炸场:性能暴涨功耗速降!但最香新品竟是无降噪AirPods 3...
- struts2处理.do后缀的请求
- mount: unknown filesystem type 'smbfs' 问题解决
- VC下调用x264进行视频编码,
- Java网络爬虫实操(8)
- 【草稿】windows + vscode 远程开发
- 如何使用Python操作MySQL数据库
- [转贴]非技术:在广州天河北被抢全记录(入面D广州话真系厉害,不懂粤语者别看,会吐血)...
- 事务(注解声明式事务管理)
- 使用csc手动编译cs文件
- html语言的字体设置
- Doris之DataX doriswriter
- mysql 存储过程 调度_mysql 存储过程和事件调度
- Java-密钥keytool及KeyStore的使用
- JSON 的几种简单格式和转换
- 基于网络的服装定制MTM系统研究 - 硕士论文 - 道客巴巴
- 坚持连续背单词一年是什么体验
- python3大神器_Python三大神器之pip的安装
- python输入一个字符、如果是大写字母、转换为小写_python语言 输入一个字母 如果它是一个小写英文字母 则把它转换为对应的大写字母输出?...