前言
往期文章
5.2 函数矩阵的微分和积分
- 5.2.1 函数矩阵对自变量的微分和积分
- - 定义5.3：函数矩阵
  - 定义5.4：函数矩阵的微分
  - 单元函数矩阵的一些性质
  - 例1
  - 定义5.5 函数矩阵的积分（定积分与不定积分）
  - 函数矩阵的积分的一些性质
结语

前言

Hello！小伙伴！
非常感谢您阅读海轰的文章，倘若文中有错误的地方，欢迎您指出～

自我介绍 ଘ(੭ˊᵕˋ)੭
昵称：海轰
标签：程序猿｜C++选手｜学生
简介：因C语言结识编程，随后转入计算机专业，有幸拿过一些国奖、省奖…已保研。目前正在学习C++/Linux/Python
学习经验：扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语！

机器学习小白阶段
文章仅作为自己的学习笔记用于知识体系建立以及复习
知其然知其所以然！

往期文章

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（1）：集合与映射

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（2）：线性空间定义及其性质

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（3）：线性空间的基与坐标

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（4）：基变换与坐标变换

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（5）：线性子空间

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（6）：子空间的交与和

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（7）：欧氏空间

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（8）：标准正交基与Gram-Schmidt过程

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（9）：正交补与投影定理

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（10）：线性变换定义

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（11）：线性变换的矩阵表示

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（12）：相似形理论

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（13）：Hamliton-Cayley定理、最小多项式

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（14）：向量范数及其性质

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（15）：矩阵的范数

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（16）：向量和矩阵的极限

5.2 函数矩阵的微分和积分

5.2.1 函数矩阵对自变量的微分和积分

定义5.3：函数矩阵

设矩阵

A(z)=[a11(z)a12(z)...a1n(z)a21(z)a22(z)...a2n(z)......an1(z)an2(z)...ann(z)]\boldsymbol A(z)=\begin{bmatrix} a_{11}(z) & a_{12}(z) &... & a_{1n}(z)\\ a_{21} (z)& a_{22}(z) & ... &a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ a_{n1}(z) & a_{n2}(z) &... & a_{nn}(z)\\ \end{bmatrix} A(z)=⎣⎢⎢⎢⎢⎡a11(z)a21(z)..an1(z)a12(z)a22(z)..an2(z).........a1n(z)a2n(z)..ann(z)⎦⎥⎥⎥⎥⎤

其中每个元素aij(z)a_{ij}(z)aij(z)都是复变量函数，称A(z)\boldsymbol A(z)A(z)为函数矩阵

定义5.4：函数矩阵的微分

若函数矩阵A(z)=(aij(z))m×n\boldsymbol A(z)=(a_{ij}(z))_{m×n}A(z)=(aij(z))m×n的每个元素aij(z)a_{ij}(z)aij(z)都是复变量zzz的函数，且都在z=z0z=z_0z=z0或变量zzz的某个区域DDD上可微

则称此函数矩阵A(z)\boldsymbol A(z)A(z)在z=z0z=z_0z=z0或区域DDD上是可微的

并规定A(z)\boldsymbol A(z)A(z)对zzz的导数为

ddzA(z)=(ddzaij(z))m×n=[ddza11(z)ddza12(z)...ddza1n(z)ddza21(z)ddza22(z)...ddza2n(z)......ddzam1(z)ddzam2(z)...ddzamn(z)]\frac{d}{dz}A(z)=(\frac{d}{dz}a_{ij}(z))_{m×n}=\begin{bmatrix} \frac{d}{dz}a_{11}(z) & \frac{d}{dz}a_{12}(z) &... & \frac{d}{dz}a_{1n}(z)\\ \frac{d}{dz}a_{21} (z)& \frac{d}{dz}a_{22}(z) & ... &\frac{d}{dz}a_{2n}(z)\\ . & . & & . \\ . & . & & . \\ \frac{d}{dz}a_{m1}(z) & \frac{d}{dz}a_{m2}(z) &... & \frac{d}{dz}a_{mn}(z)\\ \end{bmatrix} dzdA(z)=(dzdaij(z))m×n=⎣⎢⎢⎢⎢⎡dzda11(z)dzda21(z)..dzdam1(z)dzda12(z)dzda22(z)..dzdam2(z).........dzda1n(z)dzda2n(z)..dzdamn(z)⎦⎥⎥⎥⎥⎤

单元函数矩阵的一些性质

性质1

若函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)是可微的，则它们的和也可微，且

ddz[A(z)+B(z)]=ddzA(z)+ddzB(z)\frac{d}{d_z}[\boldsymbol A(z)+\boldsymbol B(z)]=\frac{d}{dz}\boldsymbol A(z)+\frac{d}{dz}\boldsymbol B(z)dzd[A(z)+B(z)]=dzdA(z)+dzdB(z)

性质2

设函数矩阵A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)分别是m×nm×nm×n及n×sn×sn×s阶矩阵，且A(z),B(z)\boldsymbol A(z),\boldsymbol B(z)A(z),B(z)都可微

ddz[A(z)B(z)]=[ddzA(z)]B(z)+A(z)[ddzB(z)]\frac{d}{dz}[\boldsymbol A(z)\boldsymbol B(z)]=[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol B(z)+\boldsymbol A(z)[\frac{d}{dz}\boldsymbol B(z)]dzd[A(z)B(z)]=[dzdA(z)]B(z)+A(z)[dzdB(z)]

性质3

设函数矩阵A(u)=(aij(u))m×n\boldsymbol A(u)=(a_{ij}(u))_{m×n}A(u)=(aij(u))m×n及变量zzz的函数u=f(z)u=f(z)u=f(z)都可微，则

ddzA[f(z)]=dduA(u)⋅ddzf(z)\frac{d}{dz}\boldsymbol A[f(z)]=\frac{d}{du}\boldsymbol A(u)\cdot\frac{d}{dz}f(z)dzdA[f(z)]=dudA(u)⋅dzdf(z)

性质4

若nnn阶函数矩阵A(z)\boldsymbol A(z)A(z)可逆，且A(z)\boldsymbol A(z)A(z)及其逆阵A−1(z)\boldsymbol A^{-1}(z)A−1(z)都可微，则

ddzA−1(z)=−A−1(z)[ddzA(z)]A−1(z)\frac{d}{dz}\boldsymbol A^{-1}(z)=-\boldsymbol A^{-1}(z)[\frac{d}{dz}\boldsymbol A(z)]\boldsymbol A^{-1}(z)dzdA−1(z)=−A−1(z)[dzdA(z)]A−1(z)

例1

求二次型χTAχ\boldsymbol\chi^TA\boldsymbol\chiχTAχ对变量ttt的导数

其中

χ=[x1(t)x2(t)...xn(t)],A=(aij)n×n,aij=aij\boldsymbol\chi=\begin{bmatrix} x_1(t)\\ x_2(t)\\ .\\ .\\ .\\ x_n(t)\\ \end{bmatrix},\boldsymbol A=(a_{ij})_{n×n},a_{ij}=a{ij}χ=⎣⎢⎢⎢⎢⎢⎢⎡x1(t)x2(t)...xn(t)⎦⎥⎥⎥⎥⎥⎥⎤,A=(aij)n×n,aij=aij

解答

ddt[χTAχ]=(ddtχT)Aχ+χTAddtχ=(ddtχT)(χTAT)T+χTAddtχ=(ddtχ)T(χTAT)T+χTAddtχ=(χTAT)ddtχ+χTAddtχ=χTAddtχ+χTAddtχ=2χTAddtχ\frac{d}{dt}[\boldsymbol\chi^TA\boldsymbol\chi]=(\frac{d}{dt}\boldsymbol\chi^T)A\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi^T)(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\frac{d}{dt}\boldsymbol\chi)^T(\boldsymbol\chi^TA^T)^T+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad\\ \quad\quad\quad\quad\;=(\boldsymbol\chi^TA^T)\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi+\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chi\\ \quad \\ \quad\quad\quad\quad\;=2\boldsymbol\chi^TA\frac{d}{dt}\boldsymbol\chidtd[χTAχ]=(dtdχT)Aχ+χTAdtdχ=(dtdχT)(χTAT)T+χTAdtdχ=(dtdχ)T(χTAT)T+χTAdtdχ=(χTAT)dtdχ+χTAdtdχ=χTAdtdχ+χTAdtdχ=2χTAdtdχ

定义5.5 函数矩阵的积分（定积分与不定积分）

若函数矩阵A(t)=(aij(t))\boldsymbol A(t)=(a_{ij}(t))A(t)=(aij(t))的每个元素都是实变数ttt的函数，且都在[a,b][a,b][a,b]上可积

则称函数矩阵A(t)\boldsymbol A(t)A(t)在[a,b][a,b][a,b]上是可积的，并规定

∫abA(t)dt=[∫aba11(t)dt∫aba12(t)dt...∫aba1n(t)dt∫aba21(t)dt∫aba22(t)dt...∫aba2n(t)dt......∫abam1(t)dt∫abam2(t)dt...∫abamn(t)dt]\int_a^b\boldsymbol A(t)dt=\begin{bmatrix} \int_a^ba_{11}(t)dt & \int_a^ba_{12}(t)dt &... & \int_a^ba_{1n}(t)dt\\ \int_a^ba_{21}(t)dt & \int_a^ba_{22}(t)dt & ... &\int_a^ba_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int_a^ba_{m1}(t)dt & \int_a^ba_{m2}(t)dt &... & \int_a^ba_{mn}(t)dt\\ \end{bmatrix} ∫abA(t)dt=⎣⎢⎢⎢⎢⎢⎡∫aba11(t)dt∫aba21(t)dt..∫abam1(t)dt∫aba12(t)dt∫aba22(t)dt..∫abam2(t)dt.........∫aba1n(t)dt∫aba2n(t)dt..∫abamn(t)dt⎦⎥⎥⎥⎥⎥⎤

为A(t)\boldsymbol A(t)A(t)在[a,b][a,b][a,b]上的定积分

而

∫A(t)dt=[∫a11(t)dt∫a12(t)dt...∫a1n(t)dt∫a21(t)dt∫a22(t)dt...∫a2n(t)dt......∫am1(t)dt∫am2(t)dt...∫amn(t)dt]\int \boldsymbol A(t)dt=\begin{bmatrix} \int a_{11}(t)dt & \int a_{12}(t)dt &... & \int a_{1n}(t)dt\\ \int a_{21}(t)dt & \int a_{22}(t)dt & ... &\int a_{2n}(t)dt\\ . & . & & . \\ . & . & & . \\ \int a_{m1}(t)dt & \int a_{m2}(t)dt &... & \int a_{mn}(t)dt\\ \end{bmatrix} ∫A(t)dt=⎣⎢⎢⎢⎢⎡∫a11(t)dt∫a21(t)dt..∫am1(t)dt∫a12(t)dt∫a22(t)dt..∫am2(t)dt.........∫a1n(t)dt∫a2n(t)dt..∫amn(t)dt⎦⎥⎥⎥⎥⎤

称为A(t)\boldsymbol A(t)A(t)的不定积分

函数矩阵的积分的一些性质

性质1

对任何函数A(t)\boldsymbol A(t)A(t)，有

∫AT(t)dt=[∫A(t)dt]T\int \boldsymbol A^T(t)dt=[\int \boldsymbol A(t)dt]^T∫AT(t)dt=[∫A(t)dt]T

性质2

对函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t)A(t),B(t)及a,b∈Ra,b\in Ra,b∈R，有

∫[aA(t)+bB(t)]dt=a∫A(t)dt+b∫B(t)dt\int[a\boldsymbol A(t)+b\boldsymbol B(t)]dt=a\int \boldsymbol A(t)dt+b\int \boldsymbol B(t)dt∫[aA(t)+bB(t)]dt=a∫A(t)dt+b∫B(t)dt

性质3

对函数矩阵A(t)\boldsymbol A(t)A(t)及常矩阵B,C\boldsymbol B,\boldsymbol CB,C，有

∫A(t)Bdt=[∫A(t)dt]B\int \boldsymbol A(t)\boldsymbol Bdt=[\int \boldsymbol A(t)dt]\boldsymbol B∫A(t)Bdt=[∫A(t)dt]B

∫CA(t)dt=C∫A(t)dt\int \boldsymbol C\boldsymbol A(t)dt=\boldsymbol C\int \boldsymbol A(t)dt∫CA(t)dt=C∫A(t)dt

性质4

对于函数矩阵A(t),B(t)\boldsymbol A(t),\boldsymbol B(t)A(t),B(t)，有

∫[A(t)ddtB(t)]dt=A(t)B(t)−∫[ddtA(t)]B(t)dt\int[\boldsymbol A(t)\frac{d}{dt}\boldsymbol B(t)]dt=\boldsymbol A(t)\boldsymbol B(t)-\int[\frac{d}{dt}\boldsymbol A(t)]\boldsymbol B(t)dt∫[A(t)dtdB(t)]dt=A(t)B(t)−∫[dtdA(t)]B(t)dt

结语

说明：

参考于课本《矩阵理论》
配合书中概念讲解结合了自己的一些理解及思考

文章仅作为学习笔记，记录从0到1的一个过程

希望对您有一点点帮助，如有错误欢迎小伙伴指正

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（17）：函数矩阵的微分和积分相关推荐

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（14）：向量范数及其性质
目录前言往期文章 4.1 向量范数及其性质 4.1.1 向量范数的概念及P-范数定义4.1 例1 向量的几种范数 4.1.2 n n n维线性空间 V V V上的向量范数等价性定理4.1.1 ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（25）：幂级数（补充知识）
目录前言往期文章幂级数一.函数项级数的概念定义:(函数项)无穷级数幂级数及其收敛性幂级数定理1(阿贝尔定理) 推论定理2 结语前言 Hello!小伙伴! 非常感谢您阅读海轰的文章, ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（8）：标准正交基与Gram-Schmidt过程
目录前言往期文章 2.2 标准正交基与Gram-Schmidt过程 2.2.1 标准正交基定义2.4 定理2.2.1 定义2.5 2.2.2 求标准正交基的Schmide方法定理2.2.2 举 ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（23）：常数项级数的概念和性质（补充知识）
目录前言往期文章常数项级数的概念和性质一.常数项级数的概念常数项无穷级数定义:收敛与发散例题二.收敛级数的基本性质性质1 性质2 性质3 性质4 性质5(级数收敛的必要条件) 三.柯 ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（13）：Hamliton-Cayley定理、最小多项式
目录前言往期文章 3.4 Hamliton-Cayley定理.最小多项式定义3.19 Hamliton-Cayley定理定义3.20 定理3.4.1 定理3.4.2 定理3.4.3 定理3.4 ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（6）：子空间的交与和
目录前言往期文章 1.6 子空间的交与和 1.6.1 子空间的交定理1.6.1 1.6.2 子空间的和定义1.8 定理1.6 .2 结语前言 Hello!小伙伴! 非常感谢您阅读海轰的文章, ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（11）：线性变换的矩阵表示
目录前言往期文章 3.2 线性变换的矩阵表示定义3.7 命题定理3.2.1 结语前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出- 自我介绍 ଘ(੭ ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（24）：常数项级数的审敛法（补充知识）
目录前言往期文章常数项级数的审敛法一.正项级数及其审敛法定义:正项级数定理1 定理2(比较审敛法) 推论定理3 (比较审敛法的极限形式) 定理4(比值审敛法,达朗贝尔判别法) 定理5(比 ...
【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（1）：集合与映射
目录前言 1.1 集合与映射平凡子集合和集映射满射单射一一映射举例例 - 1 例 - 2 例 - 3 结语前言 Hello!小伙伴! 非常感谢您阅读海轰的文章,倘若文中有错误的地方 ...

【机器学习｜数学基础】Mathematics for Machine Learning系列之矩阵理论（17）：函数矩阵的微分和积分

目录

前言