1.矩阵的基本概念

1.1矩阵的迹(matrix trace)

存在方阵A=(aij)n×n,其主对角线上的所有元素的和,称为此方阵的迹,记作tr(A)

tr(A)=a11+a22+……+ann

tr(A)=∑aii,i=1,....,n

注:n阶方阵A,tr(A)也等于方阵A的所有特征值的和

1.2矩阵的代数余子式(alebraic cofactor)

1.3伴随矩阵A*(adjoint matrix)

存在方阵A=(aij)n×n,则矩阵A*=(Aij)n×n称为矩阵A的伴随矩阵,

1.4行列式(determinant)

存在n阶方阵A=(aij)n×n,则其行列式可记作D=|A|=detA=det(aij)

1.5线性方程组有唯一解法则

又称克拉默法则,如果线性方程组的系数行列式不等于零,则此线性方程组有唯一解!

1.6零矩阵

如果一个矩阵的元素都是零,则此矩阵就是零矩阵。注:不同型的零矩阵不相等

1.7单位矩阵E

如果一个矩阵的主对角线上的元素都为1,而其他位置上的元素都为零,则此矩阵称为单位矩阵

E=diag(1,1,……,1)

1.8对角矩阵

如果一个矩阵的对角线上的不为零,而其他位置上的元素都为零,则此矩阵称为对角矩阵

对角矩阵=diag(λ1,λ2,……,λn),其中λi≠0。

1.9矩阵的幂

对象:n阶方阵A=(aij)n×n

k个n阶方阵A的乘积,可以表达为矩阵A的k次幂,记作AAA=A^3,AAAA=A^4等

1.10转置矩阵

对象:m×n的普通矩阵A=(aij)m×n

转置:把矩阵A的行换成同序数的列,得到的新矩阵就是A的转置矩阵,记作A^T,博客里为了方便表达记作A'

性质:

A''=A

(A+B)'=A'+B'

(λA)'=λA'

(AB)'=B'A'

1.11对称阵

对象:n阶方阵A=(aij)n×n

概念:如果n阶方阵A的所有元素,以对角线为对称轴对称的元素相等,则称n阶方阵为对称阵。

记作:如果A'=A,则A为n阶对称阵

1.12n阶方阵的行列式

对象:n阶方阵A=(aij)n×n

性质:

1)|A'| = |A|

2)|λA| = λ^n|A|

3)|AB| = |A||B|,其中A和B都为n阶方阵矩阵A=(aij)n×n,B=(bij)n×n

4)对于n阶矩阵A和B,一般来说AB≠BA,但是总是有:|AB|=|BA|=|A||B|

5)AA*=A*A=|A|E,其中A*为伴随矩阵,E为n阶单位矩阵

6)|E|=1,单位矩阵的行列式等于1

1.13逆矩阵

对象:n阶方阵A和B,A=(aij)n×n,B=(bij)n×n

概念:如果AB=BA=E,其中E为n阶单位矩阵,则称A是可逆的,B为A的逆矩阵,简称逆阵,记作A^(-1)

性质:

1)可逆n阶方阵A的逆矩阵只有一个,因为B=BE=B(AC)=(BA)C=EC=C,所以B=C,所以A只有一个可逆矩阵

2)什么样的方阵可逆?

如果|A|≠0,则n阶方阵A是可逆的。

3)逆阵A和伴随矩阵的关系?

A^-1=A*/|A|

4)若A和B是同阶方阵且均可逆,则AB也可逆,并且:

(AB)^(-1)=B^(-1)A^(-1)

5)若A可逆,则A'也可逆,且:

(A')^(-1) = (A^(-1))'

6)若A可逆,则A*也可逆,且:

(A*)^(-1) = (A^(-1))*

1.14奇异矩阵

|A|=0时,A称为奇异矩阵。

|A|≠0 与 A可逆 是充分必要条件,即可逆矩阵就是非奇异矩阵。

1.5线性方程组

a11x1 + a12x2 + ……+a1jxj+……+a1nxn = b1

a21x1 + a22x2 + ……+a2jxj+……+a2nxn = b2

……

am1x1 + am2x2 + ……+amjxj+……+amnxn = bm

1.16系数矩阵

线性方程组中系数组成的矩阵,A=(aij)m×n,称为系数矩阵

可简单记作A=(a1, a2, …ai…,an),其中ai为单列矩阵(ai1, ai2, ai3,……,ain)

1.17未知数向量

线性方程组中自变量x组成的列向量,X=(x1, x2, ……,xn)称为未知数向量

1.18常数项向量

线性方程组中最后端的常熟组成的列向量b=(b1, b2, ……,bm),称为常数项向量

1.19增广矩阵

B=(系数矩阵,常数项矩阵)=(A, b) = (a1, a2, ……,an,b),即:

a11 a12 a13 …… a1n b1

a21 a22 a23 …… a2n b2

……

am1 am2 am3 …… amn bm

1.20梯度矩阵

标量y对矩阵Xm×n的导数,得到的就是梯度矩阵

dy/dX=(∂y/∂xij)m×n,i=1,2,……,m,j=1,2,……,n

展开就是

∂f/∂x11    ∂f/∂x12    ∂f/∂x13     ……    ∂f/∂x1n

∂f/∂x21    ∂f/∂x22    ∂f/∂x23     ……    ∂f/∂x2n

……        ……        ……        ……    ……

∂f/∂xm1    ∂f/∂xm2    ∂f/∂xm3   ……    ∂f/∂xmn

2.函数的基本概念

2.1实值函数

如果一个函数f(x)的值域在实数范围内,则此函数f(x)称为是实函数,也叫实值函数。

2.2矩阵值函数

如果一个矩阵A(x)m×n的每个元素a(x)ij都属于实数范围(a,b)内,则此矩阵A(x)m×n称为矩阵值函数。

一般记A(x)m×n是实数区间(a,b)上m×n阶矩阵值函数,矩阵值函数中每个元素都满足:a(x)ij∈(a,b)

2.3向量值函数

如果一个矩阵A(x)m×1的元素a(x)i1都属于实数范围(a,b)内,则此矩阵A(x)m×1称为向量值函数

可知向量值函数是矩阵值函数的列等于1时的函数。

2.4矩阵函数(matrix function)

如果一个函数的定义域和值域都是方阵,则此函数称为矩阵函数

3矩阵值函数的导数运算

如果一个矩阵A(x)m×n的每个元素a(x)ij都属于实数范围(a,b)内,则此矩阵A(x)m×n称为矩阵值函数

假设有矩阵值函数A(x),B(x),下面简单记作A,B,并用符号d(A)表示对矩阵值函数A进行x求导!

1)A(x)是常数矩阵的 充分必要条件是 dA(x)/dx = 0

2)d(A + B) = dA + dB

3)d(AB)= (dA)B + A(dB)

4.多元函数f(X)对矩阵X求导

如果f=f(X)作为X∈R^(p×q)的多元函数,且f是可微的,则多元函数f对矩阵X的导数为:

df/dX = (∂f/∂xij)p×q=

∂f/∂x11    ∂f/∂x12    ∂f/∂x13     ……    ∂f/∂x1q

∂f/∂x21    ∂f/∂x22    ∂f/∂x23    ……      ∂f/∂x2q

……      ……        ……        ……      ……

∂f/∂xp1    ∂f/∂xp2    ∂f/∂xp3    ……     ∂f/∂xpq

也就是:X矩阵大小不变p×q,xij每个元素都换成f(X)对xij求导,得到的新矩阵,就是df/dX~~~~

此时得到的导数就是梯度矩阵~~~~~

5.多元函数f(x)对向量x的求导

如果f=f(x)是向量x∈R^n的多元函数,且f是可微的,则f对向量x的导数为:

df/dx = (∂f/∂x1,∂f/∂x2,∂f/∂x3,……,∂f/∂xn)

6标量y对标量x的求导

直接写作:dy/dx

6标量y对矩阵X的求导

一般情况下,只用到标量对矩阵的求导~~~

7.向量A对标量x的求导

记作A=(a1, a2, a3,……,an),则向量A对标量x的求导为:

dA/dx=∂ai/∂x,i=1,2,……,n

dA/dx=(∂a1/∂x,∂a2/∂x,……,∂an/∂x)

8.矩阵对标量x的求导

矩阵A,标量x,则矩阵A的每个元素分别对标量x求导

dA/dx=∂aij/∂x,i=1,2,……,m,j=1,2,……,n

展开就是

∂a11/∂x    ∂a12/∂x    ……    ∂a1n/∂x

∂a21/∂x    ∂a22/∂x    ……    ∂a2n/∂x

……        ……        ……    ……

∂am1/∂x    ∂am2/∂x    ……    ∂amn/∂x

9.向量Y对向量X的求导

Y=(y1, y2, ……,ym),X=(x1,x2,……,xn)

dY/dX=(∂yi/∂xj)m×n,i=1,2,……,m,j=1,2,……,n

展开就是:

∂y1/∂x1    ∂y1/∂x2    ……    ∂y1/∂xn

∂y2/∂x1    ∂y2/∂x2    ……    ∂y2/∂xn

∂y3/∂x1    ∂y3/∂x2    ……    ∂y3/∂xn

……        ……        ……    ……

∂ym/∂x1    ∂ym/∂x2    ……    ∂ym/∂xn

10.矩阵Y关于向量X的求导

Y=(yij)m×n对向量X=xk,k=1,2,……,n的求导

dY/dX=(∂yij/∂xj)m×n,i=1,2,……,m,j=1,2,……,n

展开就是:

∂y11/∂x1    ∂y12/∂x2    ……    ∂y1n/∂xn

∂y21/∂x1    ∂y22/∂x2    ……    ∂y2n/∂xn

……         ……        ……  ……

∂yi1/∂x1      ∂yi2/∂x2    ……      ∂yin/∂xn

……        ……        ……    ……

∂ym1/∂x1    ∂ym2/∂x2    ……    ∂ymn/∂xn

11.常用导数总结

假设有:a是实数,X、β是向量、A、B、C是和X无关的矩阵

且X'、β'、A'、B'、C'分别表示各自矩阵的转置矩阵,这是为了方便表示用'替代了T

注释:为了方便书写博客,d(f(X))表示∂(f(X))/∂X,即f(X)对X的导数。

1)d(β'X)=β,其中β'是β的转置矩阵

2)d(X') = E

3)d(XX') = 2X

4)d(AD(X)B) = Ad(D(X))B

5)d(X'AX)  = (A'+A)X

尝试用的矩阵的迹的公式有:

1)tr(a) = a

2)tr(AB) = tr(BA)

3)tr(ABC) = tr(BCA) = tr(CAB)

4)tr(A) = tr(A')

5)dtr(AB) = dtr(BA) = B',            此处dtr(AB)含义是∂tr(AB)/∂A

6)dtr(A'XB'))= dtr(BX'A))= AB,    其中A、B、X在此处都是矩阵,且A、B和矩阵X无关

7)dtr(ABA'C)= CAB + C'AB',       此处dtr(ABA'C) 含义是∂tr(ABA'C)/∂A

8)dtr(AXBX) = AX'B'  + B'X'A',    此处dtr(AXBX)含义是∂dtr(AXBX)/∂X

(end)

【机器学习】汇总详解:矩阵基本知识以及矩阵求导相关推荐

  1. L2正则化Regularization详解及反向传播的梯度求导

    摘要 本文解释L2正则化Regularization, 求解其在反向传播中的梯度, 并使用TensorFlow和PyTorch验证. 相关 系列文章索引 : https://blog.csdn.net ...

  2. 【吃瓜教程】《机器学习公式详解》西瓜书与南瓜书公式推导

    [吃瓜教程]<机器学习公式详解>西瓜书与南瓜书公式推导 2021年7月11日 第0章-导学 深度学习:狭义地来说,就是具有较多层的神经网络. 整个学习过程; 先看西瓜书,在看 Datawh ...

  3. 【机器学习】详解 RNN

    相关文章       [机器学习]详解 RNN         [机器学习]详解 LSTM       [机器学习]详解 GRU 目录 一.概述 二.语言模型 与 N 元语法 (N-Gram) 三.循 ...

  4. 2位专家耗时2年打造,西瓜书机器学习公式详解,都在这里了!(文末留言赠书)...

    作为机器学习的入门经典教材,周志华老师的<机器学习>,自2016年1月底出版以来,首印5000册一周售罄,并在8个月内重印9次.先后登上了亚马逊,京东,当当网等的计算机类畅销书榜首,身边学 ...

  5. 21年最新Python面试题及答案汇总详解(上)

    错过三月找工作的机会,还要错过四月的好时期吗?Python面试你做准备了吗?下面小编整理了一套2021年最新Python常见面试题目,及Python面试题目答案汇总.希望能够帮助到大家. 21年最新P ...

  6. 使用pickle保存机器学习模型详解及实战(pickle、joblib)

    使用pickle保存机器学习模型详解及实战 pickle模块实现了用于序列化和反序列化Python对象结构的二进制协议. "Pickling"是将Python对象层次结构转换为字节 ...

  7. 合服 两个服务器都有什么作用,阴阳师合服是什么意思?合服合区问题汇总详解[多图]...

    阴阳师最近在进行合服,那么这次的合服合区到底是什么意思呢?下面是友情MT为大家带来的阴阳师合服合区问题汇总详解,希望能帮助到大家! 为提升部分服务器阴阳师大人们参与交互玩法的体验,寮办将于2018年1 ...

  8. python混淆矩阵,详解使用python绘制混淆矩阵(confusion_matrix)

    这篇文章主要介绍了详解使用python绘制混淆矩阵(confusion_matrix),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学 ...

  9. 阴阳师最新的服务器,阴阳师跨区服务器大全 集结之境新增跨区服务器汇总详解...

    阴阳师跨区服务器有哪些,阴阳师集结之境新增服务器哪些可以玩呢?下面是小编为大家带来的阴阳师跨区服务器大全,集结之境新增跨区服务器汇总详解,希望能帮助到大家! 亲爱的阴阳师大人: 为了让更多的大人们能够 ...

最新文章

  1. Swift游戏开发实战教程(大学霸内部资料)
  2. 两阶段提交协议的异常处理
  3. 常用浏览器重要启动参数和配置参数整理
  4. Spring MVC 中 HandlerInterceptorAdapter的使用--转载
  5. java converter转换器_springboot 自定义转换器(converter)
  6. 计组—原码、补码、反码、移码复习
  7. 任正非:华为鸿蒙将比安卓快 60%;小米已官方回应侵权偷图事件;博通正考虑收购软件公司,其中Tibco和赛门铁克为重点目标……...
  8. OpenCV文档阅读笔记-Imread flags解析与实例(保存透明图像)
  9. 禁止html文件控件手动输入的方法
  10. VMware vCenter Server 的内部版本号和版本 (2143838)--2020-10-27 更新
  11. MongoDB C Driver使用教程
  12. java 53个关键字_java的保留(53个)关键字v11.docx
  13. 第十章 动态选录协议
  14. Linux搭建Git服务器教程
  15. Python全栈之路--Django ORM详解
  16. oracle drop怎么用,Oracle Drop Table
  17. PT站的分享精神,我所向往的PT分享模式(原创)
  18. 公司代码与采购组织的分配关系
  19. 人教版三年级计算机教学计划,2017人教版三年级信息技术教学计划范文
  20. 神经网络是算法还是模型,神经元网络算法的思想

热门文章

  1. TXT+sqlite+Android,sqlite 导入txt
  2. android 你访问的站点在新浪微博认证失败,新浪微博 ios/android 你所访问的站点在新浪微博的认证失败 解决方法...
  3. 防火墙导致软件安装中缺失插件解决办法
  4. winxp文件、打印机共享故障排除方法及“操作无法完成.键入的打印机名不正确,或者指定的打印机没有连接到服务器上
  5. 案例管理:如何杜绝越级上司的命令?
  6. 网易mumu模拟器顶部布局
  7. java对数据结构的了解_数据结构对java有用吗
  8. cannot find -ldl
  9. Centos7安装pycharm
  10. 域名解析,反向域名解析nbtstat