矩阵论专栏:专栏(文章按照顺序排序)

线性代数是矩阵论的先修课程,本篇博客整理线性代数的基础理论知识,为矩阵论的学习做准备。限于篇幅,梳理的重点将在定理和结论上(只给出部分必要的定义),对最基础的概念(如矩阵及其基本运算等等)不清楚的童鞋可以参考矩阵的基本运算。
本文的讨论在一般的数域FFF中进行,FFF可以是有理数域、实数域、复数域等。这里不给出数域的严格定义,只要知道数域是复数域的一个对加减乘除运算封闭的子集,且有理数域是最小的数域即可。需要特别指出的是,我们所关心的数域都是复数域的子集,并不是什么抽象的代数数域。由于数域都是复数域的子集,在复数中定义的基本运算以及相应的运算律往往也适用于实数、有理数,例如取共轭,实数和有理数的共轭是其自身。数域的相关理论可参考数域和维基。


本篇博客先介绍线性代数中一些基本的概念,然后重点围绕“秩”这一重要概念整理相关结论:

  • 复数的运算法则、复矩阵的共轭与共轭转置
  • 行列式的性质
  • 方阵的迹及其性质
  • 逆矩阵
    • 伴随矩阵
    • 逆矩阵
    • 关于逆矩阵的一个常用公式(Woodbury-Sherman-Morrison公式)
  • 初等变换与矩阵的秩
    • 初等变换、初等矩阵
    • 矩阵的秩及性质
    • 分块矩阵的初等变换(广义初等变换)
      • 矩阵打洞技巧
      • 方阵乘积的行列式公式
      • 分块矩阵的逆
      • 分块矩阵的秩
  • 满秩分解
    • 满秩分解的定义
    • 满秩分解的存在性
    • 满秩分解的快速计算方法

复数的运算法则、复矩阵的共轭与共轭转置

  • 复数的基本运算法则
    复数的基本运算法则与实数的完全一致,且根据复数的定义z=a+biz=a+biz=a+bi容易验证,现列举如下:(设a,b,c∈Ca, b, c\in Ca,b,c∈C)

    • 加法交换律:a+b=b+aa+b=b+aa+b=b+a
    • 加法结合律:a+(b+c)=(a+b)+ca+(b+c)=(a+b)+ca+(b+c)=(a+b)+c
    • 乘法交换律:a×b=b×aa\times b=b\times aa×b=b×a
    • 乘法结合律:a×(b×c)=(a×b)×ca\times (b\times c)=(a\times b)\times ca×(b×c)=(a×b)×c
    • 乘法对加法的左分配律:(a+b)×c=a×c+b×c(a+b)\times c=a\times c+b\times c(a+b)×c=a×c+b×c
    • 乘法对加法的右分配律:a×(b+c)=a×b+a×ca\times (b+c)=a\times b+a\times ca×(b+c)=a×b+a×c
  • 复数的共轭、复数的模的运算律(设x,y∈Cx,y\in Cx,y∈C)
    • x±y‾=x‾±y‾\overline{x\pm{}y}=\overline{x}\pm{}\overline{y}x±y​=x±y​
    • xy‾=xˉyˉ\overline{xy}=\bar{x}\bar{y}xy​=xˉyˉ​
    • (xy)‾=x‾y‾\overline{(\frac{x}{y})}=\frac{\overline{x}}{\overline{y}}(yx​)​=y​x​
    • xx‾=x‾x=∣x∣2x\overline{x}=\overline{x}x=|x|^2xx=xx=∣x∣2
    • ∣xy∣=∣x∣∣y∣|xy|=|x||y|∣xy∣=∣x∣∣y∣
  • 矩阵的共轭
    矩阵的共轭就是将原矩阵的每个元素取共轭,即若A=(aij)m×nA=(a_{ij})_{m\times{n}}A=(aij​)m×n​,则A‾=(aij‾)m×n\overline{A}=(\overline{a_{ij}})_{m\times{n}}A=(aij​​)m×n​。实矩阵的共轭是其本身。根据复数共轭的运算率,可得矩阵的共轭具有如下性质:

    • A‾‾=A\overline{\overline{A}}=AA=A
    • A+B‾=A‾+B‾\overline{A+B}=\overline{A}+\overline{B}A+B​=A+B
    • kA‾=kˉA‾,k∈C\overline{kA}=\bar{k}\overline{A},k\in{C}kA=kˉA,k∈C
    • AB‾=AˉBˉ\overline{AB}=\bar{A}\bar{B}AB=AˉBˉ
  • 矩阵的共轭转置
    矩阵的共轭转置即先取共轭再转置或先转置再取共轭,即AH=(AT)‾=(A‾)TA^H=\overline{(A^T)}=\Bigl(\overline{A}\Bigr)^TAH=(AT)​=(A)T。实矩阵的转置是复矩阵的共轭转置的特例。矩阵的共轭转置具有如下性质:

    • (AH)H=A(A^{H})^H=A(AH)H=A
    • (AH)T=(AT)H(A^H)^T=(A^T)^H(AH)T=(AT)H
    • AH‾=(A‾)H\overline{A^H}=(\overline A)^HAH=(A)H
    • (A+B)H=AH+BH(A+B)^H=A^H+B^H(A+B)H=AH+BH
    • (kA)H=k‾AH,k∈C(kA)^H=\overline{k}A^H,k\in{C}(kA)H=kAH,k∈C
    • (AB)H=BHAH(AB)^H=B^HA^H(AB)H=BHAH
  • Hermite矩阵(共轭对称矩阵)
    若方阵A满足AH=AA^H=AAH=A,则称A是Hermite矩阵。实对称矩阵是一种Hermite矩阵。

行列式的性质

设F为一数域,给定正整数nnn,在FFF上可以构造出唯一的映射Fn×n→FF^{n\times n}\rightarrow FFn×n→F满足行列式第一公理和行列式第二公理。行列式的具体表达式可以使用置换或逆序数写出,本文略去,具体可参考博客以及知乎。
设A,B∈Fn×nA,B\in F^{n\times n}A,B∈Fn×n,k∈Fk\in Fk∈F为常数,根据置换或逆序数的性质可得行列式的如下性质:

  • det(AT)=det(A)det(A^T)=det(A)det(AT)=det(A)
  • det(AH)=det(A)‾det(A^H)=\overline{det(A)}det(AH)=det(A)​
  • det(kA)=kndet(A)det(kA)=k^ndet(A)det(kA)=kndet(A)
  • 行列式的某一行(列)乘非零常数k∈Fk\in Fk∈F,则行列式的值变为原来的kkk倍
  • 互换行列式的两行(或两列),则行列式的值取负
  • 行列式的某一行(列)加上另一行(列)的常数倍,行列式的值不变
  • det(AB)=det(A)det(B)det(AB)=det(A)det(B)det(AB)=det(A)det(B)
    证:见分块矩阵的初等变换。
  • 若A是共轭对称矩阵,则det(A)∈Rdet(A)\in Rdet(A)∈R
    证:因为det(A)=det(AH)=det(A)‾det(A)=det(A^H)=\overline{det(A)}det(A)=det(AH)=det(A)​,所以det(A)det(A)det(A)的虚部为零,det(A)∈Rdet(A)\in Rdet(A)∈R。

设A∈Fm×m,B∈Fn×nA\in F^{m\times m},B\in F^{n\times n}A∈Fm×m,B∈Fn×n,则:

  • 若A是对角矩阵或上(下)三角矩阵,则A的行列式是A的主对角元之积
  • 拉普拉斯展开式一:∣A∗OB∣=∣AO∗B∣=∣A∣∣B∣\begin{vmatrix} A&*\\O&B\end{vmatrix}=\begin{vmatrix}A&O\\*&B\end{vmatrix}=|A||B|∣∣∣∣​AO​∗B​∣∣∣∣​=∣∣∣∣​A∗​OB​∣∣∣∣​=∣A∣∣B∣
  • 拉普拉斯展开式二:∣OAB∗∣=∣∗ABO∣=(−1)mn∣A∣∣B∣\begin{vmatrix}O&A\\B&*\end{vmatrix}=\begin{vmatrix}*&A\\B&O\end{vmatrix}=(-1)^{mn}|A||B|∣∣∣∣​OB​A∗​∣∣∣∣​=∣∣∣∣​∗B​AO​∣∣∣∣​=(−1)mn∣A∣∣B∣

方阵的迹及其性质

  • 定义
    方阵A的迹tr(A)tr(A)tr(A)定义为A=(aij)n×nA=(a_{ij})_{n\times n}A=(aij​)n×n​的主对角元之和,即tr(A)=∑i=1naiitr(A)=\sum_{i=1}^n a_{ii}tr(A)=∑i=1n​aii​
  • 性质
    • 设A、B均为n阶方阵,则tr(A±B)=tr(A)±tr(B)tr(A\pm{B)}=tr(A)\pm{}tr(B)tr(A±B)=tr(A)±tr(B)
    • tr(cA)=ctr(A),c∈Ftr(cA)=ctr(A),c\in{F}tr(cA)=ctr(A),c∈F
    • tr(AT)=tr(A),tr(Aˉ)=tr(AH)=tr(A)‾tr(A^T)=tr(A),tr(\bar{A})=tr(A^H)=\overline{tr(A)}tr(AT)=tr(A),tr(Aˉ)=tr(AH)=tr(A)​
      推论:tr(ATB)=tr(BTA)=∑i,jAijBijtr(A^TB)=tr(B^TA)=\sum_{i,j}A_{ij}B_{ij}tr(ATB)=tr(BTA)=∑i,j​Aij​Bij​,其中A、B均为m×nm\times{n}m×n矩阵
    • 设A为m×nm\times{n}m×n矩阵,B为n×mn\times{m}n×m矩阵,则tr(AB)=tr(BA)=∑i,jAijBjitr(AB)=tr(BA)=\sum_{i,j}A_{ij}B_{ji}tr(AB)=tr(BA)=∑i,j​Aij​Bji​
    • 设A、B、C均为m×nm\times{n}m×n矩阵,则tr((A⊙B)TC)=tr(AT(B⊙C))=∑i,jAijBijCijtr((A\odot{B})^TC)=tr(A^T(B\odot{C}))=\sum_{i,j}A_{ij}B_{ij}C_{ij}tr((A⊙B)TC)=tr(AT(B⊙C))=i,j∑​Aij​Bij​Cij​式中⊙\odot{}⊙是逐元素乘法(Hadarmard积)
    • 设A、B、C均为m×nm\times{n}m×n矩阵,BBB的所有元素均非零,则tr((A⊘B)TC)=tr(AT(C⊘B))=∑ijAijCijBijtr((A\oslash B)^TC)=tr(A^T(C\oslash B))=\sum_{ij}\frac{A_{ij}C_{ij}}{B_{ij}}tr((A⊘B)TC)=tr(AT(C⊘B))=ij∑​Bij​Aij​Cij​​式中⊘\oslash⊘是逐元素除法

逆矩阵

  • 定义
    设A∈Fn×nA\in F^{n\times n}A∈Fn×n,若存在B∈Fn×nB\in F^{n\times n}B∈Fn×n使得AB=BA=IAB=BA=IAB=BA=I其中III是单位矩阵,则称A是可逆的,B是A的逆矩阵,记为B=A−1B=A^{-1}B=A−1。
  • 定理:任意方阵的逆矩阵若存在则唯一
  • 伴随矩阵
    • n阶(n⩾2)(n\geqslant{2})(n⩾2)方阵A的伴随矩阵A∗A^*A∗定义为:以AjiA_{ji}Aji​为(i,j)元素的n阶方阵,其中AijA_{ij}Aij​是AAA的(i,j)元素aija_{ij}aij​的代数余子式
    • 对任意n阶(n⩾2)(n\geqslant{2})(n⩾2)方阵A,根据拉普拉斯展开式,有AA∗=A∗A=det(A)IAA^*=A^*A=det(A)IAA∗=A∗A=det(A)I成立
  • 伴随矩阵的性质(设A,B∈Fn×n,n⩾2A,B\in F^{n\times n},n\geqslant 2A,B∈Fn×n,n⩾2)
    • (kA)∗=kn−1A∗,k∈F(kA)^*=k^{n-1}A^*,k\in{F}(kA)∗=kn−1A∗,k∈F
    • ∣A∗∣=∣A∣n−1|A^*|=|A|^{n-1}∣A∗∣=∣A∣n−1
    • (A∗)∗=∣A∣n−2A(A^*)^*=|A|^{n-2}A(A∗)∗=∣A∣n−2A
    • (A∗)T=(AT)∗(A^*)^T=(A^T)^*(A∗)T=(AT)∗
    • (A∗)H=(AH)∗(A^*)^H=(A^H)^*(A∗)H=(AH)∗
    • (AB)∗=B∗A∗(AB)^*=B^*A^*(AB)∗=B∗A∗
  • 方阵可逆的充要条件
    • (行列式判定)n阶方阵A=(aij)n×nA=(a_{ij})_{n\times{n}}A=(aij​)n×n​可逆的充要条件是det(A)≠0det(A)\neq0det(A)​=0,A的逆矩阵为A−1={A∗det(A)n⩾2(a11−1)1×1n=1A^{-1}=\begin{cases}\frac{A^*}{det(A)}&n\geqslant{2}\\(a_{11}^{-1})_{1\times{1}}&n=1\end{cases}A−1={det(A)A∗​(a11−1​)1×1​​n⩾2n=1​
    • n阶方阵A=(aij)n×nA=(a_{ij})_{n\times{n}}A=(aij​)n×n​可逆的充要条件是存在BBB使得AB=IAB=IAB=I
      证:
      必要性:若AAA可逆,显然取B=A−1B=A^{-1}B=A−1就有AB=IAB=IAB=I。
      充分性:若存在BBB使得AB=IAB=IAB=I,则由det(AB)=det(A)det(B)=det(I)=1det(AB)=det(A)det(B)=det(I)=1det(AB)=det(A)det(B)=det(I)=1知det(A)≠0det(A)\neq 0det(A)​=0(否则的话就有det(AB)=0det(AB)=0det(AB)=0与det(AB)=1det(AB)=1det(AB)=1矛盾),故由行列式判定知AAA可逆。(此时若用A−1A^{-1}A−1左乘AB=IAB=IAB=I,就得到B=A−1B=A^{-1}B=A−1,即这里的BBB只能是A−1A^{-1}A−1)
      【注1】该结论可以看做是逆矩阵的定义的弱化。本来逆矩阵要求AB=IAB=IAB=I且BA=IBA=IBA=I,但该结论说明只要AB=IAB=IAB=I就够了(同理可知如果满足BA=IBA=IBA=I也可推出AAA可逆且B=A−1B=A^{-1}B=A−1)。
      【注2】该结论的一个等价结论是“已知同阶方阵A,BA,BA,B,若AB=IAB=IAB=I,则BA=IBA=IBA=I”。
  • 逆矩阵的性质
    设A,B∈Fn×nA,B\in F^{n\times n}A,B∈Fn×n:

    • (A−1)−1=A(A^{-1})^{-1}=A(A−1)−1=A
    • (AT)−1=(A−1)T(A^T)^{-1}=(A^{-1})^T(AT)−1=(A−1)T
    • (AH)−1=(A−1)H(A^H)^{-1}=(A^{-1})^H(AH)−1=(A−1)H
    • (kA)−1=1kA−1,0≠k∈F(kA)^{-1}=\frac{1}{k}A^{-1},0\neq k\in F(kA)−1=k1​A−1,0​=k∈F
    • (An)−1=(A−1)n(A^n)^{-1}=(A^{-1})^n(An)−1=(A−1)n
    • (A∗)−1=(A−1)∗=A∣A∣(A^*)^{-1}=(A^{-1})^*=\frac{A}{|A|}(A∗)−1=(A−1)∗=∣A∣A​(n⩾2n\geqslant 2n⩾2)
    • (AB)−1=B−1A−1(AB)^{-1}=B^{-1}A^{-1}(AB)−1=B−1A−1
  • 特殊矩阵的逆矩阵
    • 若对角矩阵Σ=[λ1⋱λn]\Sigma=\begin{bmatrix}\lambda_1&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n\end{bmatrix}Σ=⎣⎡​λ1​​⋱​λn​​⎦⎤​可逆,则其逆矩阵为Σ−1=[λ1−1⋱λn−1]\Sigma^{-1}=\begin{bmatrix}\lambda_1^{-1}&\quad\\\quad&\ddots&\quad\\\quad&\quad&\lambda_n^{-1}\end{bmatrix}Σ−1=⎣⎡​λ1−1​​⋱​λn−1​​⎦⎤​。
    • 若上三角方阵可逆,则其逆矩阵为上三角方阵
    • 若下三角方阵可逆,则其逆矩阵为下三角方阵

关于逆矩阵的一个常用公式

  • 定理:设A∈Cm×m,U∈Cm×p,B∈Cp×q,V∈Cq×mA\in C^{m\times m},U\in C^{m\times p},B\in C^{p\times q},V\in C^{q\times m}A∈Cm×m,U∈Cm×p,B∈Cp×q,V∈Cq×m。若AAA可逆,则A+UBVA+UBVA+UBV可逆的充要条件为Ip+BVA−1UI_p+BVA^{-1}UIp​+BVA−1U可逆,且(A+UBV)−1=A−1−A−1U(Ip+BVA−1U)−1BVA−1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}BVA^{-1}(A+UBV)−1=A−1−A−1U(Ip​+BVA−1U)−1BVA−1
    证明:(该定理的证明需要用到特征值的相关结论,若这块不熟悉可先跳过,特征值相关可参考矩阵论(零):线性代数基础知识整理(5)——特征值与相似)
    由AAA可逆以及A+UBV=A(Im+A−1UBV)A+UBV=A(I_m+A^{-1}UBV)A+UBV=A(Im​+A−1UBV)知,A+UBVA+UBVA+UBV可逆的充要条件为Im+A−1UBVI_m+A^{-1}UBVIm​+A−1UBV可逆。令M=A−1U,N=BVM=A^{-1}U,N=BVM=A−1U,N=BV,由MNMNMN与NMNMNM有相同的非零特征值可知,Im+MNI_m+MNIm​+MN可逆⟺\iff⟺−1-1−1不是MNMNMN的特征值⟺\iff⟺−1-1−1不是NMNMNM的特征值⟺\iff⟺Ip+NMI_p+NMIp​+NM可逆。这就证明了A+UBVA+UBVA+UBV可逆的充要条件为Ip+BVA−1UI_p+BVA^{-1}UIp​+BVA−1U可逆。利用逆矩阵的定义容易验证公式(A+UBV)−1=A−1−A−1U(I+BVA−1U)−1BVA−1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I+BVA^{-1}U)^{-1}BVA^{-1}(A+UBV)−1=A−1−A−1U(I+BVA−1U)−1BVA−1的正确性。证毕。

该定理的如下推论较常见:

  • 推论1(Woodbury恒等式):设A∈Cm×m,U∈Cm×n,B∈Cn×n,V∈Cn×mA\in C^{m\times m},U\in C^{m\times n},B\in C^{n\times n},V\in C^{n\times m}A∈Cm×m,U∈Cm×n,B∈Cn×n,V∈Cn×m。若A,BA,BA,B可逆,则A+UBVA+UBVA+UBV可逆的充要条件为B−1+VA−1UB^{-1}+VA^{-1}UB−1+VA−1U可逆,且(A+UBV)−1=A−1−A−1U(B−1+VA−1U)−1VA−1(A+UBV)^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1}(A+UBV)−1=A−1−A−1U(B−1+VA−1U)−1VA−1
    证:显然该定理是上面的定理当BBB取可逆方阵时的特殊情形。由于BBB可逆且In+BVA−1U=B(B−1+VA−1U)I_n+BVA^{-1}U=B(B^{-1}+VA^{-1}U)In​+BVA−1U=B(B−1+VA−1U),故A+UBVA+UBVA+UBV可逆的充要条件为B−1+VA−1UB^{-1}+VA^{-1}UB−1+VA−1U可逆。(A+UBV)−1=A−1−A−1U(Ip+BVA−1U)−1(B−1)−1VA−1=A−1−A−1U(B−1+VA−1U)−1VA−1(A+UBV)^{-1}=A^{-1}-A^{-1}U(I_p+BVA^{-1}U)^{-1}(B^{-1})^{-1}VA^{-1}=A^{-1}-A^{-1}U(B^{-1}+VA^{-1}U)^{-1}VA^{-1}(A+UBV)−1=A−1−A−1U(Ip​+BVA−1U)−1(B−1)−1VA−1=A−1−A−1U(B−1+VA−1U)−1VA−1。
  • 推论2(Sherman-Morrison定理):设A∈Cn×nA\in C^{n\times n}A∈Cn×n可逆,u,v∈Cn,b∈Cu,v\in C^n,b\in Cu,v∈Cn,b∈C,则A+buvTA+buv^TA+buvT可逆的充要条件为1+bvTA−1u≠01+bv^TA^{-1}u\neq 01+bvTA−1u​=0,且(A+buvT)−1=A−1−bA−1uvTA−11+bvTA−1u(A+buv^T)^{-1}=A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u}(A+buvT)−1=A−1−1+bvTA−1ubA−1uvTA−1​
    证:显然该定理是上面的定理当BBB取1×11\times 11×1矩阵(即标量)时的特殊情形。证明略。
  • 推论3:设A∈Cn×nA\in C^{n\times n}A∈Cn×n可逆,u,v∈Cnu,v\in C^nu,v∈Cn,则A+uvTA+uv^TA+uvT可逆的充要条件为1+vTA−1u≠01+v^TA^{-1}u\neq 01+vTA−1u​=0,且(A+uvT)−1=A−1−A−1uvTA−11+vTA−1u(A+uv^T)^{-1}=A^{-1}-\frac{A^{-1}uv^TA^{-1}}{1+v^TA^{-1}u}(A+uvT)−1=A−1−1+vTA−1uA−1uvTA−1​
    证明:该定理是推论2当bbb取1时的特殊情形。证明略。

【注】上述诸结论是在复数域下给出的,然而,可以看出既然在复数域下证明了这些结论,那么其他数域下结论也成立。上述推论2和推论3由于结论更弱,有更简便的证法,感兴趣的读者可自行研究。下面提供推论2的一个简单证法作为参考。

  • 推论2的简单证法
    证:
    充分性:若1+bvTA−1u≠01+bv^TA^{-1}u\neq 01+bvTA−1u​=0,验证(A+buvT)(A−1−bA−1uvTA−11+bvTA−1u)=I(A+buv^T)(A^{-1}-\frac{bA^{-1}uv^TA^{-1}}{1+bv^TA^{-1}u})=I(A+buvT)(A−1−1+bvTA−1ubA−1uvTA−1​)=I即可。
    必要性:注意由A+buvT=(I+buvTA−1)AA+buv^T=(I+buv^TA^{-1})AA+buvT=(I+buvTA−1)A可推出I+buvTA−1I+buv^TA^{-1}I+buvTA−1可逆。假设1+bvTA−1u=01+bv^TA^{-1}u=01+bvTA−1u=0,则(I+buvTA−1)u=u+buvTA−1u=u−u=0(I+buv^TA^{-1})u=u+buv^TA^{-1}u=u-u=0(I+buvTA−1)u=u+buvTA−1u=u−u=0。注意1+bvTA−1u=01+bv^TA^{-1}u=01+bvTA−1u=0确保u≠0u\neq 0u​=0。这说明齐次线性方程组(I+buvTA−1)x=0(I+buv^TA^{-1})x=0(I+buvTA−1)x=0有非零解,这与I+buvTA−1I+buv^TA^{-1}I+buvTA−1可逆是矛盾的。因此假设不成立,得证。

初等变换与矩阵的秩

行最简形和列最简形

  • 矩阵A称为行最简形,若A的所有非零行都在零行的上面,A的每个非零行的首非零元是1,其列号随行号严格单调递增,且其所在列的其他元素均为零。
  • 矩阵A称为列最简形,若A的所有非零列都在零列的左面,A的每个非零列的首非零元是1,其行号随列号严格单调递增,且其所在行的其他元素均为零。

初等变换

初等行(列)变换有三种:

  • 行(列)互换变换:互换矩阵的第i行(列)和第j行(列),i≠ji\neq ji​=j
  • 行(列)倍乘变换:用非零常数k∈Fk\in Fk∈F乘矩阵的某一行(列)的每个元素
  • 行(列)倍加变换:将矩阵的第i行(列)的k倍(k∈F)(k\in{F})(k∈F)加到第j行(列),i≠ji\neq ji​=j

初等行变换和初等列变换统称为初等变换。

初等矩阵

  • 定义:对单位矩阵只作1次初等行(列)变换得到的矩阵称为初等矩阵,初等矩阵也有三种,对应分别为互换初等矩阵、倍乘初等矩阵、倍加初等矩阵
    【注】初等矩阵都是可逆的
  • 定理:设A∈Fm×nA\in F^{m\times{n}}A∈Fm×n,对A施行1次初等行变换,其结果等同于给A的左边乘上一个相应的m阶初等矩阵(对单位矩阵施行1次相同的初等行变换得到的矩阵);对A施行1次初等列变换,其结果等同于给A的右边乘上一个相应的n阶初等矩阵(对单位矩阵施行1次相同的初等列变换得到的矩阵)
  • 定理:(可逆矩阵与初等矩阵的关系)方阵A是可逆矩阵的充要条件是A可以写成若干初等矩阵的积
  • 定理:任意矩阵A可通过有限次初等行变换化为唯一的一个行最简形,称为A的行最简形;也可通过有限次初等列变换化为唯一的一个列最简形,称为A的列最简形;即存在可逆矩阵P、Q使得PA是A的行最简形,AQ是A的列最简形

行等价与列等价

  • 定义:若矩阵A可经过若干次初等行(列)变换得到矩阵B,则称A与B行(列)等价
  • 定义:若矩阵A可经过若干次初等变换得到矩阵B,则称A与B等价
  • 定理:A与B行等价的充要条件为存在可逆矩阵P使得PA=BPA=BPA=B;A与B列等价的充要条件为存在可逆矩阵Q使得A=BQA=BQA=BQ;A与B等价的充要条件为存在可逆矩阵P和Q使得PAQ=BPAQ=BPAQ=B
    证:由可逆矩阵的充要条件是其可被写成若干初等矩阵的积即证。

矩阵的秩及其性质

  • 定义:矩阵A的最高阶非零子式的阶数称为A的秩,记为r(A)或rank(A);当A没有非零子式(即A=OA=OA=O)时,定义r(A)=0r(A)=0r(A)=0
  • 定理:r(AH)=r(AT)=r(A)r(A^H)=r(A^T)=r(A)r(AH)=r(AT)=r(A)
  • 定义:设A∈Fm×nA\in F^{m\times n}A∈Fm×n,若r(A)=nr(A)=nr(A)=n,则称A是列满秩矩阵;若r(A)=mr(A)=mr(A)=m,则称A是行满秩矩阵;若r(A)=m=nr(A)=m=nr(A)=m=n,则称A是满秩方阵,显然满秩方阵就是可逆矩阵
  • 定理:初等行(列)变换不改变矩阵的秩
  • 定理:r(PA)=r(AQ)=r(A)r(PA)=r(AQ)=r(A)r(PA)=r(AQ)=r(A),其中P、Q是可逆矩阵
    证:可逆矩阵可写成若干初等矩阵的积,故PAPAPA相当于对AAA做若干次初等行变换,AQAQAQ相当于对AAA做若干次初等列变换,又因为初等变换不改变矩阵的秩,故结论成立。
  • 定义:设A∈Fm×n,r(A)=rA\in F^{m\times{n}},r(A)=rA∈Fm×n,r(A)=r,A的秩标准形(又称等价标准形、相抵标准形)定义为[IrOOO]\begin{bmatrix}I_r&O\\O&O\end{bmatrix}[Ir​O​OO​]
  • 定理:(等价标准形定理/相抵标准形定理/秩标准形定理)任意秩为r的矩阵A可经有限次初等变换化为A的秩标准形;即存在可逆矩阵P、Q使得PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}PAQ=[Ir​O​OO​]
  • 定理:列满秩矩阵可经有限次初等行变换化为它的秩标准形,行满秩矩阵可经有限次初等列变换化为它的秩标准形
  • 定理:同型矩阵AAA与BBB等价的充要条件为r(A)=r(B)=rr(A)=r(B)=rr(A)=r(B)=r
    【注】所谓同型矩阵就是指两个矩阵的大小(或规格)一样,即若AAA是m×nm\times nm×n的,则BBB也是m×nm\times nm×n的。
    证:
    充分性显然。
    必要性:由秩标准形定理,存在可逆矩阵P1,Q1,P2,Q2P_1,Q_1,P_2,Q_2P1​,Q1​,P2​,Q2​使得P1AQ1=P2BQ2=[IrOOO]P_1AQ_1=P_2BQ_2=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}P1​AQ1​=P2​BQ2​=[Ir​O​OO​],故(P2−1P1)A(Q1Q2−1)=B(P_2^{-1}P_1)A(Q_1Q_2^{-1})=B(P2−1​P1​)A(Q1​Q2−1​)=B,即A与B等价。
  • 可逆方阵A求逆的方法:对[IA]\begin{bmatrix}I&A\end{bmatrix}[I​A​]进行初等行变换把A化成单位矩阵,则单位矩阵III就被自然地化成了A−1A^{-1}A−1。
    分析:设[IA]\begin{bmatrix}I&A\end{bmatrix}[I​A​]经上述变换得到的结果为[BI]\begin{bmatrix}B&I\end{bmatrix}[B​I​]。存在可逆矩阵P使得P[IA]=[BI]P\begin{bmatrix}I&A\end{bmatrix}=\begin{bmatrix}B&I\end{bmatrix}P[I​A​]=[B​I​],即P=BP=BP=B且PA=IPA=IPA=I,故B=P=A−1B=P=A^{-1}B=P=A−1,即原本的单位矩阵III自然地化成了A−1A^{-1}A−1。
  • 定理:r(BA)=r(AC)=r(A)r(BA)=r(AC)=r(A)r(BA)=r(AC)=r(A),其中B是列满秩矩阵,C是行满秩矩阵
    证:
    由B列满秩,C行满秩知,存在可逆矩阵P,Q使得PB=[IO],CQ=[IO]PB=\begin{bmatrix}I\\O\end{bmatrix},CQ=\begin{bmatrix}I&O\end{bmatrix}PB=[IO​],CQ=[I​O​],故r(BA)=r(P−1[IO]A)=r([AO])=r(A)r(BA)=r(P^{-1}\begin{bmatrix}I\\O\end{bmatrix}A)=r(\begin{bmatrix}A\\O\end{bmatrix})=r(A)r(BA)=r(P−1[IO​]A)=r([AO​])=r(A),r(AC)=r(A[IO]Q−1)=r([AO])=r(A)r(AC)=r(A\begin{bmatrix}I&O\end{bmatrix}Q^{-1})=r(\begin{bmatrix}A&O\end{bmatrix})=r(A)r(AC)=r(A[I​O​]Q−1)=r([A​O​])=r(A)。

分块矩阵的初等变换

分块矩阵是研究矩阵必不可少的工具,要想深入学习线性代数和矩阵论,一方面要学好线性空间与线性算子,另一方面要学好分块矩阵。一些较为深入的结论,有时从线性空间角度看更直观,有时从分块矩阵的角度看更直观。分块矩阵的基本运算请参考线性代数(四)-矩阵分块法。
分块矩阵的初等变换,又称广义初等变换,可以用来解决一些较为深入的秩的定理,还在相似、合同理论中有重要的应用。
所谓分块矩阵的初等变换,实际上是对分块矩阵进行多次初等变换,使结果整体上来看相当于变换的是矩阵的子块。下面看一个例子:

  • 定理:设A∈Fm×nA\in F^{m\times n}A∈Fm×n按行分块为A=[BC]A=\begin{bmatrix}B\\C\end{bmatrix}A=[BC​],其中B∈Fm1×n,C∈Fm2×n,m1+m2=mB\in F^{m_1\times n},C\in F^{m_2\times n},m_1+m_2=mB∈Fm1​×n,C∈Fm2​×n,m1​+m2​=m,矩阵D∈Fm2×m1D\in F^{m_2\times m_1}D∈Fm2​×m1​。则可对AAA进行若干次初等行变换(具体地,行倍加变换),使其变为[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix}[BC+DB​]
    证:
    注意到C+DBC+DBC+DB的第i行为ci+diB=ci+∑j=1m1dijbjc_i+d_iB=c_i+\sum_{j=1}^{m_1}d_{ij}b_jci​+di​B=ci​+∑j=1m1​​dij​bj​,其中ci,dic_i,d_ici​,di​分别是C,DC,DC,D的第i行,bjb_jbj​是BBB的第j行。于是只要依次将BBB的第1行的di1d_{i1}di1​倍、第2行的di2d_{i2}di2​倍、……、第m1m_1m1​行的dim1d_{im_1}dim1​​倍加到CCC的第i行,就将CCC的第i行变成了C+DBC+DBC+DB的第i行。对i=1,2,...,m2i=1,2,...,m_2i=1,2,...,m2​依次实施上述的一系列行倍加变换,就将AAA变成了[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix}[BC+DB​]。

上面这个例子中,通过多次的初等行倍加变换,将AAA的子块CCC变成了C+DBC+DBC+DB,即加上了AAA的另一个子块BBB的DDD倍(注意DDD是乘在左边的),而这个“倍数”DDD是没有限制的,这个DDD无论怎么取,都能够找到上述一系列初等行倍加变换以完成子块CCC的整体变换。这种“神奇”的技巧在理论分析时很有用,尤其是当你可以用这个技巧把矩阵的某个子块变成零矩阵时,能大大降低计算的难度。通过初等变换把一个矩阵的某个子块变成零矩阵的技术被称作分块消元法,俗称矩阵打洞术。(听说数学家华罗庚和他的学生就十分擅长这类技巧)

我们已经知道对矩阵实施一次初等行变换与在其左边乘相应的初等矩阵的效果是等同的,如果进行一系列初等行变换,那么就相当于在左边乘一个可逆矩阵,那么上述例子中对应的可逆矩阵是什么呢?

实际上,设对某矩阵AAA进行共kkk次初等行变换,得到矩阵GGG,变换对应的初等矩阵分别为P1,P2,...,PkP_1,P_2,...,P_kP1​,P2​,...,Pk​,则PkPk−1...P1A=GP_kP_{k-1}...P_1A=GPk​Pk−1​...P1​A=G,即对应在AAA的左边乘了个可逆矩阵P=PkPk−1...P1P=P_kP_{k-1}...P_1P=Pk​Pk−1​...P1​。而PkPk−1...P1=PkPk−1...P1IP_kP_{k-1}...P_1=P_kP_{k-1}...P_1IPk​Pk−1​...P1​=Pk​Pk−1​...P1​I,所以可逆矩阵PPP实际上就是对单位矩阵也实施同样的kkk次初等行变换的结果。
据此,上述例子中对应的可逆矩阵就应是[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}[Em1​​D​OEm2​​​](可以这样想:对[BC]\begin{bmatrix}B\\C\end{bmatrix}[BC​]实施一系列初等行变换后得到的是[BC+DB]\begin{bmatrix}B\\C+DB\end{bmatrix}[BC+DB​],效果就是给CCC加上了BBB的DDD倍,那么对单位矩阵[Em1OOEm2]\begin{bmatrix}E_{m_1}&O\\O&E_{m_2}\end{bmatrix}[Em1​​O​OEm2​​​]实施相同的初等行变换后,效果应该是相同的,即给[OEm2]\begin{bmatrix}O&E_{m_2}\end{bmatrix}[O​Em2​​​]加上[Em1O]\begin{bmatrix}E_{m_1}&O\end{bmatrix}[Em1​​​O​]的DDD倍,于是得到[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}[Em1​​D​OEm2​​​])。验证一下,根据行列式的拉普拉斯展开式,[Em1ODEm2]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}[Em1​​D​OEm2​​​]确实是一个可逆矩阵,根据分块矩阵乘法,[Em1ODEm2][BC]=[BC+DB]\begin{bmatrix}E_{m_1}&O\\D&E_{m_2}\end{bmatrix}\begin{bmatrix}B\\C\end{bmatrix}=\begin{bmatrix}B\\C+DB\end{bmatrix}[Em1​​D​OEm2​​​][BC​]=[BC+DB​]确实成立。

前面说过三种初等行(列)变换对应三种初等矩阵,类比一下,对分块矩阵实施三种分块行初等变换就对应于在原矩阵的左边乘三种分块初等矩阵,类似地,对分块矩阵实施三种分块列初等变换就对应于在原矩阵的右边乘三种分块初等矩阵

三种分块初等矩阵是指(为简单起见,以下只给出了四分块的情形):
分块倍加阵[Em1OCEm2]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}[Em1​​C​OEm2​​​]或[Em1COEm2]\begin{bmatrix}E_{m_1}&C\\O&E_{m_2}\end{bmatrix}[Em1​​O​CEm2​​​];
分块倍乘阵[COOE]\begin{bmatrix}C&O\\O&E\end{bmatrix}[CO​OE​]或[EOOC]\begin{bmatrix}E&O\\O&C\end{bmatrix}[EO​OC​],其中CCC可逆;
分块互换阵[OEm2Em1O]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}[OEm1​​​Em2​​O​]。
【注】分块初等矩阵并不是初等矩阵,初等矩阵是单位矩阵进行一次初等变换得到的,而分块初等矩阵需要单位矩阵经过多次初等变换才能得到

分块行初等变换:

  • 分块行倍加变换:[Em1OCEm2][Am1×nBm2×n]=[AB+CA]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}A\\B+CA\end{bmatrix}[Em1​​C​OEm2​​​][Am1​×n​Bm2​×n​​]=[AB+CA​]
    (相当于给BBB加上了AAA的CCC倍,注意“倍数”CCC乘在了AAA的左边)
  • 分块行倍乘变换:[COOE][AB]=[CAB]\begin{bmatrix}C&O\\O&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}CA\\B\end{bmatrix}[CO​OE​][AB​]=[CAB​],其中CCC是可逆的
    (相当于给AAA乘上了CCC倍,注意“倍数”CCC乘在了AAA的左边)
  • 分块行互换变换:[OEm2Em1O][Am1×nBm2×n]=[BA]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}\begin{bmatrix}A_{m_1\times n}\\B_{m_2\times n}\end{bmatrix}=\begin{bmatrix}B\\A\end{bmatrix}[OEm1​​​Em2​​O​][Am1​×n​Bm2​×n​​]=[BA​]
    (相当于把子块AAA和BBB交换了一下)

分块列初等变换:

  • 分块列倍加变换:[An×m1Bn×m2][Em1OCEm2]=[A+BCB]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}=\begin{bmatrix}A+BC&B\end{bmatrix}[An×m1​​​Bn×m2​​​][Em1​​C​OEm2​​​]=[A+BC​B​]
    (相当于给AAA加上了BBB的CCC倍,注意“倍数”CCC乘在了BBB的右边)
  • 分块列倍乘变换:[An×m1Bn×m2][COOEm2]=[ACB]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}=\begin{bmatrix}AC&B\end{bmatrix}[An×m1​​​Bn×m2​​​][CO​OEm2​​​]=[AC​B​],其中CCC是可逆的
    (相当于给AAA乘上了CCC倍,注意“倍数”CCC乘在了AAA的右边)
  • 分块列互换变换:[An×m1Bn×m2][OEm2Em1O]=[BA]\begin{bmatrix}A_{n\times m_1}&B_{n\times m_2}\end{bmatrix}\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}=\begin{bmatrix}B&A\end{bmatrix}[An×m1​​​Bn×m2​​​][OEm1​​​Em2​​O​]=[B​A​]
    (相当于把子块AAA和BBB交换了一下)

正如上面的定理指出的,一次分块倍加变换可通过多次一般的倍加变换完成。一次分块互换变换也可通过多次一般的互换变换完成。但是一次分块倍乘变换不一定可由多次一般的倍乘变换完成,而是在同一个子块内灵活地运用三种初等变换,关于这一点读者可自行研究。因为分块初等变换实际上不过是执行了多次一般的初等变换而已,所以分块初等变换均不改变矩阵的秩。此外,分块倍加变换不改变矩阵的行列式的值。

矩阵打洞技巧

这里列举几个常常碰到的矩阵打洞的情形,具体的用法请参考后文以及后面的博客。(以分块行初等变换为例)

  • [BAB]\begin{bmatrix}B\\AB\end{bmatrix}[BAB​]:给子块ABABAB加上子块BBB的−A-A−A倍,就能把ABABAB消掉。[EO−AE][BAB]=[BO]\begin{bmatrix}E&O\\-A&E\end{bmatrix}\begin{bmatrix}B\\AB\end{bmatrix}=\begin{bmatrix}B\\O\end{bmatrix}[E−A​OE​][BAB​]=[BO​]
  • [AB]\begin{bmatrix}A\\B\end{bmatrix}[AB​]:如果AAA可逆,则无论BBB是什么都能消掉BBB。[EO−BA−1E][AB]=[AO]\begin{bmatrix}E&O\\-BA^{-1}&E\end{bmatrix}\begin{bmatrix}A\\B\end{bmatrix}=\begin{bmatrix}A\\O\end{bmatrix}[E−BA−1​OE​][AB​]=[AO​]

暂时这两个,想到不一样的再补充~~

方阵乘积的行列式公式
  • 定理:设A,B∈Fn×nA,B\in F^{n\times n}A,B∈Fn×n,则det(AB)=det(A)det(B)det(AB)=det(A)det(B)det(AB)=det(A)det(B)
    证:
    对分块矩阵做如下初等变换:[ABOOIn]→行倍加[ABAOIn]→列倍加[OA−BIn]\begin{bmatrix}AB&O\\O&I_n\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}AB&A\\O&I_n\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}O&A\\-B&I_n\end{bmatrix}[ABO​OIn​​]→行倍加[ABO​AIn​​]→列倍加[O−B​AIn​​]因为倍加变换不改变行列式的值,所以应用拉普拉斯公式就有det(AB)=det[ABOOIn]=det[OA−BIn]=(−1)n2det(A)det(−B)=det(A)det(B)det(AB)=det\begin{bmatrix}AB&O\\O&I_n\end{bmatrix}=det\begin{bmatrix}O&A\\-B&I_n\end{bmatrix}\\=(-1)^{n^2}det(A)det(-B)=det(A)det(B)det(AB)=det[ABO​OIn​​]=det[O−B​AIn​​]=(−1)n2det(A)det(−B)=det(A)det(B)
分块矩阵的逆

分块初等矩阵的逆:

  • [Em1OCEm2]−1=[Em1O−CEm2]\begin{bmatrix}E_{m_1}&O\\C&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}E_{m_1}&O\\-C&E_{m_2}\end{bmatrix}[Em1​​C​OEm2​​​]−1=[Em1​​−C​OEm2​​​]
  • [COOEm2]−1=[C−1OOEm2]\begin{bmatrix}C&O\\O&E_{m_2}\end{bmatrix}^{-1}=\begin{bmatrix}C^{-1}&O\\O&E_{m_2}\end{bmatrix}[CO​OEm2​​​]−1=[C−1O​OEm2​​​],其中CCC可逆
  • [OEm2Em1O]−1=[OEm1Em2O]\begin{bmatrix}O&E_{m_2}&\\E_{m_1}&O\end{bmatrix}^{-1}=\begin{bmatrix}O&E_{m_1}&\\E_{m_2}&O\end{bmatrix}[OEm1​​​Em2​​O​]−1=[OEm2​​​Em1​​O​]

分块矩阵的逆的一般公式由以下结论导出:

  • 定理:设A∈Fm×mA\in F^{m\times m}A∈Fm×m可逆,D∈Fn×nD\in F^{n\times n}D∈Fn×n,则[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}[AC​BD​]可逆的充要条件为M=D−CA−1BM=D-CA^{-1}BM=D−CA−1B可逆,且[ABCD]−1=[A−1+A−1DM−1CA−1−A−1DM−1−M−1CA−1M−1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}A^{-1}+A^{-1}DM^{-1}CA^{-1}&-A^{-1}DM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix}[AC​BD​]−1=[A−1+A−1DM−1CA−1−M−1CA−1​−A−1DM−1M−1​]
    证:
    [ABCD]→行倍加[ABOD−CA−1B]→列倍加[AOOD−CA−1B]\begin{bmatrix}A&B\\C&D\end{bmatrix}\overset{\text{行倍加}}{\rightarrow}\begin{bmatrix}A&B\\O&D-CA^{-1}B\end{bmatrix}\overset{\text{列倍加}}{\rightarrow}\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix}[AC​BD​]→行倍加[AO​BD−CA−1B​]→列倍加[AO​OD−CA−1B​]由倍加变换不改变行列式的值,得det[ABCD]=det[AOOD−CA−1B]=det(A)det(M)det\begin{bmatrix}A&B\\C&D\end{bmatrix}=det\begin{bmatrix}A&O\\O&D-CA^{-1}B\end{bmatrix}=det(A)det(M)det[AC​BD​]=det[AO​OD−CA−1B​]=det(A)det(M)故det[ABCD]≠0det\begin{bmatrix}A&B\\C&D\end{bmatrix}\neq 0det[AC​BD​]​=0的充要条件为det(M)≠0det(M)\neq 0det(M)​=0,得证。
    将上述初等变换用分块初等矩阵写出就是[EmO−CA−1En][ABCD][Em−A−1BOEn]=[AOOM]\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\begin{bmatrix}A&B\\C&D\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}=\begin{bmatrix}A&O\\O&M\end{bmatrix}[Em​−CA−1​OEn​​][AC​BD​][Em​O​−A−1BEn​​]=[AO​OM​]于是[ABCD]−1=([EmO−CA−1En]−1[AOOM][Em−A−1BOEn]−1)−1=[Em−A−1BOEn][A−1OOM−1][EmO−CA−1En]=[A−1+A−1BM−1CA−1−A−1BM−1−M−1CA−1M−1]\begin{aligned}\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}&=\left(\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}^{-1}\begin{bmatrix}A&O\\O&M\end{bmatrix}\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}^{-1}\right)^{-1}\\&=\begin{bmatrix}E_{m}&-A^{-1}B\\O&E_{n}\end{bmatrix}\begin{bmatrix}A^{-1}&O\\O&M^{-1}\end{bmatrix}\begin{bmatrix}E_{m}&O\\-CA^{-1}&E_{n}\end{bmatrix}\\&=\begin{bmatrix}A^{-1}+A^{-1}BM^{-1}CA^{-1}&-A^{-1}BM^{-1}\\-M^{-1}CA^{-1}&M^{-1}\end{bmatrix}\end{aligned}[AC​BD​]−1​=([Em​−CA−1​OEn​​]−1[AO​OM​][Em​O​−A−1BEn​​]−1)−1=[Em​O​−A−1BEn​​][A−1O​OM−1​][Em​−CA−1​OEn​​]=[A−1+A−1BM−1CA−1−M−1CA−1​−A−1BM−1M−1​]​可以使用逆矩阵的定义验证一下上式是否正确。

同理可得

  • 定理:设D∈Fn×nD\in F^{n\times n}D∈Fn×n可逆,A∈Fm×mA\in F^{m\times m}A∈Fm×m,则[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}[AC​BD​]可逆的充要条件为M=A−BD−1CM=A-BD^{-1}CM=A−BD−1C可逆,且[ABCD]−1=[M−1−M−1BD−1−D−1CM−1D−1+D−1CM−1BD−1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}M^{-1}&-M^{-1}BD^{-1}\\-D^{-1}CM^{-1}&D^{-1}+D^{-1}CM^{-1}BD^{-1}\end{bmatrix}[AC​BD​]−1=[M−1−D−1CM−1​−M−1BD−1D−1+D−1CM−1BD−1​]
  • 定理:设B∈Fm×mB\in F^{m\times m}B∈Fm×m可逆,C∈Fn×nC\in F^{n\times n}C∈Fn×n,则[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}[AC​BD​]可逆的充要条件为M=C−DB−1AM=C-DB^{-1}AM=C−DB−1A可逆,且[ABCD]−1=[−M−1DB−1M−1B−1+B−1AM−1DB−1−B−1AM−1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-M^{-1}DB^{-1}&M^{-1}\\B^{-1}+B^{-1}AM^{-1}DB^{-1}&-B^{-1}AM^{-1}\end{bmatrix}[AC​BD​]−1=[−M−1DB−1B−1+B−1AM−1DB−1​M−1−B−1AM−1​]
  • 定理:设C∈Fn×nC\in F^{n\times n}C∈Fn×n可逆,B∈Fm×mB\in F^{m\times m}B∈Fm×m,则[ABCD]\begin{bmatrix}A&B\\C&D\end{bmatrix}[AC​BD​]可逆的充要条件为M=B−AC−1DM=B-AC^{-1}DM=B−AC−1D可逆,且[ABCD]−1=[−C−1DM−1C−1+C−1DM−1AC−1M−1−M−1AC−1]\begin{bmatrix}A&B\\C&D\end{bmatrix}^{-1}=\begin{bmatrix}-C^{-1}DM^{-1}&C^{-1}+C^{-1}DM^{-1}AC^{-1}\\M^{-1}&-M^{-1}AC^{-1}\end{bmatrix}[AC​BD​]−1=[−C−1DM−1M−1​C−1+C−1DM−1AC−1−M−1AC−1​]
分块矩阵的秩

分块矩阵是研究矩阵的秩的重要工具,从分块矩阵的视角证明秩的结论往往非常简便。这里先给出一些基本结论:

  • 定理:r[AOOB]=r[OABO]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r\begin{bmatrix}O&A\\B&O\end{bmatrix}=r(A)+r(B)r[AO​OB​]=r[OB​AO​]=r(A)+r(B),其中A,B是任意大小的矩阵
    证:(以r[AOOB]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B)r[AO​OB​]=r(A)+r(B)为例)
    由矩阵的秩的定义,A,B中最高阶非零子式的阶数分别为r(A),r(B)r(A),r(B)r(A),r(B),分别设这两个子式为∣A1∣,∣B1∣|A_1|,|B_1|∣A1​∣,∣B1​∣,则∣A1OOB1∣\begin{vmatrix}A_1&O\\O&B_1\end{vmatrix}∣∣∣∣​A1​O​OB1​​∣∣∣∣​是[AOOB]\begin{bmatrix}A&O\\O&B\end{bmatrix}[AO​OB​]的一个非零子式,故它的秩至少为r(A)+r(B)。显然任意阶数大于r(A)+r(B)的子式也具有∣A2OOB2∣\begin{vmatrix}A_2&O\\O&B_2\end{vmatrix}∣∣∣∣​A2​O​OB2​​∣∣∣∣​的形式(其中A2A_2A2​,B2B_2B2​的阶数有可能为零),且要么A2A_2A2​的阶数大于r(A)r(A)r(A),要么B2B_2B2​的阶数大于r(B)r(B)r(B),即det(A2)=0det(A_2)=0det(A2​)=0或det(B2)=0det(B_2)=0det(B2​)=0,故由拉普拉斯展开式得∣A2OOB2∣=det(A2)det(B2)=0\begin{vmatrix}A_2&O\\O&B_2\end{vmatrix}=det(A_2)det(B_2)=0∣∣∣∣​A2​O​OB2​​∣∣∣∣​=det(A2​)det(B2​)=0,这就证明了r[AOOB]=r(A)+r(B)r\begin{bmatrix}A&O\\O&B\end{bmatrix}=r(A)+r(B)r[AO​OB​]=r(A)+r(B)。
  • 定理:r[AOOB]⩽r[AO∗B]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix}r[AO​OB​]⩽r[A∗​OB​],r[AOOB]⩽r[A∗OB]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&*\\O&B\end{bmatrix}r[AO​OB​]⩽r[AO​∗B​]
    证:(以r[AOOB]⩽r[AO∗B]r\begin{bmatrix}A&O\\O&B\end{bmatrix}\leqslant r\begin{bmatrix}A&O\\*&B\end{bmatrix}r[AO​OB​]⩽r[A∗​OB​]为例)
    由拉普拉斯展开式知,[AOOB]\begin{bmatrix}A&O\\O&B\end{bmatrix}[AO​OB​]的一个最高阶非零子式∣A1OOB1∣\begin{vmatrix}A_1&O\\O&B_1\end{vmatrix}∣∣∣∣​A1​O​OB1​​∣∣∣∣​对应于[AO∗B]\begin{bmatrix}A&O\\*&B\end{bmatrix}[A∗​OB​]中的子式∣A1O∗B1∣\begin{vmatrix}A_1&O\\*&B_1\end{vmatrix}∣∣∣∣​A1​∗​OB1​​∣∣∣∣​也非零,故结论成立。
  • 定理:r[OABO]⩽r[OAB∗]r\begin{bmatrix}O&A\\B&O\end{bmatrix}\leqslant r\begin{bmatrix}O&A\\B&*\end{bmatrix}r[OB​AO​]⩽r[OB​A∗​],r[OABO]⩽r[∗ABO]r\begin{bmatrix}O&A\\B&O\end{bmatrix}\leqslant r\begin{bmatrix}*&A\\B&O\end{bmatrix}r[OB​AO​]⩽r[∗B​AO​]
    证:与上同理。

满秩分解

  • 定义:设矩阵A∈Frm×nA\in{F^{m\times{n}}_r}A∈Frm×n​(即A是秩为r的m×nm\times{n}m×n矩阵),若存在列满秩矩阵K∈Frm×rK\in{F^{m\times{r}}_r}K∈Frm×r​和行满秩矩阵L∈Frr×nL\in{F^{r\times{n}}_r}L∈Frr×n​使得A=KLA=KLA=KL,则称A=KLA=KLA=KL是A的一个满秩分解
  • 定理:设矩阵A∈Frm×nA\in{F^{m\times{n}}_r}A∈Frm×n​,若r>0r\gt{0}r>0,则A的满秩分解必存在
    证明:
    由相抵标准形定理,存在m阶可逆矩阵P和n阶可逆矩阵Q使得PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}PAQ=[Ir​O​OO​],则A=P−1[IrOOO]Q−1=P−1[IrO][IrO]Q−1A=P^{-1}\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}A=P−1[Ir​O​OO​]Q−1=P−1[Ir​O​][Ir​​O​]Q−1。设K=P−1[IrO]K=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}K=P−1[Ir​O​],L=[IrO]Q−1L=\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}L=[Ir​​O​]Q−1,则K是列满秩矩阵,L是行满秩矩阵,且A=KLA=KLA=KL,故A=KLA=KLA=KL是A的一个满秩分解。得证。
  • 满秩分解的快速算法
    设A=[a1a2⋯an]∈Frm×n,r>0A=\begin{bmatrix}a_1&a_2&\cdots&a_n\end{bmatrix}\in{F^{m\times{n}}_r},r\gt{0}A=[a1​​a2​​⋯​an​​]∈Frm×n​,r>0的行最简形的前r行构成的矩阵为L,L的第i行的首非零元在L的第jij_iji​列,设K=[aj1aj2⋯ajr]K=\begin{bmatrix}a_{j_1}&&a_{j_2}&\cdots&a_{j_r}\end{bmatrix}K=[aj1​​​​aj2​​​⋯​ajr​​​],则A=KLA=KLA=KL是A的一个满秩分解。
    证明:
    存在可逆矩阵P、Q使得PAPAPA是A的行最简形,且PAQ=[IrOOO]PAQ=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}PAQ=[Ir​O​OO​]。由于PA=[IrOOO]Q−1=[[IrO]Q−1O]PA=\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=\begin{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}\\O\end{bmatrix}PA=[Ir​O​OO​]Q−1=[[Ir​​O​]Q−1O​],所以L=[IrO]Q−1L=\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}L=[Ir​​O​]Q−1,显然L是行满秩的。设e1,e2,...,en∈Fne_1,e_2,...,e_n\in F^ne1​,e2​,...,en​∈Fn,其中eie_iei​是第i个标准向量,eie_iei​的第iii个元素为1,其他元素为零。设Z=[ej1ej2⋯ejr]Z=\begin{bmatrix}e_{j_1}&e_{j_2}\cdots&e_{j_r}\end{bmatrix}Z=[ej1​​​ej2​​⋯​ejr​​​],由行最简形的定义易知PAZ=[IrO]PAZ=\begin{bmatrix}I_r\\O\end{bmatrix}PAZ=[Ir​O​],故AZ=P−1[IrO]AZ=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}AZ=P−1[Ir​O​]。由矩阵K的定义知K=AZK=AZK=AZ,故实际上K=P−1[IrO]K=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}K=P−1[Ir​O​],且K是列满秩的。因为KL=P−1[IrO][IrO]Q−1=P−1[IrOOO]Q−1=AKL=P^{-1}\begin{bmatrix}I_r\\O\end{bmatrix}\begin{bmatrix}I_r&O\end{bmatrix}Q^{-1}=P^{-1}\begin{bmatrix}I_r&O\\O&O\end{bmatrix}Q^{-1}=AKL=P−1[Ir​O​][Ir​​O​]Q−1=P−1[Ir​O​OO​]Q−1=A,故A=KLA=KLA=KL是A的一个满秩分解。
    【注】上述定理说明,满秩分解无需求出可逆矩阵P和Q,只需对A进行初等行变换化为行最简形,利用A的行最简形和A本身就能得出结果。

矩阵论(零):线性代数基础知识整理(1)——逆矩阵、(广义)初等变换、满秩分解相关推荐

  1. 矩阵论(零):线性代数基础知识整理(5)——特征值与相似

    矩阵论专栏:专栏(文章按照顺序排序) 本篇博客的上篇是矩阵论(零):线性代数基础知识整理(4)--线性空间与线性变换,梳理了线性空间与线性变换的相关内容.本文主要整理矩阵的特征值与相似的相关内容. 方 ...

  2. 矩阵论(零):线性代数基础知识整理(2)——矩阵的秩与向量组的秩

    矩阵论专栏:专栏(文章按照顺序排序) 本篇博客承接上篇矩阵论(零):线性代数基础知识整理(1)--逆矩阵.初等变换.满秩分解,主要整理秩相关的结论. 线性方程组的解与向量组的秩 线性方程组的解(初步讨 ...

  3. 线性代数基础知识整理

    线性代数基础知识 因为总是忘记线代的一些基础知识,因此在这里整理记录一下. 1.常见的特殊矩阵 1.1.正交矩阵 定义:对于一个n维矩阵A,若满足以下条件,则A为正交矩阵. A A T = I n A ...

  4. 吴恩达机器学习【第三天】线性代数基础知识

    前言:昨天又偷懒了,学到一半就跑了 之前觉得机器学习对线性代数的要求很高,但是在这个课程中,老师给出的线性代数基础知识,却很少,更多是强调应用. 文章目录 矩阵是什么 矩阵的加法和减法[与常数相乘] ...

  5. CSP-S初赛基础知识整理

    文章目录 CSP-S初赛基础知识整理 RT [1]计算机基础知识 计算机系统的组成 计算机硬件的五大组成 [1-2]进制及其转化和运算 [1-2]二进制 [1]基本定义及应用 [1]基本运算 [2]位 ...

  6. 电学基础知识整理(一)

    电学基础知识整理(一) 电荷及其守恒定律 电荷 电荷量 库伦定律 电场 电场概念 电场强度 电场线 电势能与电势 静电场做功 势能与做功的关系 电势能(E~p~) 电势(φ) 等势面 电势差(电压) ...

  7. python常用变量名_python基础知识整理

    Python Python开发 Python语言 python基础知识整理 序言:本文简单介绍python基础知识的一些重要知识点,用于总结复习,每个知识点的具体用法会在后面的博客中一一补充程序: 一 ...

  8. 计算机二级c语基础知识,计算机二级C语基础知识整理.doc

    计算机二级C语基础知识整理 1.1 算法 算法:是一组有穷指令集,是解题方案的准确而完整的描述.通俗地说,算法就是计算机解题的过程.算法不等于程序,也不等于计算方法,程序的编制不可能优于算法的设计. ...

  9. 使用Aspose.Cells的基础知识整理

    使用Aspose.Cells的基础知识整理 转自 http://www.cnblogs.com/kenblove/archive/2009/01/07/1371104.html 这两天用Aspose. ...

最新文章

  1. 干货丨一文看懂人工智能、机器学习和深度学习的区别与联系
  2. PCB工艺的一些小原则
  3. 成都计算机大专学校公办,成都设有计算机应用技术的公办大专学校
  4. mysql创建表时显示错误_MYSQL创建表出现错误 ERROR Code 1118如何解决
  5. Oracle INTERVAL
  6. windows下安装virtual box(ubuntu)
  7. 视频造假_如何发现“深造假”面部切换视频
  8. 一种巧妙且简单的数据增强方法 - MixUp 小综述
  9. Maya批量随机替代插件BatchReplacerV1.0.2 下载及教程
  10. 连续状态空间模型离散化
  11. grep命令,sed命令和awk命令
  12. java 富文本 过滤xss_富文本XSS过滤
  13. 全套汽车标志,好不容易找到的哦
  14. 安旭生物科创板上市:曾遭弃购1400万元,凌世生夫妇控制60%股份
  15. springcloud gateway + nacos 遇到503错误
  16. bootstrap3-dialog 使用说明
  17. Appro DM36x IPNC 4.0 开发环境配置
  18. 爬虫类Chrome去除前端无限debugger反调试(轻松分析算法)
  19. [技术发展-24]:现有物联网通信技术特点
  20. 大数据分析与实践 数据预处理-主成分分析

热门文章

  1. 函数参数里*argvs和**kwargs的区别
  2. excel 日期选择器_Excel日期选择器工具
  3. 微信双开,手机如何开启微信分身?
  4. 电感和磁珠有哪些区别?
  5. EduCoder-Web程序设计基础 -web编程训练-html5-文档头部-第1关:页面标题及字符集的设置
  6. 基于HTML美中华传统文化题材网页项目的设计与实现 (纯HTML+CSS制作中国茶文化网站)...
  7. python 百度云不限速_百度云不限速插件内置十几种网盘搜索!
  8. 记录卸载h5py出现的问题
  9. es6 语法简单使用
  10. QQ浏览器劫持video标签加载自己的广告(怎么解决?)