• 注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论
  • 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005

3 矩阵的分解

3.1 常见的矩阵标准形与分解

常见标准形

  • 等价标准形: P , Q P, Q P,Q 可逆
    A m × n = P m × m [ I r 0 0 0 ] Q n × n A_{m\times n}=P_{m\times m}\begin{bmatrix}I_r&0\\0&0\end{bmatrix}Q_{n\times n} Am×n​=Pm×m​[Ir​0​00​]Qn×n​
  • 相似标准形: P P P 可逆
    A n × n = P J A P − 1 A_{n\times n}=PJ_AP^{-1} An×n​=PJA​P−1

LU 和 LDV 分解

  • LU 分解: A ∈ F n × n A\in F^{n\times n} A∈Fn×n, 有下三角形矩阵 L L L, 上三角形矩阵 U U U, 使得 A = L U A = LU A=LU.
  • LDV 分解: A ∈ F n × n A\in F^{n\times n} A∈Fn×n, L , V L, V L,V 分别是主对角线元素为 1 的下三角形和上三角形矩阵, D D D 为对角矩阵, 使得 A = L D V A = LDV A=LDV

Th 3.1 矩阵的 k k k 阶顺主子式: 取矩阵的前 k k k 行、前 k k k 列得到的行列式.
Th 3.1: A ∈ F n × n A\in F^{n\times n} A∈Fn×n 有唯一 LDV 分解 ⟺ A A A 的顺主子式 ∣ A k ∣ ≠ 0 , k = 1 , 2 , . . . , n − 1 |A_k|\neq 0, k=1,2,...,n-1 ∣Ak​∣​=0,k=1,2,...,n−1, ∣ A 0 ∣ = 1 |A_0|=1 ∣A0​∣=1. 其中 D = d i a g ( d 1 , d 2 , … , d n ) , d k = ∣ A k ∣ ∣ A k − 1 ∣ , k = 1 , … , n D = diag(d_1,d_2,…,d_n), d_k = \frac{|A_k|}{|A_{k-1}|}, k=1, …, n D=diag(d1​,d2​,…,dn​),dk​=∣Ak−1​∣∣Ak​∣​,k=1,…,n.

LU 和 LDV 分解分解方法

LU 分解:

  1. 构造增广矩阵 ( A ∣ I ) (A|I) (A∣I)
  2. 使用第 i i i 行乘数 k k k 加到第 j j j 行( i < j i<j i<j)型(不能交换两行, 也不能对一行本身乘或除一系数)行初等变换将增广矩阵 ( A ∣ I ) (A|I) (A∣I) 中 A A A 变为上三角矩阵, 此时增广矩阵为 ( U ∣ L − 1 ) (U|L^{-1}) (U∣L−1).
    ( A ∣ I ) ⟶ 非 交 换 两 行 ( U ∣ L − 1 ) \pmb{(A|I)\stackrel{非交换两行}{\longrightarrow}(U|L^{-1})} (A∣I)⟶非交换两行​(U∣L−1)​(A∣I)⟶非交换两行​(U∣L−1)​​(A∣I)⟶非交换两行​(U∣L−1)
  3. 根据增广矩阵得到的 L − 1 L^{-1} L−1 求逆得 L L L.
  • 最终得到 A = L U A=LU A=LU.

LDV 分解:

  1. 进行 LU 分解得到 L , U L,U L,U
  2. 从 U U U 矩阵每行提取对角线元素的值得到矩阵 D D D
    U = [ d 1 u 12 ⋯ u 1 n d 2 ⋯ u 2 n ⋱ ⋮ d n ] ⟶ D = [ d 1 d 2 ⋱ d n ] , V = [ 1 u 12 d 1 ⋯ u 1 n d 1 1 ⋯ u 2 n d 2 ⋱ ⋮ 1 ] U=\begin{bmatrix} d_1&u_{12}&\cdots&u_{1n}\\ &d_2&\cdots&u_{2n}\\ & &\ddots&\vdots\\ & & &d_n \end{bmatrix}\longrightarrow D=\begin{bmatrix} d_1& & & \\ &d_2& & \\ & &\ddots&\ \\ & & &d_n \end{bmatrix},V=\begin{bmatrix} 1&\frac{u_{12}}{d_1}&\cdots&\frac{u_{1n}}{d_1}\\ &1&\cdots&\frac{u_{2n}}{d_2}\\ & &\ddots&\vdots\\ & & &1 \end{bmatrix} U=⎣⎢⎢⎢⎡​d1​​u12​d2​​⋯⋯⋱​u1n​u2n​⋮dn​​⎦⎥⎥⎥⎤​⟶D=⎣⎢⎢⎡​d1​​d2​​⋱​ dn​​⎦⎥⎥⎤​,V=⎣⎢⎢⎢⎡​1​d1​u12​​1​⋯⋯⋱​d1​u1n​​d2​u2n​​⋮1​⎦⎥⎥⎥⎤​

LU 和 LDV 求解 AX=b

A X = b ⇒ { L Y = b U X = Y AX=b\Rightarrow \begin{cases}LY=b\\UX=Y\end{cases} AX=b⇒{LY=bUX=Y​
A X = b ⇒ { L Z = b D Y = Z V X = Y AX=b\Rightarrow \begin{cases}LZ=b\\DY=Z\\VX=Y\end{cases} AX=b⇒⎩⎪⎨⎪⎧​LZ=bDY=ZVX=Y​

满秩分解

Def 3.2: 设 A ∈ F m × n , r a n k ( A ) = r A\in F^{m\times n}, rank(A)=r A∈Fm×n,rank(A)=r, 若存在秩为 r r r 的矩阵 B ∈ F m × r B\in F^{m\times r} B∈Fm×r(列满秩, 瘦高矩阵), C ∈ F r × n C\in F^{r\times n} C∈Fr×n(行满秩, 矮胖矩阵), 使得 A = B C A=BC A=BC, 则称此式为 A A A 的满秩分解.

Th 3.3 任何非零矩阵 A ∈ F m × n A\in F^{m\times n} A∈Fm×n 都有满秩分解.

满秩分解方法

求矩阵列的极大无关组

  1. 对矩阵 A A A 进行初等变换得到最简形矩阵, 取最简形矩阵前 r a n k ( A ) rank(A) rank(A) 行得到矩阵 C C C.
  2. 依次选择矩阵 C C C 中每一行最左侧的 “1” 所在的列对应的 “ A A A 的列” 构成矩阵 B B B.

举例:
A = [ 1 1 2 0 2 2 1 0 1 ] → [ 1 0 1 0 1 1 0 0 0 ] A=\begin{bmatrix} 1&1&2\\ 0&2&2\\ 1&0&1 \end{bmatrix}\rightarrow\begin{bmatrix} 1&0&1\\ 0&1&1\\ 0&0&0 \end{bmatrix} A=⎣⎡​101​120​221​⎦⎤​→⎣⎡​100​010​110​⎦⎤​
C = [ 1 0 1 0 1 1 ] , B = [ 1 1 0 2 1 0 ] C=\begin{bmatrix} 1&0&1\\ 0&1&1 \end{bmatrix}, B=\begin{bmatrix} 1&1\\ 0&2\\ 1&0 \end{bmatrix} C=[10​01​11​],B=⎣⎡​101​120​⎦⎤​

可对角化矩阵的谱分解

矩阵的谱: 矩阵 A A A 互异的特征值的集合 { λ 1 , λ 2 , . . . , λ s } \{\lambda_1,\lambda_2,...,\lambda_s\} {λ1​,λ2​,...,λs​}.

矩阵的谱分解:
A = P ( λ 1 [ I r 1 0 ⋱ 0 ] + λ 2 [ 0 I r 2 ⋱ 0 ] + ⋯ + λ s [ 0 0 ⋱ λ s ] ) P − 1 = P ( λ 1 Q 1 + λ 2 Q 2 + ⋯ + λ s Q s ) P − 1 = P ( ∑ i = 1 s λ i Q i ) P − 1 = ∑ i = 1 s λ i P Q i P − 1 = ⁣ = ⁣ = ⁣ = ⁣ = ⁣ = ⁣ = ⁣ = d e f P i = P Q i P − 1 ∑ i = 1 s λ i P i \begin{aligned} A&=P(\lambda_1\begin{bmatrix} I_{r_1}& & & \\ &0& & \\ & &\ddots& \\ & & &0\\ \end{bmatrix}+\lambda_2\begin{bmatrix} 0& & & \\ &I_{r_2}& & \\ & &\ddots& \\ & & &0\\ \end{bmatrix}+\cdots+\lambda_s\begin{bmatrix} 0& & & \\ &0& & \\ & &\ddots& \\ & & &\lambda_s\\ \end{bmatrix})P^{-1}\\ &=P(\lambda_1Q_1+\lambda_2Q_2+\cdots+\lambda_sQ_s)P^{-1}\\ &=P(\sum_{i=1}^s\lambda_iQ_i)P^{-1}=\sum_{i=1}^s\lambda_iPQ_iP^{-1}\\ &\overset{def\ P_i=PQ_iP^{-1}}{=\!=\!=\!=\!=\!=\!=\!=}\sum_{i=1}^s\lambda_iP_i \end{aligned} A​=P(λ1​⎣⎢⎢⎡​Ir1​​​0​⋱​0​⎦⎥⎥⎤​+λ2​⎣⎢⎢⎡​0​Ir2​​​⋱​0​⎦⎥⎥⎤​+⋯+λs​⎣⎢⎢⎡​0​0​⋱​λs​​⎦⎥⎥⎤​)P−1=P(λ1​Q1​+λ2​Q2​+⋯+λs​Qs​)P−1=P(i=1∑s​λi​Qi​)P−1=i=1∑s​λi​PQi​P−1========def Pi​=PQi​P−1i=1∑s​λi​Pi​​

Q i , P i Q_i,P_i Qi​,Pi​ 性质:

  • ∑ i = 1 s Q i = ∑ i = 1 s P i = I n \sum_{i=1}^sQ_i=\sum_{i=1}^sP_i=I_n ∑i=1s​Qi​=∑i=1s​Pi​=In​
  • Q i 2 = Q i , P i 2 = P i , i = 1 , 2 , . . . , s Q_i^2=Q_i,P_i^2=P_i,i=1,2,...,s Qi2​=Qi​,Pi2​=Pi​,i=1,2,...,s 幂等矩阵
  • Q i Q j = 0 , P i P j = 0 , i ≠ j Q_iQ_j=0,P_iP_j=0,i\neq j Qi​Qj​=0,Pi​Pj​=0,i​=j

Th 3.5: 矩阵可对角化 ⟺ 矩阵有谱分解 A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=∑i=1s​λi​Pi​, 其中 P i P_i Pi​ 满足上述 3 条性质.

幂等矩阵性质: P ∈ F n × n , P 2 = P P\in F^{n\times n},P^2=P P∈Fn×n,P2=P

  • P H , ( I − P ) P^H,(I-P) PH,(I−P) 仍为幂等矩阵
  • P P P 的谱/特征值 ⊆ { 0 , 1 } \subseteq\{0,1\} ⊆{0,1}, P P P 相似于对角矩阵
  • F n = N ( P ) ⊕ R ( P ) F^n=N(P)\oplus R(P) Fn=N(P)⊕R(P), 零空间 N ( P ) = V λ = 0 N(P)=V_{\lambda=0} N(P)=Vλ=0​, 列空间 R ( P ) = V λ = 1 R(P)=V_{\lambda=1} R(P)=Vλ=1​

3.2 Schur 分解与正规矩阵

对角形矩阵

欧式空间: 实对称矩阵 A ( A T = A ) A(A^T=A) A(AT=A) 相似于对角矩阵. 存在正交矩阵 C ( C C T = C T C = I ) C\ (CC^T=C^TC=I) C (CCT=CTC=I):
C T A C = C − 1 A C = [ λ 1 λ 2 ⋱ λ n ] C^TAC=C^{-1}AC=\begin{bmatrix} \lambda_1& & & \\ &\lambda_2& & \\ & &\ddots& \\ & & &\lambda_n \end{bmatrix} CTAC=C−1AC=⎣⎢⎢⎡​λ1​​λ2​​⋱​λn​​⎦⎥⎥⎤​

酉空间: Hermite 矩阵 A ( A H = A ) A(A^H=A) A(AH=A) 相似于对角矩阵. 存在矩阵 U ( U U H = U H U = I ) U\ (UU^H=U^HU=I) U (UUH=UHU=I):
U H A U = U − 1 A U = [ λ 1 λ 2 ⋱ λ n ] U^HAU=U^{-1}AU=\begin{bmatrix} \lambda_1& & & \\ &\lambda_2& & \\ & &\ddots& \\ & & &\lambda_n \end{bmatrix} UHAU=U−1AU=⎣⎢⎢⎡​λ1​​λ2​​⋱​λn​​⎦⎥⎥⎤​

UR 和 QR 分解

Th 3.7 可逆矩阵的 UR (酉)分解:
A ∈ C n × n A\in C^{n\times n} A∈Cn×n 为可逆矩阵, 则存在酉矩阵(正交矩阵) U U U 和主对角线上元素皆正的上三角矩阵 R R R, 使得 A = U R A=UR A=UR.

Th 3.8 列满秩矩阵(列线性无关, 瘦高矩阵)的 QR 分解:
矩阵 A ∈ C n × r A\in C^{n\times r} A∈Cn×r 是列满秩的矩阵, 则矩阵 A A A 可以分解为 A = Q R A=QR A=QR, 其中 Q ∈ C n × r Q\in C^{n\times r} Q∈Cn×r 的列向量是标准正交的向量组, R ∈ C r × r R\in C^{r\times r} R∈Cr×r 是主对角线上元素皆正的上三角形矩阵.

UR 和 QR 分解方法

思路: 将矩阵 A A A 的列向量(均线性无关)视作矩阵列空间中的一组基 A = ( α 1 , . . . , α r ) A=(\alpha_1,...,\alpha_r) A=(α1​,...,αr​), 使用 Schmidt 正交化方法对其求标准正交基.
( α 1 , α 2 , . . . , α r ) = ( ϵ 1 , ϵ 2 . . . , ϵ r ) [ ∣ ∣ β 1 ∣ ∣ ( α 2 , ϵ 1 ) ⋯ ( α r , ϵ 1 ) ∣ ∣ β 2 ∣ ∣ ⋯ ( α r , ϵ 2 ) ⋱ ⋮ ∣ ∣ β r ∣ ∣ ] (\alpha_1,\alpha_2,...,\alpha_r)=(\epsilon_1,\epsilon_2...,\epsilon_r)\begin{bmatrix} ||\beta_1||&(\alpha_2,\epsilon_1)&\cdots&(\alpha_r,\epsilon_1)\\ &||\beta_2||&\cdots&(\alpha_r,\epsilon_2)\\ & &\ddots&\vdots\\ & & &||\beta_r|| \end{bmatrix} (α1​,α2​,...,αr​)=(ϵ1​,ϵ2​...,ϵr​)⎣⎢⎢⎢⎡​∣∣β1​∣∣​(α2​,ϵ1​)∣∣β2​∣∣​⋯⋯⋱​(αr​,ϵ1​)(αr​,ϵ2​)⋮∣∣βr​∣∣​⎦⎥⎥⎥⎤​

  • U U U/ Q Q Q: 标准正交基 ( ϵ 1 , ϵ 2 . . . , ϵ r ) (\epsilon_1,\epsilon_2...,\epsilon_r) (ϵ1​,ϵ2​...,ϵr​)
  • R R R: [ ∣ ∣ β 1 ∣ ∣ ( α 2 , ϵ 1 ) ⋯ ( α r , ϵ 1 ) ∣ ∣ β 2 ∣ ∣ ⋯ ( α r , ϵ 2 ) ⋱ ⋮ ∣ ∣ β r ∣ ∣ ] \begin{bmatrix}||\beta_1||&(\alpha_2,\epsilon_1)&\cdots&(\alpha_r,\epsilon_1)\\ &||\beta_2||&\cdots&(\alpha_r,\epsilon_2)\\ & &\ddots&\vdots\\ & & &||\beta_r||\end{bmatrix} ⎣⎢⎢⎢⎡​∣∣β1​∣∣​(α2​,ϵ1​)∣∣β2​∣∣​⋯⋯⋱​(αr​,ϵ1​)(αr​,ϵ2​)⋮∣∣βr​∣∣​⎦⎥⎥⎥⎤​

Schur 分解

Th 3.9 Schur 分解: 对矩阵 A ∈ C n × n A\in C^{n\times n} A∈Cn×n, 存在酉矩阵 U U U 和上三角矩阵 T T T, 使得:
U H A U = T = [ λ 1 ∗ ∗ ∗ λ 2 ⋱ ∗ ⋱ ∗ λ n ] U^HAU=T=\begin{bmatrix} \lambda_1&*&*&*\\ &\lambda_2&\ddots&*\\ & &\ddots&*\\ & & &\lambda_n \end{bmatrix} UHAU=T=⎣⎢⎢⎡​λ1​​∗λ2​​∗⋱⋱​∗∗∗λn​​⎦⎥⎥⎤​

正规矩阵 酉相似

Def’ 3.3: 方阵 A A A 是正规矩阵 ⟺ A H A = A A H A^HA=AA^H AHA=AAH

常见的正规矩阵:

  • 对角矩阵
  • 实对称和反对称矩阵: A T = A A^T=A AT=A, A T = – A A^T=–A AT=–A
  • Hermite 矩阵和反 Hermite 矩阵: A H = A A^H=A AH=A, A H = – A A^H=–A AH=–A
  • 正交矩阵和酉矩阵: A T A = A A T = I A^TA=AA^T=I ATA=AAT=I, A H A = A A H = I A^HA=AA^H=I AHA=AAH=I

正规矩阵特性:
Th 3.10: A ∈ C n × n A\in C^{n\times n} A∈Cn×n 是正规矩阵 ⟺ A A A 酉相似于对角矩阵 ("正规"是"酉相似"的不变性质).
⟺ A A A 有 n n n 个标准正交的特征向量.
⟺ (推论) A A A 有 n n n 个标准正交的特征向量构成空间 C n C^n Cn 的标准正交基. 即
理解: 正规矩阵关键在"酉相似于"对角矩阵. "相似"是线性变换从一组基到另一组基的坐标变换; 而"酉相似"是线性变换从一组标准正交基到另一组标准正交基的坐标变换.
⟺ A A A 有谱分解: A = ∑ i = 1 s λ i P i A=\sum_{i=1}^s\lambda_iP_i A=∑i=1s​λi​Pi​. P P P 满足: P i 2 = P i , P i H = P i P_i^2=P_i,P_i^H=P_i Pi2​=Pi​,PiH​=Pi​; P i P j = 0 , i ≠ j P_iP_j=0,i\neq j Pi​Pj​=0,i​=j; ∑ i = 1 s P i = I \sum_{i=1}^sP_i=I ∑i=1s​Pi​=I. (即满足谱分解矩阵 P i P_i Pi​ 的性质外还需要满足 Hermite 性, P i = P Q i P − 1 ⟶ 正 规 矩 阵 P i = U Q i U H P_i=PQ_iP^{-1}\overset{正规矩阵}{\longrightarrow}P_i=UQ_iU^H Pi​=PQi​P−1⟶正规矩阵​Pi​=UQi​UH)

Hermite 矩阵

Hermite 矩阵: A H = A A^H=A AH=A

基本性质:

  • Hermite 矩阵的特征值为实数, 且不同特征值对应的特征向量正交.
  • ∀ A is Hermite , ∃ U , U U H = U H U = I \forall A \text{ is Hermite},\exists U,UU^H=U^HU=I ∀A is Hermite,∃U,UUH=UHU=I: A = U d i a g ( λ 1 , . . . , λ n ) U H A=U\ diag(\lambda_1,...,\lambda_n)\ U^H A=U diag(λ1​,...,λn​) UH (任一 Hermite 阵 A 存在酉矩阵 U 使得 A 酉相似于对角阵)
  • 半正定(正定)Hermite 阵的特征值非负(为正)
    半正定矩阵: 任意的实非零列向量 x x x 有 x T A x ≥ 0 x^TAx≥0 xTAx≥0
    正定矩阵: 任何非零向量 x x x 有 x T A x > 0 x^TAx>0 xTAx>0

Hermite 矩阵谱分解:
设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n 是秩为 k k k 的半正定的 Hermite 矩阵, 则 A A A 可以分解为下列半正定矩阵的和:
A = v 1 v 1 H + v 2 v 2 H + . . . + v k v k H A=v_1v_1^H+v_2v_2^H+...+v_kv_k^H A=v1​v1H​+v2​v2H​+...+vk​vkH​
其中, { v 1 , v 2 , … , v k } \{v_1, v_2, …,v_k\} {v1​,v2​,…,vk​} 是 F n F^n Fn 中的正交向量组, 且秩为 1.

3.3 矩阵的奇异值分解

矩阵 A H A A^HA AHA 和 A A H AA^H AAH

A ∈ C m × n A\in C^{m\times n} A∈Cm×n, A H A ∈ C n × n , A A H ∈ C m × m A^HA\in C^{n\times n},AA^H\in C^{m\times m} AHA∈Cn×n,AAH∈Cm×m 为 Hermite 矩阵, 从而也为正规矩阵.

Th 3.12

  • r a n k ( A ) = r a n k ( A H A ) = r a n k ( A A H ) rank(A)=rank(A^HA)=rank(AA^H) rank(A)=rank(AHA)=rank(AAH)
  • A H A A^HA AHA 和 A A H AA^H AAH 的非零特征值相等
  • A H A A^HA AHA 和 A A H AA^H AAH 半正定.
    r ( A ) = n r(A) = n r(A)=n时, A H A ∈ C n × n A^HA\in C^{n\times n} AHA∈Cn×n 正定
    r ( A ) = m r(A) = m r(A)=m 时, A A H ∈ C m × m AA^H\in C^{m\times m} AAH∈Cm×m 正定
    ⇒ A H A A^HA AHA 和 A A H AA^H AAH 的特征值是非负实数: λ 1 ≥ λ 2 ≥ . . . ≥ λ n ≥ 0 \lambda_1\geq\lambda_2\geq...\geq\lambda_n\geq0 λ1​≥λ2​≥...≥λn​≥0

奇异值

Def’ 3.4: A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A) = r A∈Cm×n,rank(A)=r, 设 A H A A^HA AHA 的特征值 λ 1 ≥ λ 2 ≥ . . . ≥ λ r > 0 , λ r + 1 = . . . = λ n = 0 \lambda_1\geq\lambda_2\geq...\geq\lambda_r > 0, \lambda_{r+1}=...=\lambda_n=0 λ1​≥λ2​≥...≥λr​>0,λr+1​=...=λn​=0, 则矩阵 A A A 的奇异值:
σ i = λ i , i = 1 , 2 , . . . , r \sigma_i=\sqrt{\lambda_i},i=1,2,...,r σi​=λi​ ​,i=1,2,...,r
注: 此处的 λ i \lambda_i λi​ 是矩阵 A H A A^HA AHA 的特征值, 奇异值为正(实)数

Th 3.13 奇异值性质:

  • 正规矩阵 A A A 的奇异值等于 A A A 的(非零)特征值的模 ∣ λ i ∣ , i = 1 , 2 , . . . , n |\lambda_i|,i=1,2,...,n ∣λi​∣,i=1,2,...,n
    (正规矩阵 A H A = A A H = U d i a g ( λ n λ n ‾ , . . . , λ 1 λ 1 ‾ ) U H A^HA=AA^H=U\ diag(\lambda_n\overline{\lambda_n},...,\lambda_1\overline{\lambda_1})\ U^H AHA=AAH=U diag(λn​λn​​,...,λ1​λ1​​) UH, 所以特征值 σ i = ∣ λ i ∣ \sigma_i=|\lambda_i| σi​=∣λi​∣)
  • 正定的 Hermite 矩阵 A A A 的奇异值就是 A A A 的特征值 σ i = λ i \sigma_i=\lambda_i σi​=λi​
  • 若 ∃ U ∈ C m × m , V ∈ C n × n \exists U\in C^{m\times m},V\in C^{n\times n} ∃U∈Cm×m,V∈Cn×n 均为酉矩阵, ∃ B ∈ C m × n \exists B\in C^{m\times n} ∃B∈Cm×n: U A V = B UAV =B UAV=B, 则称 A A A 和 B B B 酉等价 (等价是要求 P , Q P,Q P,Q 可逆).
    酉等价的矩阵有相同的奇异值 ("奇异值"是"酉等价"的不变性质).

奇异值分解

Th 3.14 奇异值分解: 设矩阵 A ∈ C m × n , r a n k ( A ) = r A\in C^{m\times n}, rank(A)=r A∈Cm×n,rank(A)=r. σ 1 ≥ σ 2 ≥ . . . ≥ σ r > 0 \sigma_1\geq\sigma_2\geq...\geq\sigma_r > 0 σ1​≥σ2​≥...≥σr​>0 是矩阵 A A A 的奇异值, 则存在酉矩阵 U ∈ C m × m , V ∈ C n × n U\in C^{m\times m}, V\in C^{n\times n} U∈Cm×m,V∈Cn×n, 分块矩阵 Σ = [ Δ 0 0 0 ] ∈ C m × n \Sigma=\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}\in C^{m\times n} Σ=[Δ0​00​]∈Cm×n, 使
A = U Σ V H = U [ Δ 0 0 0 ] V H A=U\Sigma V^H=U\begin{bmatrix}\Delta&0\\0&0\end{bmatrix}V^H A=UΣVH=U[Δ0​00​]VH
其中, Δ = d i a g ( σ 1 , σ 2 , . . . , σ r ) \Delta=diag(\sigma_1,\sigma_2,...,\sigma_r) Δ=diag(σ1​,σ2​,...,σr​)

奇异值分解方法

目标: 求矩阵 A m × n A_{m\times n} Am×n​ 的奇异值分解 U Σ V H U\Sigma V^H UΣVH

  1. 求 A H A A^HA AHA 的特征值. 由非零特征值降序排序得到奇异值. Δ = d i a g ( σ 1 , σ 2 , . . . , σ r ) \Delta=diag(\sigma_1,\sigma_2,...,\sigma_r) Δ=diag(σ1​,σ2​,...,σr​), 进而得到矩阵 Σ m × n \Sigma_{m\times n} Σm×n​.
  2. 分别求 A H A A^HA AHA 特征值对应的特征向量 α 1 , . . . , α n \alpha_1,...,\alpha_n α1​,...,αn​, 分别将其标准化得到矩阵 V n × n V_{n\times n} Vn×n​
    V = ( v 1 , v 2 , . . . , v n ) = ( α 1 ∣ ∣ α 2 ∣ ∣ , α 2 ∣ ∣ α 1 ∣ ∣ , . . . , α n ∣ ∣ α n ∣ ∣ ) V=(v_1,v_2,...,v_n)=(\frac{\alpha_1}{||\alpha_2||},\frac{\alpha_2}{||\alpha_1||},...,\frac{\alpha_n}{||\alpha_n||}) V=(v1​,v2​,...,vn​)=(∣∣α2​∣∣α1​​,∣∣α1​∣∣α2​​,...,∣∣αn​∣∣αn​​)
  3. 利用公式 u i = A v i σ i \pmb{u_i=\frac{Av_i}{\sigma_i}} ui​=σi​Avi​​​ui​=σi​Avi​​​​ui​=σi​Avi​​ 求矩阵 U m × m = ( u 1 , u 2 , . . . , u m ) U_{m\times m}=(u_1,u_2,...,u_m) Um×m​=(u1​,u2​,...,um​) 的每一列 u i u_i ui​.
    当 σ i = 0 \sigma_i=0 σi​=0 时, 需要自行扩充向量 u i : ∀ j < i , u i ⊥ u j u_i: \forall j<i, u_i\perp u_j ui​:∀j<i,ui​⊥uj​. 一般使用叉乘 × \times × 计算(eg: u 3 = u 1 × u 2 u_3=u_1\times u_2 u3​=u1​×u2​).

左右奇异值向量 奇异值展开式

A m × n , r a n k ( A ) = r A^{m\times n},rank(A)=r Am×n,rank(A)=r
V = ( v 1 , . . . , v r ∣ v r + 1 , . . . , v n ) = ( V 1 ∣ V 2 ) V=(v_1,...,v_r|v_{r+1},...,v_n)=(V_1|V_2) V=(v1​,...,vr​∣vr+1​,...,vn​)=(V1​∣V2​), v i v_i vi​ 为右奇异向量
U = ( u 1 , . . . , u r ∣ u r + 1 , . . . , u m ) = ( U 1 ∣ U 2 ) U=(u_1,...,u_r|u_{r+1},...,u_m)=(U_1|U_2) U=(u1​,...,ur​∣ur+1​,...,um​)=(U1​∣U2​), u i u_i ui​ 为左奇异向量

  • V 2 V_2 V2​ 的列向量是空间 N ( A ) N(A) N(A) 的标准正交基 ( A V 2 = 0 AV_2=0 AV2​=0)
    V 1 V_1 V1​ 的列向量是空间 N ⊥ ( A ) N^\perp(A) N⊥(A) 的标准正交基 ( V 1 H V 2 = 0 V_1^HV_2=0 V1H​V2​=0)
  • U 1 U_1 U1​ 的列向量是 R ( A ) R(A) R(A) 的标准正交基 ( A = U 1 Δ r V 1 H A=U_1\Delta_rV_1^H A=U1​Δr​V1H​)
    U 2 U_2 U2​ 的列向量是 R ⊥ ( A ) R^\perp(A) R⊥(A) 的标准正交基 ( U 1 H U 2 = 0 U_1^HU_2=0 U1H​U2​=0)

奇异值展开式:
A = σ 1 u 1 v 1 H + σ 2 u 2 v 2 H + . . . + σ r u r v r H A=\sigma_1u_1v_1^H+\sigma_2u_2v_2^H+...+\sigma_ru_rv_r^H A=σ1​u1​v1H​+σ2​u2​v2H​+...+σr​ur​vrH​

奇异值分解与线性变换

矩阵 A ∈ C m × n A\in C^{m\times n} A∈Cm×n 可定义线性变换 T A : C n → C m T_A:C^n\rightarrow C^m TA​:Cn→Cm.
A A A 有奇异值分解 A = U Σ V H A=U\Sigma V^H A=UΣVH, 取 U U U 和 V V V 的列向量分别作 C n C^n Cn 和 C m C^m Cm 的标准正交基, 则线性变换 T A T_A TA​ 对应的变换矩阵为 Σ \Sigma Σ.

∀ α = V X ∈ C n \forall\alpha=VX\in C^n ∀α=VX∈Cn:
T A ( α ) = A α = ( U Σ V H ) V X = U ( Σ X ) = U [ σ 1 x 1 ⋮ σ r x r 0 ⋮ 0 ] T_A(\alpha)=A\alpha=(U\Sigma V^H)VX=U(\Sigma X)=U\begin{bmatrix} \sigma_1x_1\\ \vdots\\ \sigma_rx_r\\ 0\\ \vdots\\ 0 \end{bmatrix} TA​(α)=Aα=(UΣVH)VX=U(ΣX)=U⎣⎢⎢⎢⎢⎢⎢⎢⎢⎡​σ1​x1​⋮σr​xr​0⋮0​⎦⎥⎥⎥⎥⎥⎥⎥⎥⎤​
即原像 α \alpha α 的像在基 { u 1 , . . . , u m } \{u_1,...,u_m\} {u1​,...,um​} 的坐标为 ( σ 1 x 1 , . . . , σ r x r , 0 , . . . , 0 ) T (\sigma_1x_1,...,\sigma_rx_r,0,...,0)^T (σ1​x1​,...,σr​xr​,0,...,0)T.

Th 3.16 对实矩阵 A m × n A_{m\times n} Am×n​, R n R_n Rn​ 中单位球面在线性变换 T A T_A TA​ 下像的集合是 R m R^m Rm:

  • 球面( r = n r=n r=n)
  • 椭球体( r < n r < n r<n)

方阵极分解

A ∈ C n × n , r a n k ( A ) = r A\in C^{n\times n}, rank(A)=r A∈Cn×n,rank(A)=r, A A A 有极分解:
A = P Q = ( U Σ U H ) ( U V H ) A=PQ=(U\Sigma U^H)(UV^H) A=PQ=(UΣUH)(UVH)
其中:

  • P = U Σ U H ∈ C n × n , r a n k ( P ) = r P=U\Sigma U^H\in C^{n\times n},rank(P)=r P=UΣUH∈Cn×n,rank(P)=r 是半正定 Hermite 矩阵( r = n r=n r=n 为正定矩阵), 对应在 u i u_i ui​ 方向进行拉伸变换
  • Q = U V H ∈ C n × n Q=UV^H\in C^{n\times n} Q=UVH∈Cn×n 是酉矩阵, 对应旋转变换

[矩阵论] Unit 3. 矩阵的分解 - 知识点整理相关推荐

  1. [矩阵论] Unit 1. 线性空间与线性变换 - 知识点整理

    注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005 1 线性空间与线性变换 1.1 线 ...

  2. [矩阵论] Unit 6. 矩阵的 Kronecker 积与 Hadamard 积 - 知识点整理

    注: 以下内容均由个人整理, 不保证完全准确, 如有纰漏, 欢迎交流讨论 参考: 杨明, 刘先忠. 矩阵论(第二版)[M]. 武汉: 华中科技大学出版社, 2005 6 矩阵的 Kronecker 积 ...

  3. 矩阵论 第二章 矩阵的分解

    1. QR分解(UR分解): 这是最基础的分解. 定理1: 设满秩方程A∈R(n x n), 则存在正交矩阵Q及正线(主对角线上元为正)上三角阵R,满足 A = QR, 且分解唯一. 构造性证明: 将 ...

  4. 机器学习知识点(十九)矩阵特征值分解基础知识及Java实现

    1.特征值分解基础知识 矩阵乘法Y=AB的数学意义在于变换,以其中一个向量A为中心,则B的作用主要是使A发生伸缩或旋转变换.一个矩阵其实就是一个线性变换,因为一个矩阵乘以一个向量后得到的向量,其实就相 ...

  5. 【数理知识】《矩阵论》方保镕老师-第3章-矩阵的分解

    上一章 回到目录 下一章 第3章 矩阵的分解 3.1 矩阵的三角分解 3.1.1 消元过程的矩阵描述 3.1.2 矩阵的三角分解 3.1.3 常用的三角分解公式 3.2 矩阵的 QR(正交三角) 分解 ...

  6. 矩阵论理论知识(四)矩阵的分解

    矩阵的分解 QR分解 正轨矩阵及Schur分解 正规矩阵 满秩分解 奇异值分解 单纯矩阵的谱分解 通过一些方法,将矩阵分解为一些较为简单的矩阵,可以更容易地使我们了解矩阵的性质. QR分解 通过Gra ...

  7. 管理mysql表知识点,数据库知识点整理(全)

    <数据库知识点整理(全)>由会员分享,可在线阅读,更多相关<数据库知识点整理(全)(12页珍藏版)>请在人人文库网上搜索. 1.UNIT 1四个基本概念1.数据(Data):数 ...

  8. 06-JAVA面试核心知识点整理(时间较多的同学全面复习)

    JVM (1) 基本概念: JVM是可运行Java代码的假想计算机 ,包括一套字节码指令集.一组寄存器.一个栈.一个垃圾回收,堆 和 一个存储方法域.JVM 是运行在操作系统之上的,它与硬件没有直接的 ...

  9. 程序员笔试知识点整理

    程序员笔试知识点整理 0.常考基础必知必会 A. 排序:排序有几种,各种排序的比较,哪些排序是稳定的,快排的算法: B. 查找:哈希查找.二叉树查找.折半查找的对比,哈希映射和哈希表的区别? C. 链 ...

最新文章

  1. dbeaver数据库工具
  2. Spring 使用注解方式进行事物管理
  3. js中常用的算法排序
  4. SGI重获新生 有望下月摆脱破产保护
  5. 信息系统项目管理师长篇备考经验
  6. 字符与字符串3——char 的大小
  7. 工程搭建:搭建子工程之搭建环境构造返回实体类
  8. 安装linux出现基础系统出错,Linux系统出错提示信息详解
  9. java treemap_Java TreeMap firstEntry()方法及示例
  10. 关于零拷贝技术,你了解多少?
  11. matplotlib-plt.plot用法
  12. 隐马尔可夫模型通俗导论
  13. 钱包系列教程七】玩转 EOS 命令行钱包
  14. FastReport 2021版中文手册PDF下载
  15. RCF—用于C++的进程间通讯(1)
  16. nats streaming订阅
  17. cobol学习4--语法与文法(2)
  18. twilio php 发送短信,如何使用 Twilio 实现语音和短信功能 (PHP) | Microsoft Docs
  19. 红黑树添加和删除节点原理
  20. Java身份证处理工具

热门文章

  1. ts判断数据是否存在
  2. 【毕业设计】基于单片机的录音器设计与实现 - 物联网 嵌入式 stm32
  3. OA系统选型分析之致远OA与华天动力OA
  4. Swagger简单介绍
  5. 用地图说话 在商业分析与演示中运用Excel数据地图 全彩
  6. 【网络教程】IPtables官方教程--学习笔记3
  7. 举例理解transformer中的位置编码
  8. CRT偶乐还是用到的-自带的sftp上传下载功能
  9. IT人士最容易得的癌症
  10. 基于python的网络爬虫技术_基于python的网络爬虫技术的研究