矩阵论专栏:专栏(文章按照顺序排序)

本篇博客的上篇是矩阵论(零):线性代数基础知识整理(4)——线性空间与线性变换,梳理了线性空间与线性变换的相关内容。本文主要整理矩阵的特征值与相似的相关内容。

  • 方阵的特征值

    • 特征值的定义及性质
    • 特殊矩阵的特征值与特征向量(对角矩阵、上(下)三角矩阵、酋矩阵、分块矩阵)
    • A A A、 A T A^T AT、 A H A^H AH的特征值的关系
    • A H A A^HA AHA和 A A H AA^H AAH的特征值的关系(推广: A B AB AB和 B A BA BA的特征值的关系)
  • 相似变换与相似对角化
    • 相似矩阵的定义及性质
    • Sylvester定理
    • 相似对角化的定义及其充要条件
    • 相似对角化的一个应用:求解斐波那契数列的通项

通常情况下,我们在复数域中讨论特征值和特征向量。但本文为更具一般性,在一般的数域 F F F下讨论。当讨论在某一数域 F F F下n级矩阵的特征值时,特征值必须是 F F F中的数。例如,在实数域下讨论n级矩阵的特征值,则特征值一定都是实数,在这种情况下某些实矩阵根本就没有特征值
但是也需要注意一些表达上的灵活性,比如我们说n阶实矩阵有n个复特征值,这是没有问题的,这里实际上是把实矩阵看成是复数域下的一个矩阵,也就是说这里讨论的前提是在复数域 C C C下讨论。

文中“全部特征值”这种说法,是指域 F F F下的n级矩阵 A A A的特征方程 d e t ( λ I − A ) = 0 det(\lambda{}I-A)=0 det(λI−A)=0在域 F F F下的所有根,且重根按重数算,即一个 k k k重根当成 k k k个特征值来看


矩阵的特征值

特征值的定义及性质

  • 定义(线性变换的特征值与特征向量):设有数域 F F F上的 n n n维线性空间 V V V, T T T是 V V V上的线性变换,若存在 λ ∈ F \lambda \in F λ∈F, 0 ≠ x ∈ V 0\neq x\in V 0​=x∈V使得 T ( x ) = λ x T(x)=\lambda x T(x)=λx,则称 λ \lambda λ为 T T T的一个特征值, x x x是 T T T的对应于 λ \lambda λ一个特征向量
  • 定义(方阵的特征值与特征向量):设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n,若 ∃ λ ∈ F , 0 ≠ x ∈ F n \exists{\lambda}\in{F},0\neq x\in{F^n} ∃λ∈F,0​=x∈Fn使得 A x = λ x Ax=\lambda{x} Ax=λx,或者等价地 ( λ I − A ) x = 0 (\lambda{I}-A)x=0 (λI−A)x=0,则称 λ \lambda λ是A的一个特征值, x x x是A的对应于 λ \lambda λ的一个特征向量

任意给定线性空间上的一组基,那么线性变换的特征值与线性变换的矩阵(给定基下的矩阵)的特征值相同,线性变换的矩阵的特征向量是线性变换的特征向量在给定基下的坐标。这个关系可以从线性变换在给定基下的矩阵的定义导出,相关的线性空间与线性变换的知识见上一篇博客链接。
本文采用矩阵语言讨论特征值和特征向量。

  • 定义(特征值的集合):设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n,用 σ ( A ) \sigma (A) σ(A)表示 A A A的所有特征值的集合

  • 定理: λ \lambda λ是n阶方阵A的特征值的充要条件为 d e t ( λ I − A ) = 0 det(\lambda{}I-A)=0 det(λI−A)=0

    证:
    由特征值的定义, λ \lambda λ是n阶方阵A的特征值的充要条件为齐次线性方程组 ( λ I − A ) x = 0 (\lambda{I}-A)x=0 (λI−A)x=0有非零解,而有非零解的充要条件为系数矩阵 λ I − A \lambda{I}-A λI−A不可逆,从而充要条件为 d e t ( λ I − A ) = 0 det(\lambda{}I-A)=0 det(λI−A)=0。

    【注】 d e t ( λ I − A ) = 0 det(\lambda{}I-A)=0 det(λI−A)=0是关于 λ \lambda λ的一元n次方程,这个定理揭示了特征值与一元n次多项式方程的关系。在复数域下,一元n次多项式方程恰好有n个根(这个是复数域代数封闭性的一个直接推论,注意重根按重数算),因此n阶复方阵恰好有n个特征值(重特征值按重数算)。在代数不封闭的数域,如实数域和有理数域中,n阶方阵至多有n个特征值(重根按重数算)

  • 定义(谱半径):设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n, λ 1 , λ 2 , ⋯ , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1​,λ2​,⋯,λn​是 A A A的全部特征值,称 ρ ( A ) = max ⁡ { ∣ λ 1 ∣ , ∣ λ 2 ∣ , . . . , ∣ λ n ∣ } \rho(A)=\max\{|\lambda_1|,|\lambda_2|,...,|\lambda_n|\} ρ(A)=max{∣λ1​∣,∣λ2​∣,...,∣λn​∣}为 A A A的谱半径,其中 ∣ ∙ ∣ |\bullet| ∣∙∣表示复数的模

    【注】也就是说,谱半径是矩阵特征值的最大模。谱半径这个概念在计算数学中有重要应用。注意一般这个概念是复数域下的,一个实矩阵/有理数矩阵的谱半径是它的所有复特征值的最大模。

  • 定义: d e t ( λ I − A ) = 0 det(\lambda{}I-A)=0 det(λI−A)=0称为A的特征方程;关于 λ \lambda λ的一元n次多项式 d e t ( λ I − A ) det(\lambda{}I-A) det(λI−A)称为A的特征多项式;若 λ \lambda λ是A的特征值,则齐次线性方程组 ( λ I − A ) x = 0 (\lambda{I}-A)x=0 (λI−A)x=0的解空间(也就是系数矩阵 λ I − A \lambda I-A λI−A的零空间 N ( λ I − A ) N(\lambda I-A) N(λI−A))称为 λ \lambda λ的特征子空间

    【注】关于矩阵特征多项式的详细展开式,请参考矩阵论(补充知识):特征多项式的展开式。

  • 定义:若方阵A的特征值 λ \lambda λ是A的特征方程的k重根,则称k是 λ \lambda λ的代数重数; λ \lambda λ对应的特征子空间的维数 dim ⁡ N ( λ I − A ) \dim N(\lambda I-A) dimN(λI−A)称为 λ \lambda λ的几何重数

  • 定理: A ∈ C n × n A\in C^{n\times n} A∈Cn×n的全部不同特征值的代数重数之和为n

    证:根据n阶复方阵恰好有n个特征值这一事实,以及代数重数的定义可得。
    【注】这个结论对一般的数域并不成立。一般的数域 F F F中,n阶方阵的全部不同特征值的代数重数之和不大于 n n n。

  • 定理: A ∈ F n × n A\in F^{n\times n} A∈Fn×n的任意特征值的几何重数小于等于代数重数

    证:
    法1:利用基的扩充和相似(相似矩阵的内容见后文)
    设 λ \lambda λ是 A A A的一个特征值, λ \lambda λ对应的特征子空间 N ( λ I − A ) N(\lambda I-A) N(λI−A)的维数为s,即 λ \lambda λ的几何重数为s。取 N ( λ I − A ) N(\lambda I-A) N(λI−A)的一组基 x 1 , x 2 , . . . , x s x_1,x_2,...,x_s x1​,x2​,...,xs​,由扩充定理知可将它扩充为 F n F^n Fn的一组基 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1​,x2​,...,xn​。令 P = [ x 1 x 2 ⋯ x n ] P=\begin{bmatrix}x_1&x_2&\cdots&x_n\end{bmatrix} P=[x1​​x2​​⋯​xn​​],则 P P P为可逆矩阵,由 P − 1 P = I P^{-1}P=I P−1P=I并根据分块矩阵乘法可得 P − 1 [ x 1 x 2 ⋯ x s ] = [ I s O ] P^{-1}\begin{bmatrix}x_1&x_2&\cdots&x_s\end{bmatrix}=\begin{bmatrix}I_s\\O\end{bmatrix} P−1[x1​​x2​​⋯​xs​​]=[Is​O​]。令 B = P − 1 A P B=P^{-1}AP B=P−1AP,则 B = P − 1 [ A x 1 ⋯ A x s ∗ ] = P − 1 [ λ x 1 ⋯ λ x s ∗ ] = [ λ P − 1 [ x 1 x 2 ⋯ x s ] ∗ ] = [ λ I s ∗ O ∗ ] \begin{aligned}B&=P^{-1}\begin{bmatrix}Ax_1&\cdots&Ax_s&*\end{bmatrix}\\&=P^{-1}\begin{bmatrix}\lambda x_1&\cdots&\lambda x_s&*\end{bmatrix}\\&=\begin{bmatrix}\lambda P^{-1}\begin{bmatrix}x_1&x_2&\cdots&x_s\end{bmatrix}&*\end{bmatrix}\\&=\begin{bmatrix}\lambda I_s&*\\O&*\end{bmatrix}\end{aligned} B​=P−1[Ax1​​⋯​Axs​​∗​]=P−1[λx1​​⋯​λxs​​∗​]=[λP−1[x1​​x2​​⋯​xs​​]​∗​]=[λIs​O​∗∗​]​通过对上面这个分块矩阵的特征多项式进行拉普拉斯展开就得知, λ \lambda λ是 B B B的特征值且其代数重数至少为 s s s。因为 B B B与 A A A相似,故 B B B的特征值 λ \lambda λ的代数重数与 A A A的特征值 λ \lambda λ的代数重数相等,故 A A A的特征值 λ \lambda λ的代数重数不小于 s s s,即不小于其几何重数。得证。
    法2:当 F = C F=C F=C时可以利用矩阵分解(schur分解,具体证明见矩阵论(二):矩阵分解—从Schur分解、特征值分解EVD到奇异值分解SVD)

  • 定理:设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n的全部特征值分别为 λ 1 , λ 2 , . . . , λ s \lambda_1,\lambda_2,...,\lambda_s λ1​,λ2​,...,λs​,则 μ I + A , μ ∈ F \mu I+A,\mu\in F μI+A,μ∈F的全部特征值为 μ + λ 1 , μ + λ 2 , . . . , μ + λ s \mu+\lambda_1,\mu+\lambda_2,...,\mu+\lambda_s μ+λ1​,μ+λ2​,...,μ+λs​

    证:
    μ I + A \mu I+A μI+A的特征多项式为 d e t ( λ I − ( μ I + A ) ) = d e t ( ( λ − μ ) I − A ) det(\lambda I-(\mu I+A))=det((\lambda-\mu)I-A) det(λI−(μI+A))=det((λ−μ)I−A),由已知特征方程 d e t ( λ I − A ) det(\lambda I-A) det(λI−A)的s个根为 λ 1 , λ 2 , . . . , λ s \lambda_1,\lambda_2,...,\lambda_s λ1​,λ2​,...,λs​,显然特征方程 d e t ( ( λ − μ ) I − A ) = 0 det((\lambda-\mu)I-A)=0 det((λ−μ)I−A)=0的s个根为 μ + λ 1 , μ + λ 2 , . . . , μ + λ s \mu+\lambda_1,\mu+\lambda_2,...,\mu+\lambda_s μ+λ1​,μ+λ2​,...,μ+λs​,得证。
    【注】该结论是一个比较明显的结论,也十分常用。注意,结论蕴含着“若 λ i \lambda_i λi​是 A A A的 k k k重特征值(此处指代数重数),则 μ + λ i \mu+\lambda_i μ+λi​是 μ I + A \mu I+A μI+A的 k k k重特征值”。

  • 定理:设 λ 1 , λ 2 , ⋯ , λ s \lambda{}_1,\lambda{}_2,\cdots,\lambda{}_s λ1​,λ2​,⋯,λs​是A的互不相同的特征值, x i 1 , x i 2 , ⋯ , x i j i x_{i1},x_{i2},\cdots,x_{ij_i} xi1​,xi2​,⋯,xiji​​是A关于 λ i \lambda{}_i λi​的线性无关的特征向量,则 x 11 , ⋯ , x 1 j 1 , x 21 , ⋯ , x 2 j 2 , ⋯ , x s 1 , ⋯ , x s j s x_{11},\cdots,x_{1j_1},x_{21},\cdots,x_{2j_2},\cdots,x_{s1},\cdots,x_{sj_s} x11​,⋯,x1j1​​,x21​,⋯,x2j2​​,⋯,xs1​,⋯,xsjs​​是线性无关的

    证明:(数学归纳法)
    当s=1时,显然命题成立。
    假设当s=i时,命题成立,则当s=i+1时,设 k 11 x 11 + ⋯ + k 1 j 1 x 1 j 1 + k 21 x 21 + ⋯ + k 2 j 2 x 2 j 2 + ⋯ + k s 1 x s 1 + ⋯ + k s j s x s j s = 0 k_{11}x_{11}+\cdots+k_{1j_1}x_{1j_1}+k_{21}x_{21}+\cdots+k_{2j_2}x_{2j_2}+\cdots\\+k_{s1}x_{s1}+\cdots+k_{sj_s}x_{sj_s}=0 k11​x11​+⋯+k1j1​​x1j1​​+k21​x21​+⋯+k2j2​​x2j2​​+⋯+ks1​xs1​+⋯+ksjs​​xsjs​​=0
    用A左乘两端并整理得: λ 1 ( k 11 x 11 + ⋯ + k 1 j 1 x 1 j 1 ) + ⋯ + λ s ( k s 1 x s 1 + ⋯ + k s j s x s j s ) = 0 \lambda{}_1(k_{11}x_{11}+\cdots+k_{1j_1}x_{1j_1})+\cdots+\lambda{}_s(k_{s1}x_{s1}+\cdots+k_{sj_s}x_{sj_s})=0 λ1​(k11​x11​+⋯+k1j1​​x1j1​​)+⋯+λs​(ks1​xs1​+⋯+ksjs​​xsjs​​)=0由以上两式消去 k s 1 x s 1 + ⋯ + k s j s x s j s k_{s1}x_{s1}+\cdots+k_{sj_s}x_{sj_s} ks1​xs1​+⋯+ksjs​​xsjs​​得 ( λ s − λ 1 ) ( k 11 x 11 + ⋯ + k 1 j 1 x 1 j 1 ) + ⋯ + ( λ s − λ s − 1 ) ( k ( s − 1 ) 1 x ( s − 1 ) 1 + ⋯ + k ( s − 1 ) j s − 1 x ( s − 1 ) j s − 1 ) = 0 \begin{aligned}(\lambda{}_s-\lambda{}_1)(k_{11}x_{11}+\cdots+k_{1j_1}x_{1j_1})+\cdots+\\(\lambda{}_s-\lambda{}_{s-1})(k_{(s-1)1}x_{(s-1)1}+\cdots+k_{(s-1)j_{s-1}}x_{(s-1)j_{s-1}})=0\end{aligned} (λs​−λ1​)(k11​x11​+⋯+k1j1​​x1j1​​)+⋯+(λs​−λs−1​)(k(s−1)1​x(s−1)1​+⋯+k(s−1)js−1​​x(s−1)js−1​​)=0​由特征值互不相等及假设知 k 11 = ⋯ = k 1 j 1 = ⋯ = k ( s − 1 ) 1 = ⋯ = k ( s − 1 ) j s − 1 = 0 k_{11}=\cdots=k_{1j_1}=\cdots=k_{(s-1)1}=\cdots=k_{(s-1) j_{s-1}}=0 k11​=⋯=k1j1​​=⋯=k(s−1)1​=⋯=k(s−1)js−1​​=0故 k s 1 x s 1 + ⋯ + k s j s x s j s = 0 k_{s1}x_{s1}+\cdots+k_{sj_s}x_{sj_s}=0 ks1​xs1​+⋯+ksjs​​xsjs​​=0,由题设知 k s 1 = ⋯ = k s j s = 0 k_{s1}=\cdots=k_{sj_s}=0 ks1​=⋯=ksjs​​=0,故命题对s=i+1时也成立。故由归纳假设,原命题成立。得证。

    【注】这个定理很有用的地方在于,如果我们分别取 N ( λ 1 I − A ) N(\lambda_1 I-A) N(λ1​I−A)、 N ( λ 2 I − A ) N(\lambda_2 I-A) N(λ2​I−A)、……、 N ( λ s I − A ) N(\lambda_s I-A) N(λs​I−A)的基,当我们把所有这些基中的向量合在一起时得到的是一个线性无关向量组。实际上,我们将得到 ∑ i = 1 s N ( λ i I − A ) \sum_{i=1}^sN(\lambda_i I-A) ∑i=1s​N(λi​I−A)的基。根据多个子空间直和的定义,这就意味着 ∑ i = 1 s N ( λ i I − A ) = ⊕ i = 1 s N ( λ i I − A ) \sum_{i=1}^sN(\lambda_i I-A)=\oplus_{i=1}^sN(\lambda_i I-A) ∑i=1s​N(λi​I−A)=⊕i=1s​N(λi​I−A),进而也有 dim ⁡ ∑ i = 1 s N ( λ i I − A ) = ∑ i = 1 s dim ⁡ N ( λ i I − A ) \dim \sum_{i=1}^sN(\lambda_i I-A)=\sum_{i=1}^s\dim N(\lambda_i I-A) dim∑i=1s​N(λi​I−A)=∑i=1s​dimN(λi​I−A)。

  • 特征值与迹、行列式的关系
    在复数域下,设n阶方阵 A = ( a i j ) A=(a_{ij}) A=(aij​)的全部特征值是 λ 1 , λ 2 , ⋯ , λ n \lambda{}_1,\lambda{}_2,\cdots,\lambda{}_n λ1​,λ2​,⋯,λn​。根据因式分解定理知特征多项式可以写成 d e t ( λ I − A ) = ( λ − λ 1 ) ( λ − λ 2 ) . . . ( λ − λ n ) det(\lambda I-A)=(\lambda-\lambda_1)(\lambda-\lambda_2)...(\lambda-\lambda_n) det(λI−A)=(λ−λ1​)(λ−λ2​)...(λ−λn​),其n-1次项的系数为 − ( λ 1 + λ 2 + . . . + λ n ) = − t r ( A ) -(\lambda_1+\lambda_2+...+\lambda_n)=-tr(A) −(λ1​+λ2​+...+λn​)=−tr(A),常数项为 ( − 1 ) n λ 1 λ 2 . . . λ n (-1)^n\lambda_1\lambda_2...\lambda_n (−1)nλ1​λ2​...λn​。另一方面,从行列式的角度看 d e t ( λ I − A ) det(\lambda I-A) det(λI−A)的n-1次项系数为 − ( a 11 + a 22 + . . . + a n n ) = − t r ( A ) -(a_{11}+a_{22}+...+a_{nn})=-tr(A) −(a11​+a22​+...+ann​)=−tr(A),常数项(令 λ = 0 \lambda=0 λ=0即可得到)为 d e t ( − A ) = ( − 1 ) n d e t ( A ) det(-A)=(-1)^ndet(A) det(−A)=(−1)ndet(A)。因此有如下关系:

    • d e t ( A ) = λ 1 λ 2 ⋯ λ n det(A)=\lambda{}_1\lambda{}_2\cdots\lambda{}_n det(A)=λ1​λ2​⋯λn​
    • t r ( A ) = λ 1 + λ 2 + ⋯ + λ n tr(A)=\lambda{}_1+\lambda{}_2+\cdots+\lambda{}_n tr(A)=λ1​+λ2​+⋯+λn​

特殊矩阵的特征值与特征向量

  • λ \lambda λ是对角矩阵A的特征值的充要条件为 λ \lambda λ在A的主对角线上,且A的每个特征值的代数重数等于其在主对角线上出现的次数

  • λ \lambda λ是上(下)三角矩阵A的特征值的充要条件为 λ \lambda λ在A的主对角线上,且A的每个特征值的代数重数等于其在主对角线上出现的次数

  • 酋矩阵的特征值的模是1

    证明:
    设 U ∈ C n × n U\in C^{n\times n} U∈Cn×n是一个酋矩阵, λ \lambda λ是U的一个特征值, U x = λ x , x ≠ 0 Ux=\lambda x,x\neq 0 Ux=λx,x​=0,则 ( U x ) H ( U x ) = ( λ x ) H ( λ x ) (Ux)^H(Ux)=(\lambda x)^H(\lambda x) (Ux)H(Ux)=(λx)H(λx),即 x H U H U x = x H x = ∣ λ ∣ 2 x H x x^HU^HUx=x^Hx=|\lambda|^2x^Hx xHUHUx=xHx=∣λ∣2xHx,因为 x ≠ 0 x\neq 0 x​=0所以 x H x = ∣ ∣ x ∣ ∣ 2 2 > 0 x^Hx=||x||_2^2>0 xHx=∣∣x∣∣22​>0,所以 ∣ λ ∣ 2 = 1 |\lambda|^2=1 ∣λ∣2=1,即 ∣ λ ∣ = 1 |\lambda|=1 ∣λ∣=1。

  • n阶对角矩阵 A ∈ F n × n A\in F^{n\times n} A∈Fn×n有n个线性无关的特征向量

    证明:
    设 A = d i a g ( a 1 , a 2 , . . . , a n ) A=diag(a_1,a_2,...,a_n) A=diag(a1​,a2​,...,an​), I n = [ e 1 e 2 ⋯ e n ] I_n=\begin{bmatrix}e_1&e_2&\cdots&e_n\end{bmatrix} In​=[e1​​e2​​⋯​en​​]是 n n n阶单位矩阵。计算可得任意 i = 1 , 2 , . . . , n i=1,2,...,n i=1,2,...,n有 A e i = a i e i Ae_i=a_ie_i Aei​=ai​ei​,由于 e i ≠ 0 e_i\neq 0 ei​​=0,故 e i e_i ei​是 A A A的特征向量。这就证明了单位矩阵 I n I_n In​的列向量均为 A A A的特征向量,因为单位矩阵 I n I_n In​的列向量组是线性无关的,所以A有n个线性无关的特征向量。

  • 分块矩阵的特征值
    设 A ∈ F m × m , B ∈ F n × n A\in F^{m\times m},B\in F^{n\times n} A∈Fm×m,B∈Fn×n, A A A的全部特征值为 λ 1 , λ 2 , ⋯ , λ s \lambda_1,\lambda_2,\cdots,\lambda_s λ1​,λ2​,⋯,λs​, B B B的全部特征值为 λ s + 1 , λ s + 2 , ⋯ , λ s + t \lambda_{s+1},\lambda_{s+2},\cdots,\lambda_{s+t} λs+1​,λs+2​,⋯,λs+t​,则分块矩阵 [ A ∗ O B ] \begin{bmatrix}A&*\\O&B\end{bmatrix} [AO​∗B​]和 [ A O ∗ B ] \begin{bmatrix}A&O\\*&B\end{bmatrix} [A∗​OB​]的全部特征值为 λ 1 , λ 2 , ⋯ , λ s + t \lambda_1,\lambda_2,\cdots,\lambda_{s+t} λ1​,λ2​,⋯,λs+t​。

    证:(以 [ A ∗ O B ] \begin{bmatrix}A&*\\O&B\end{bmatrix} [AO​∗B​]为例)
    根据拉普拉斯展开式计算上述分块矩阵的特征多项式: d e t ( λ I m + n − [ A ∗ O B ] ) = d e t [ λ I m − A ∗ O λ I n − B ] = d e t ( λ I m − A ) d e t ( λ I n − B ) det\left(\lambda I_{m+n}-\begin{bmatrix}A&*\\O&B\end{bmatrix}\right)=det\begin{bmatrix}\lambda I_m-A&*\\O&\lambda I_n-B\end{bmatrix}\\=det(\lambda I_m-A)det(\lambda I_n-B) det(λIm+n​−[AO​∗B​])=det[λIm​−AO​∗λIn​−B​]=det(λIm​−A)det(λIn​−B)可见特征方程在域 F F F下的全部根为 λ 1 , λ 2 , ⋯ , λ s + t \lambda_1,\lambda_2,\cdots,\lambda_{s+t} λ1​,λ2​,⋯,λs+t​,证毕。

A , A T , A H A,A^T,A^H A,AT,AH的特征值的关系

只要找到 A , A T , A H A,A^T,A^H A,AT,AH的特征多项式的关系,就能得到下面两个结论,读者自证不难^_^。

  • σ ( A ) = σ ( A T ) \sigma(A)=\sigma(A^T) σ(A)=σ(AT)且 A A A与 A T A^T AT的同一特征值的代数重数相等
  • A A A与 A H A^H AH的特征值互为共轭且 A A A的特征值 λ \lambda λ的代数重数与 A H A^H AH的特征值 λ ˉ \bar\lambda λˉ的代数重数相等

A A H AA^H AAH和 A H A A^HA AHA的特征值的关系(注意 A A H AA^H AAH和 A H A A^HA AHA的阶数不一定相同)

  • A A H AA^H AAH和 A H A A^HA AHA的特征值均为非负实数

    证明:
    考虑特征方程 A A H x = λ x AA^Hx=\lambda{x} AAHx=λx,用 x H x^H xH左乘两端得 x H A A H x = ( A H x ) H ( A H x ) = λ x H x x^HAA^Hx=(A^Hx)^H(A^Hx)=\lambda{}x^Hx xHAAHx=(AHx)H(AHx)=λxHx,即 ∣ ∣ A H x ∣ ∣ 2 = λ ∣ ∣ x ∣ ∣ 2 ||A^Hx||^2=\lambda{}||x||^2 ∣∣AHx∣∣2=λ∣∣x∣∣2,故 A A H AA^H AAH的特征值均为非负实数。同理可证 A H A A^HA AHA的特征值均为非负实数。

  • σ ( A H A ) − { 0 } = σ ( A A H ) − { 0 } \sigma (A^HA)-\{0\}=\sigma (AA^H)-\{0\} σ(AHA)−{0}=σ(AAH)−{0}(即 A A H AA^H AAH和 A H A A^HA AHA有相同的非零特征值)

    证明:
    考虑 A A H AA^H AAH的特征方程 A A H x = λ x , λ ≠ 0 , x ≠ 0 AA^Hx=\lambda{}x,\lambda{}\neq0,x\neq0 AAHx=λx,λ​=0,x​=0,设 y = A H x y=A^Hx y=AHx,由 ∣ ∣ A H x ∣ ∣ 2 = λ ∣ ∣ x ∣ ∣ 2 ||A^Hx||^2=\lambda{}||x||^2 ∣∣AHx∣∣2=λ∣∣x∣∣2知 ∣ ∣ A H x ∣ ∣ > 0 ||A^Hx||\gt0 ∣∣AHx∣∣>0,故 y ≠ 0 y\neq0 y​=0。用 A H A^H AH左乘 A A H x = λ x AA^Hx=\lambda{x} AAHx=λx两端得 A H A y = λ y A^HAy=\lambda{y} AHAy=λy,可见 λ \lambda λ也是 A H A A^HA AHA的特征值。同理可证 A H A A^HA AHA的非零特征值都是 A A H AA^H AAH的特征值。得证。

    【推广】设 A ∈ F m × n A\in F^{m\times n} A∈Fm×n, B ∈ F n × m B\in F^{n\times m} B∈Fn×m,则 σ ( A B ) − { 0 } = σ ( B A ) − { 0 } \sigma (AB)-\{0\}=\sigma (BA)-\{0\} σ(AB)−{0}=σ(BA)−{0}

    证:
    设 A B x = λ x ABx=\lambda x ABx=λx,其中 λ ≠ 0 , x ≠ 0 \lambda \neq 0,x\neq 0 λ​=0,x​=0,则有 B x ≠ 0 Bx\neq 0 Bx​=0(若 B x = 0 Bx=0 Bx=0,则 λ x = A B x = 0 \lambda x=ABx=0 λx=ABx=0与 λ ≠ 0 , x ≠ 0 \lambda \neq 0,x\neq 0 λ​=0,x​=0矛盾)。用 B B B左乘式的两端,得 B ( A B x ) = B A ( B x ) = B ( λ x ) = λ ( B x ) B(ABx)=BA(Bx)=B(\lambda x)=\lambda (Bx) B(ABx)=BA(Bx)=B(λx)=λ(Bx),故 λ \lambda λ是 B A BA BA的一个特征值。同理可证 B A BA BA的非零特征值都是 A B AB AB的特征值。
    【注】实际上有更强的结论:不但 A B AB AB与 B A BA BA有相同的非零特征值,而且 A B AB AB与 B A BA BA的同一非零特征值的代数重数也是相等的,证明详见后文的Sylvester定理。

  • A A H AA^H AAH和 A H A A^HA AHA的同一个非零特征值的几何重数相等

    证明:
    该结论实际上可推广为 A B AB AB和 B A BA BA的同一非零特征值的几何重数相等,下面证明推广后的结论。

    【推广】设 A ∈ F m × n A\in F^{m\times n} A∈Fm×n, B ∈ F n × m B\in F^{n\times m} B∈Fn×m,则 A B AB AB和 B A BA BA的同一非零特征值的几何重数相等

    证:
    设 λ \lambda{} λ是 A B AB AB和 B A BA BA的一个非零特征值, A B AB AB的特征子空间 N ( λ I − A B ) N(\lambda I-AB) N(λI−AB)的维数为 s s s。取 N ( λ I − A B ) N(\lambda I-AB) N(λI−AB)的一组基 x 1 , x 2 , ⋯ , x s x_1,x_2,\cdots,x_s x1​,x2​,⋯,xs​,则易验证 B x 1 , B x 2 , ⋯ , B x s Bx_1,Bx_2,\cdots,Bx_s Bx1​,Bx2​,⋯,Bxs​都是 B A BA BA关于 λ \lambda λ的特征向量,有 B x 1 , B x 2 , ⋯ , B x s ∈ N ( λ I − B A ) Bx_1,Bx_2,\cdots,Bx_s\in N(\lambda I-BA) Bx1​,Bx2​,⋯,Bxs​∈N(λI−BA)。设 k 1 B x 1 + ⋯ + k s B x s = 0 k_1Bx_1+\cdots+k_sBx_s=0 k1​Bx1​+⋯+ks​Bxs​=0,用 A A A左乘该式两端得 λ ( k 1 x 1 + ⋯ + k s x s ) = 0 \lambda{}(k_1x_1+\cdots+k_sx_s)=0 λ(k1​x1​+⋯+ks​xs​)=0,由于 λ ≠ 0 \lambda{}\neq0 λ​=0,所以 k 1 x 1 + ⋯ + k s x s = 0 k_1x_1+\cdots+k_sx_s=0 k1​x1​+⋯+ks​xs​=0,由于 x 1 , x 2 , ⋯ , x s x_1,x_2,\cdots,x_s x1​,x2​,⋯,xs​线性无关,故 k 1 = ⋯ = k s = 0 k_1=\cdots=k_s=0 k1​=⋯=ks​=0,故 B x 1 , B x 2 , ⋯ , B x s Bx_1,Bx_2,\cdots,Bx_s Bx1​,Bx2​,⋯,Bxs​是线性无关的。这说明 dim ⁡ N ( λ I − B A ) ⩾ s = dim ⁡ N ( λ I − A B ) \dim N(\lambda I-BA)\geqslant s=\dim N(\lambda I-AB) dimN(λI−BA)⩾s=dimN(λI−AB)。同理可证 dim ⁡ N ( λ I − A B ) ⩾ dim ⁡ N ( λ I − B A ) \dim N(\lambda I-AB)\geqslant \dim N(\lambda I-BA) dimN(λI−AB)⩾dimN(λI−BA)。故 dim ⁡ N ( λ I − A B ) = dim ⁡ N ( λ I − B A ) \dim N(\lambda I-AB)=\dim N(\lambda I-BA) dimN(λI−AB)=dimN(λI−BA),得证。

  • A A H AA^H AAH和 A H A A^HA AHA的同一个非零特征值的代数重数相等
    证明:由后文Sylvester定理直接可得。

以上结论都限定在特征值非零的情况下,这是因为可能 A A H AA^H AAH和 A H A A^HA AHA两者中一个有零特征值,而另一个没有零特征值。例如,设A是 m × n m\times{n} m×n矩阵,当 m > n m>n m>n且A列满秩时,容易证明0一定是 A A H AA^H AAH的一个特征值,而一定不是 A H A A^HA AHA的一个特征值。


相似变换与相似对角化

相似矩阵及其性质

  • 定义:设 F F F是一数域, A , B ∈ F n × n A, B\in F^{n\times n} A,B∈Fn×n,若存在可逆矩阵 P ∈ F n × n P\in F^{n\times n} P∈Fn×n使得 P − 1 A P = B P^{-1}AP=B P−1AP=B,则称 A A A和 B B B相似;如果 F = C F=C F=C且 P P P是一个酋矩阵,则称 A A A和 B B B酋相似

根据等价关系的定义,矩阵之间的相似关系是一种等价关系。相似关系给出了矩阵集的一个划分(相当于给矩阵做了个分类),属于同一个等价类的矩阵之间是两两相似的,属于不同等价类的矩阵之间不相似。

从线性变换的角度,相似关系实际上是同一个线性变换在不同基下的矩阵之间的关系(考虑线性空间上基 U U U到基 V V V的过渡矩阵 P P P, P P P是可逆的,线性变换 T T T在 U U U下的矩阵 A A A和在 V V V下的矩阵 B B B之间有关系 B = P − 1 A P B=P^{-1}AP B=P−1AP,这一点请读者自行证明)。如果两个矩阵相似,那么它们是同一个线性变换在两组不同基下的矩阵。也就是说,相似矩阵只是我们从不同的视角(基)去观察同一个线性变换得到的不同描述罢了,它们实际上对应的是同一个东西。

既然相似矩阵对应的是同一个线性变换,不难猜到这些矩阵之间会有一些共性。下面就是矩阵的一些相似不变量。

  • 若n阶方阵A和B相似,则有以下结论:

    • r ( A ) = r ( B ) r(A)=r(B) r(A)=r(B)

    • d e t ( A ) = d e t ( B ) det(A)=det(B) det(A)=det(B)

    • t r ( A ) = t r ( B ) tr(A)=tr(B) tr(A)=tr(B)

    • σ ( A ) = σ ( B ) \sigma(A)=\sigma(B) σ(A)=σ(B)

    • A和B的同一特征值的代数重数相等

    • A和B的同一特征值的几何重数相等

      第4、5条的证明:
      d e t ( λ I − B ) = d e t ( λ I − P − 1 A P ) = d e t ( P − 1 ( λ I − A ) P ) = d e t ( P − 1 ) d e t ( λ I − A ) d e t ( P ) = d e t ( λ I − A ) det(\lambda{I}-B)=det(\lambda{I}-P^{-1}AP)=det(P^{-1}(\lambda{I}-A)P)\\=det(P^{-1})det(\lambda{I}-A)det(P)=det(\lambda{I}-A) det(λI−B)=det(λI−P−1AP)=det(P−1(λI−A)P)=det(P−1)det(λI−A)det(P)=det(λI−A)即A和B的特征多项式相同,从而有 σ ( A ) = σ ( B ) \sigma(A)=\sigma(B) σ(A)=σ(B)以及代数重数相等的结论。

      第6条的证明:
      r ( λ I − B ) = r ( λ I − P − 1 A P ) = r ( P − 1 ( λ I − A ) P ) = r ( λ I − A ) r(\lambda{I}-B)=r(\lambda{I}-P^{-1}AP)\\=r(P^{-1}(\lambda{I}-A)P)=r(\lambda{I}-A) r(λI−B)=r(λI−P−1AP)=r(P−1(λI−A)P)=r(λI−A)故 ( λ I − A ) x = 0 (\lambda{I}-A)x=0 (λI−A)x=0和 ( λ I − B ) x = 0 (\lambda{I}-B)x=0 (λI−B)x=0的基础解系解向量个数相同(均为 n − r ( λ I − A ) n-r(\lambda{I}-A) n−r(λI−A)),从而 dim ⁡ N ( λ I − A ) = dim ⁡ N ( λ I − B ) \dim N(\lambda{I}-A)=\dim N(\lambda{I}-B) dimN(λI−A)=dimN(λI−B),得证。

Sylvester定理(矩阵 A B AB AB与 B A BA BA的特征多项式之间的关系)


【注1】图中的证明其实不完整,证明的结尾只说明了特征值的关系,在一般的数域 F F F下这没法直接得到命题的结论(即行列式等式)(但在数域 C C C下是可以这么做的)。前面我们证明了相似矩阵的特征多项式相同,实际上用这一结论可以得到最终的行列式等式:
因为 [ B A O A O ] \begin{bmatrix}BA&O\\A&O\end{bmatrix} [BAA​OO​]与 [ O O A A B ] \begin{bmatrix}O&O\\A&AB\end{bmatrix} [OA​OAB​]相似,故 d e t ( λ I m + n − [ B A O A O ] ) = d e t ( λ I m + n − [ O O A A B ] ) det\left(\lambda I_{m+n}-\begin{bmatrix}BA&O\\A&O\end{bmatrix}\right)=det\left(\lambda I_{m+n}-\begin{bmatrix}O&O\\A&AB\end{bmatrix}\right) det(λIm+n​−[BAA​OO​])=det(λIm+n​−[OA​OAB​]),即 d e t [ λ I n − B A O − A λ I m ] = d e t [ λ I n O − A λ I m − A B ] det\begin{bmatrix}\lambda I_n-BA&O\\-A&\lambda I_m\end{bmatrix}=det\begin{bmatrix}\lambda I_n&O\\-A&\lambda I_m-AB\end{bmatrix} det[λIn​−BA−A​OλIm​​]=det[λIn​−A​OλIm​−AB​],运用拉普拉斯展开式就有 λ m d e t ( λ I n − B A ) = λ n d e t ( λ I m − A B ) \lambda^mdet(\lambda I_n-BA)=\lambda^ndet(\lambda I_m-AB) λmdet(λIn​−BA)=λndet(λIm​−AB)。

【注2】等式 λ m d e t ( λ I n − B A ) = λ n d e t ( λ I m − A B ) \lambda^mdet(\lambda I_n-BA)=\lambda^ndet(\lambda I_m-AB) λmdet(λIn​−BA)=λndet(λIm​−AB)给出了 A B AB AB与 B A BA BA的特征多项式的关系,且蕴含了 A B AB AB与 B A BA BA的同一非零特征值的代数重数相等这一事实。注意该式不要求 m ⩾ n m\geqslant n m⩾n,对 m < n m\lt n m<n也是成立的。

【注3】证明中的分块矩阵恒等式可通过分块矩阵的初等变换构造而来,请读者自行思考。(分块矩阵的初等变换见矩阵论(零):线性代数基础知识整理(1)——逆矩阵、初等变换、满秩分解)

相似对角化及其条件

  • 定义:设 F F F为一数域,若 A ∈ F n × n A\in F^{n\times n} A∈Fn×n相似于一个对角矩阵 Σ ∈ F n × n \Sigma\in F^{n\times n} Σ∈Fn×n,则称 A A A可对角化

    【注】需要区分对角化与酋对角化/正交相似对角化的区别:首先,酋对角化是在复数域下的,正交相似对角化是在实数域下的,而相似对角化是在任意一个数域下都有的概念。其次,一个矩阵可对角化是指它可相似对角化,酋对角化/正交相似对角化只是相似对角化的一种情形。一个矩阵可以相似对角化,不代表它可以酋对角化/正交相似对角化。(酋对角化实际上就是谱分解/特征值分解,具体可见矩阵论(二):矩阵分解—从Schur分解、特征值分解EVD到奇异值分解SVD)

根据前面的讨论,对角化实际上就是找到线性空间的某组基,在这组基下线性变换的矩阵是一个对角阵,是用矩阵去描述线性变换时的最简形式。

  • 定理:设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n,则 A A A可对角化的充要条件为 A A A有 n n n个线性无关的特征向量

    【注】定理的证明过程说明,可逆矩阵P的列向量组是A的n个线性无关的特征向量;P的列向量组的排列顺序和对角矩阵对角元(特征值)的排列顺序是相对应的。注意证明过程并没有指定特征值必须有什么顺序,就构造出了P。因此P的列向量的顺序是可以调整的,相应地对角矩阵对角线上的特征值的排列顺序随之调整

  • 定理:设 A ∈ C n × n A\in C^{n\times n} A∈Cn×n,则 A A A可对角化的充要条件为 A A A的每个特征值的几何重数等于代数重数

    证:
    注意方阵A可对角化的充要条件为 A A A有 n n n个线性无关的特征向量,而 A A A的每个特征值的几何重数不大于代数重数,注意复矩阵的不同的特征值的代数重数之和为n,显然只有 A A A的每个特征值的几何重数等于代数重数时, A A A才有 n n n个线性无关的特征向量。

    【注】该结论对一般的数域并不成立。对一般的数域 F F F而言,还要加一个条件“ A A A的特征方程在域 F F F内恰好有n个根”,才能保证 A A A可对角化。

  • 定理:设 A ∈ F n × n A\in F^{n\times n} A∈Fn×n, A A A有s个互不相同的特征值 λ 1 , λ 2 , . . . , λ s ∈ F \lambda_1,\lambda_2,...,\lambda_s\in F λ1​,λ2​,...,λs​∈F,则 A A A可对角化的充要条件为 F n = ⊕ i = 1 s N ( λ i I − A ) F^n=\oplus_{i=1}^sN(\lambda_i I-A) Fn=⊕i=1s​N(λi​I−A)

    证:
    前面已经证明 A A A可对角化的充要条件是 A A A有n个线性无关的特征向量,所以我们只需要证明 A A A有n个线性无关的特征向量的充要条件为 F n = ⊕ i = 1 s N ( λ i I − A ) F^n=\oplus_{i=1}^sN(\lambda_i I-A) Fn=⊕i=1s​N(λi​I−A)。
    必要性:若 A A A有n个线性无关的特征向量,设它们分别为 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1​,x2​,...,xn​,且相应的特征值为 μ 1 , μ 2 , . . . , μ n \mu_1,\mu_2,...,\mu_n μ1​,μ2​,...,μn​,其中互不相同的特征值有 t ⩽ s t\leqslant s t⩽s个,分别为 λ i 1 , λ i 2 , . . . , λ i t \lambda_{i_1},\lambda_{i_2},...,\lambda_{i_t} λi1​​,λi2​​,...,λit​​。则 dim ⁡ ⊕ i = 1 s N ( λ i I − A ) ⩾ dim ⁡ ⊕ j = 1 t N ( λ i j I − A ) ⩾ n \dim \oplus_{i=1}^sN(\lambda_i I-A)\geqslant \dim \oplus_{j=1}^tN(\lambda_{i_j} I-A)\geqslant n dim⊕i=1s​N(λi​I−A)⩾dim⊕j=1t​N(λij​​I−A)⩾n。又由 ⊕ i = 1 s N ( λ i I − A ) ⊆ F n \oplus_{i=1}^sN(\lambda_i I-A)\subseteq F^n ⊕i=1s​N(λi​I−A)⊆Fn可知 dim ⁡ ⊕ i = 1 s N ( λ i I − A ) ⩽ dim ⁡ F n = n \dim \oplus_{i=1}^sN(\lambda_i I-A)\leqslant \dim F^n=n dim⊕i=1s​N(λi​I−A)⩽dimFn=n,因此 dim ⁡ ⊕ i = 1 s N ( λ i I − A ) = n \dim \oplus_{i=1}^sN(\lambda_i I-A)=n dim⊕i=1s​N(λi​I−A)=n,因此 F n = ⊕ i = 1 s N ( λ i I − A ) F^n=\oplus_{i=1}^sN(\lambda_i I-A) Fn=⊕i=1s​N(λi​I−A)。
    充分性:若 F n = ⊕ i = 1 s N ( λ i I − A ) F^n=\oplus_{i=1}^sN(\lambda_i I-A) Fn=⊕i=1s​N(λi​I−A),则 dim ⁡ ⊕ i = 1 s N ( λ i I − A ) = dim ⁡ F n = n \dim \oplus_{i=1}^sN(\lambda_i I-A)=\dim F^n=n dim⊕i=1s​N(λi​I−A)=dimFn=n,分别取 N ( λ i I − A ) N(\lambda_i I-A) N(λi​I−A), i = 1 , 2 , . . . , s i=1,2,...,s i=1,2,...,s的基,将它们合在一起就是 A A A的n个线性无关的特征向量。

相似对角化的一个应用:求解斐波那契数列的通项

相似对角化给出了矩阵的一个分解式 A = P − 1 Λ P A=P^{-1}\Lambda P A=P−1ΛP,其中 Λ = d i a g ( λ 1 , λ 2 , . . . , λ n ) \Lambda=diag(\lambda_1,\lambda_2,...,\lambda_n) Λ=diag(λ1​,λ2​,...,λn​)是对角矩阵。相似对角化的一个典型应用是简化矩阵的幂的计算。因为 A m = ( P − 1 Λ P ) m = P − 1 Λ m P A^m=(P^{-1}\Lambda P)^m=P^{-1}\Lambda^mP Am=(P−1ΛP)m=P−1ΛmP,所以 A A A的m次幂的计算就转化为了对角阵 Λ \Lambda Λ的m次幂的计算,而 Λ m = d i a g ( λ 1 m , λ 2 m , . . . , λ n m ) \Lambda^m=diag(\lambda_1^m,\lambda_2^m,...,\lambda_n^m) Λm=diag(λ1m​,λ2m​,...,λnm​),大大简化了计算。

下面举一个具体的例子体会一下:
斐波那契数列 a n {a_n} an​定义为 a 1 = a 2 = 1 a_1=a_2=1 a1​=a2​=1且满足递推关系 a n = a n − 1 + a n − 2 a_n=a_{n-1}+a_{n-2} an​=an−1​+an−2​。如何求斐波那契的通项呢?将递推关系式写成矩阵形式: [ a n a n − 1 ] = [ 1 1 1 0 ] [ a n − 1 a n − 2 ] = . . . = [ 1 1 1 0 ] n − 2 [ a 2 a 1 ] \begin{bmatrix}a_n\\a_{n-1}\end{bmatrix}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\begin{bmatrix}a_{n-1}\\a_{n-2}\end{bmatrix}=...=\begin{bmatrix}1&1\\1&0\end{bmatrix}^{n-2}\begin{bmatrix}a_2\\a_1\end{bmatrix} [an​an−1​​]=[11​10​][an−1​an−2​​]=...=[11​10​]n−2[a2​a1​​]如果能够计算出 [ 1 1 1 0 ] n − 2 \begin{bmatrix}1&1\\1&0\end{bmatrix}^{n-2} [11​10​]n−2,就能得到通项公式。直接计算 [ 1 1 1 0 ] n − 2 \begin{bmatrix}1&1\\1&0\end{bmatrix}^{n-2} [11​10​]n−2很难归纳出每个元素的形式,我们可以利用相似对角化:
首先求 [ 1 1 1 0 ] \begin{bmatrix}1&1\\1&0\end{bmatrix} [11​10​]的特征值 1 + 5 2 , 1 − 5 2 \frac{1+\sqrt{5}}{2},\frac{1-\sqrt{5}}{2} 21+5 ​​,21−5 ​​,然后分别求这两个特征值对应的特征向量,得到 1 + 5 2 \frac{1+\sqrt{5}}{2} 21+5 ​​对应的一个特征向量 [ 1 + 5 2 1 ] \begin{bmatrix}\frac{1+\sqrt{5}}{2}\\1\end{bmatrix} [21+5 ​​1​], 1 − 5 2 \frac{1-\sqrt{5}}{2} 21−5 ​​对应的一个特征向量 [ 1 − 5 2 1 ] \begin{bmatrix}\frac{1-\sqrt{5}}{2}\\1\end{bmatrix} [21−5 ​​1​],于是有如下分解式: [ 1 1 1 0 ] = [ 1 + 5 2 1 − 5 2 1 1 ] [ 1 + 5 2 0 0 1 − 5 2 ] [ 1 + 5 2 1 − 5 2 1 1 ] − 1 \begin{bmatrix}1&1\\1&0\end{bmatrix}=\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}\begin{bmatrix}\frac{1+\sqrt{5}}{2}&0\\0&\frac{1-\sqrt{5}}{2}\end{bmatrix}\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}^{-1} [11​10​]=[21+5 ​​1​21−5 ​​1​][21+5 ​​0​021−5 ​​​][21+5 ​​1​21−5 ​​1​]−1则 [ a n a n − 1 ] = [ 1 1 1 0 ] n − 2 [ a 2 a 1 ] = [ 1 + 5 2 1 − 5 2 1 1 ] [ 1 + 5 2 0 0 1 − 5 2 ] n − 2 [ 1 + 5 2 1 − 5 2 1 1 ] − 1 [ a 2 a 1 ] = [ 1 + 5 2 1 − 5 2 1 1 ] [ ( 1 + 5 2 ) n − 2 0 0 ( 1 − 5 2 ) n − 2 ] [ 1 + 5 2 1 − 5 2 1 1 ] − 1 [ 1 1 ] = 1 5 [ ( 1 + 5 2 ) n − ( 1 − 5 2 ) n ( 1 + 5 2 ) n − 1 − ( 1 − 5 2 ) n − 1 ] \begin{aligned}\begin{bmatrix}a_n\\a_{n-1}\end{bmatrix}&=\begin{bmatrix}1&1\\1&0\end{bmatrix}^{n-2}\begin{bmatrix}a_2\\a_1\end{bmatrix}\\&=\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}\begin{bmatrix}\frac{1+\sqrt{5}}{2}&0\\0&\frac{1-\sqrt{5}}{2}\end{bmatrix}^{n-2}\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}^{-1}\begin{bmatrix}a_2\\a_1\end{bmatrix}\\&=\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}\begin{bmatrix}(\frac{1+\sqrt{5}}{2})^{n-2}&0\\0&(\frac{1-\sqrt{5}}{2})^{n-2}\end{bmatrix}\begin{bmatrix}\frac{1+\sqrt{5}}{2}&\frac{1-\sqrt{5}}{2}\\1&1\end{bmatrix}^{-1}\begin{bmatrix}1\\1\end{bmatrix}\\&=\frac{1}{\sqrt{5}}\begin{bmatrix}(\frac{1+\sqrt{5}}{2})^n-(\frac{1-\sqrt{5}}{2})^n\\(\frac{1+\sqrt{5}}{2})^{n-1}-(\frac{1-\sqrt{5}}{2})^{n-1}\end{bmatrix}\end{aligned} [an​an−1​​]​=[11​10​]n−2[a2​a1​​]=[21+5 ​​1​21−5 ​​1​][21+5 ​​0​021−5 ​​​]n−2[21+5 ​​1​21−5 ​​1​]−1[a2​a1​​]=[21+5 ​​1​21−5 ​​1​][(21+5 ​​)n−20​0(21−5 ​​)n−2​][21+5 ​​1​21−5 ​​1​]−1[11​]=5 ​1​[(21+5 ​​)n−(21−5 ​​)n(21+5 ​​)n−1−(21−5 ​​)n−1​]​故 a n = 1 5 [ ( 1 + 5 2 ) n − ( 1 − 5 2 ) n ] a_n=\frac{1}{\sqrt{5}}[(\frac{1+\sqrt{5}}{2})^n-(\frac{1-\sqrt{5}}{2})^n] an​=5 ​1​[(21+5 ​​)n−(21−5 ​​)n]。

矩阵论(零):线性代数基础知识整理(5)——特征值与相似相关推荐

  1. 矩阵论(零):线性代数基础知识整理(1)——逆矩阵、(广义)初等变换、满秩分解

    矩阵论专栏:专栏(文章按照顺序排序) 线性代数是矩阵论的先修课程,本篇博客整理线性代数的基础理论知识,为矩阵论的学习做准备.限于篇幅,梳理的重点将在定理和结论上(只给出部分必要的定义),对最基础的概念 ...

  2. 矩阵论(零):线性代数基础知识整理(2)——矩阵的秩与向量组的秩

    矩阵论专栏:专栏(文章按照顺序排序) 本篇博客承接上篇矩阵论(零):线性代数基础知识整理(1)--逆矩阵.初等变换.满秩分解,主要整理秩相关的结论. 线性方程组的解与向量组的秩 线性方程组的解(初步讨 ...

  3. 线性代数基础知识整理

    线性代数基础知识 因为总是忘记线代的一些基础知识,因此在这里整理记录一下. 1.常见的特殊矩阵 1.1.正交矩阵 定义:对于一个n维矩阵A,若满足以下条件,则A为正交矩阵. A A T = I n A ...

  4. CSP-S初赛基础知识整理

    文章目录 CSP-S初赛基础知识整理 RT [1]计算机基础知识 计算机系统的组成 计算机硬件的五大组成 [1-2]进制及其转化和运算 [1-2]二进制 [1]基本定义及应用 [1]基本运算 [2]位 ...

  5. 电学基础知识整理(一)

    电学基础知识整理(一) 电荷及其守恒定律 电荷 电荷量 库伦定律 电场 电场概念 电场强度 电场线 电势能与电势 静电场做功 势能与做功的关系 电势能(E~p~) 电势(φ) 等势面 电势差(电压) ...

  6. python常用变量名_python基础知识整理

    Python Python开发 Python语言 python基础知识整理 序言:本文简单介绍python基础知识的一些重要知识点,用于总结复习,每个知识点的具体用法会在后面的博客中一一补充程序: 一 ...

  7. 计算机二级c语基础知识,计算机二级C语基础知识整理.doc

    计算机二级C语基础知识整理 1.1 算法 算法:是一组有穷指令集,是解题方案的准确而完整的描述.通俗地说,算法就是计算机解题的过程.算法不等于程序,也不等于计算方法,程序的编制不可能优于算法的设计. ...

  8. 使用Aspose.Cells的基础知识整理

    使用Aspose.Cells的基础知识整理 转自 http://www.cnblogs.com/kenblove/archive/2009/01/07/1371104.html 这两天用Aspose. ...

  9. 前端基础知识整理汇总(中)

    前端基础知识整理汇总(中) Call, bind, apply实现 // call Function.prototype.myCall = function (context) {context = ...

最新文章

  1. java mp3播放器 无界面
  2. 论numpy中matrix 和 array的区别
  3. mysql的varchar要根据实际长度来申请
  4. Windows 10 中 Eclipse中无法添加Courier New字体的解决方法!
  5. GPS定位系统源码只有这种才是最适合做二次开发的...
  6. JAVA记事本的图形用户界面应用程序含过滤
  7. tomcat7查看后台管理怎么设置用户名和密码
  8. build文件_把编译时间加入到目标文件
  9. C++中 Vector使用方法
  10. Robo 3T 安装连接 MongoDB
  11. 【C语言期末实训】学生学籍管理系统
  12. var和function谁先优先执行_js函数和变量的执行顺序【易错】
  13. C++中对象初始化赋值是否需要调用operator=函数
  14. win10 摄像头启动不了
  15. 录制电脑游戏视频的方法
  16. 郭天祥51单片机笔记(一)
  17. 树莓派4B刷openwrt软路由系统,树莓派做有线路由器的扩展实现各种自定义操作
  18. STATA 学习笔记 :相关系数
  19. Google浏览器打开axure产品原型的解决方案
  20. 巧解决阿里云虚拟主机免费版被DDOS攻击问题

热门文章

  1. CSS动画- 两固定点之间实现曲线运动
  2. 家用计算机历史记录,怎么查上网的历史记录?
  3. 视频播放--MPMoviePlayerController
  4. Ubuntu C/C++ 获取系统时间
  5. 第三十三章:木块砌墙
  6. java调用区块链智能合约
  7. CV学习笔记 | CV综述 [2020.10.01]
  8. Push mail同步outlook文件夹设置
  9. 关于 The RPC server is unavailable
  10. CTF二维码题(01转二维码)