引言:如何判定两个矩阵相似

相似矩阵,本质上是同一个线性变换在不同坐标系下的矩阵
因此,两个矩阵相似的一大特点是:特征值相同,各特征值的几何重数/代数重数相同

进而,我们可以用特征多项式、特征值、行列式、迹、秩 等相似不变量来迅速辅助判定两个矩阵是否相似,但这些都不是充要条件

两个矩阵相似的充要条件:两个矩阵具有相同的Jordan标准型(包含了大量信息,如特征值、代数/几何重数、特征向量和可对角化判定的信息,下面会说明)

  • Jordan标准型是一整个“相似矩阵大家族”的典型代表,根据相似关系的传递性,上述结论显然

Jordan标准型

Jordan标准型可以视为一种“矩阵三角化”。(ps. 也可以理解为一种由Jordan块构成的主对角分块矩阵)

对于n阶方阵 A \mathbf A A,一定存在正交矩阵/酉矩阵 Q \mathbf Q Q使 A \mathbf A A相似于上三角阵: A = Q U Q T \mathbf A=\mathbf Q\mathbf U\mathbf Q^T A=QUQT,详见矩阵三角化的 Schur 定理
如果将正交矩阵改为普通的可逆矩阵 P \mathbf P P,同样可以得到上三角阵 J \mathbf J J,即Jordan标准型: A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1} A=PJP−1

为何要三角化?Jordan标准型是由于无法相似对角化而提出的,而上三角阵就是最接近对角矩阵的“最佳形式”

Jordan标准型的一般形式

任何方阵 A \mathbf A A都相似于一个Jordan标准型: A = P J P − 1 \mathbf A=\mathbf P\mathbf J\mathbf P^{-1} A=PJP−1

Jordan标准型 J \mathbf J J由多个Jordan块组成
J = [ J m 1 ( λ 1 ) 0 ⋯ 0 0 J m 2 ( λ 2 ) ⋯ 0 ⋮ ⋮ ⋱ ⋱ 0 0 ⋯ J m k ( λ k ) ] ,其中 J m i ( λ i ) = [ λ i 1 ⋱ ⋱ ⋱ 1 λ i ] m i × m i \mathbf J=\left[\begin{array}{cccc} J_{m_1}\left(\lambda_{1}\right) & 0 & \cdots & 0 \\ 0 & J_{m_2}\left(\lambda_{2}\right) & \cdots & 0 \\ \vdots & \vdots & \ddots & \ddots \\ 0 & 0 & \cdots & J_{m_k}\left(\lambda_{k}\right) \end{array}\right],其中J_{m_i}\left(\lambda_{i}\right)=\left[\begin{array}{cccc} \lambda_{i} & 1 & \\ & \ddots & \ddots & \\ & & \ddots & 1 \\ & & & \lambda_{i} \end{array}\right]_{m_i\times m_i} J= ​Jm1​​(λ1​)0⋮0​0Jm2​​(λ2​)⋮0​⋯⋯⋱⋯​00⋱Jmk​​(λk​)​ ​,其中Jmi​​(λi​)= ​λi​​1⋱​⋱⋱​1λi​​ ​mi​×mi​​
一般默认的排列顺序为 λ 1 ≥ λ 2 ≥ . . . ≥ λ k \lambda_1\geq\lambda_2\geq...\geq\lambda_k λ1​≥λ2​≥...≥λk​

每个Jordan块 J ( λ i ) J\left(\lambda_{i}\right) J(λi​)的对角线上为特征值 λ i \lambda_{i} λi​,对角线上方全为1

Jordan标准型中隐含的信息

  • 特征值: J \mathbf J J的所有主对角元 λ 1 , . . . , λ k \lambda_1,...,\lambda_k λ1​,...,λk​

  • 特征值 λ i \lambda_i λi​的代数重数 β i \beta_i βi​: J \mathbf J J的对角线上 λ i \lambda_i λi​的出现次数(特征值 λ i \lambda_i λi​的重根数)
    ps. 代数重数满足 β i + β 2 + . . . + β k = n \beta_i+\beta_2+...+\beta_k=n βi​+β2​+...+βk​=n

  • 特征值 λ i \lambda_i λi​的几何重数 n i n_i ni​:主对角元为 λ i \lambda_i λi​的Jordan块个数
    (一个Jordan块对应一个独立的特征向量/一个几何重数)

    矩阵可对角化,那么其所有特征值的几何重数=代数重数,也就是说其Jordan标准型中所有的Jordan块都必须为1阶的

    或者说,可对角化矩阵,其Jordan标准型就是一个对角矩阵

  • 某个Jordan块的特征向量(不是原矩阵 A \mathbf A A的特征向量):

每个Jordan块可以被写为 J m ( λ ) = [ λ 1 ⋱ ⋱ ⋱ 1 λ ] = [ λ ⋱ ⋱ λ ] + [ 0 1 ⋱ ⋱ ⋱ 1 0 ] = λ I m + J m ( 0 ) \begin{aligned}J_{m}(\lambda)&=\left[\begin{array}{cccc}\lambda & 1 & & \\& \ddots & \ddots & \\& & \ddots & 1 \\& & & \lambda\end{array}\right] \\ &=\left[\begin{array}{llll}\lambda & & & \\& \ddots & & \\& & \ddots & \\& & & \lambda\end{array}\right] +\left[\begin{array}{llll}0 & 1 & & \\& \ddots & \ddots & \\& & \ddots & 1 \\& & & 0\end{array}\right] \\ &=\lambda I_{m}+J_{m}(0)\end{aligned} Jm​(λ)​= ​λ​1⋱​⋱⋱​1λ​ ​= ​λ​⋱​⋱​λ​ ​+ ​0​1⋱​⋱⋱​10​ ​=λIm​+Jm​(0)​这是一个单位阵和一个幂零(nilpotent)矩阵
①单位阵的特征值为 λ \lambda λ,特征向量为任意向量( λ I m x = λ x \lambda\bold I_{m}\bold x=\lambda\bold x λIm​x=λx)
②幂零矩阵 J m ( 0 ) J_{m}(0) Jm​(0)的特征值为0,且相应的特征子空间维数为 m − r a n k = 1 m-rank=1 m−rank=1,唯一的(单位长度)特征向量为 e 1 \bold e_1 e1​( J m ( 0 ) e 1 = 0 J_{m}(0)\bold e_1=\bold 0 Jm​(0)e1​=0),而对于其他标准单位向量则有 J m ( 0 ) e i = e i − 1 , i > 1 J_{m}(0)\bold e_i=\bold e_{i-1},i>1 Jm​(0)ei​=ei−1​,i>1
由②,Jordan块的特征向量必然是标准单位向量(例如 e i \bold e_i ei​代表单位阵 E \bold E E的第 i i i列)

综合①②可知,该Jordan块的特征向量为 J m ( λ ) e 1 = λ e 1 J m ( λ ) e i = λ e i + e i − 1 , i = 2 , … , m J_{m}(\lambda) \mathbf{e}_{1}=\lambda \mathbf{e}_{1} \\ J_{m}(\lambda) \mathbf{e}_{i}=\lambda \mathbf{e}_{i}+\mathbf{e}_{i-1}, \quad i=2, \ldots, m Jm​(λ)e1​=λe1​Jm​(λ)ei​=λei​+ei−1​,i=2,…,m

可以看出,每个 m m m阶的Jordan块 J m ( 0 ) J_{m}(0) Jm​(0)有且仅有一个特征向量 e 1 \mathbf{e}_{1} e1​(因此上面说“一个Jordan块对应一个几何重数”),而其余的 m − 1 m-1 m−1个标准单位向量 e 2 , e 3 , . . . , e m \mathbf{e}_{2},\mathbf{e}_{3},...,\mathbf{e}_{m} e2​,e3​,...,em​称为广义特征向量(generalized eigenvector)

(可对角化的矩阵,其无关特征向量可张成整个空间,而Jordan标准型的情况,其所有广义特征向量张成整个空间),详见Jordan 形式大解读 (上) | 线代启示录

  • 举例说明:

例如
J A = b l k d i a g ( [ 2 1 0 0 0 2 1 0 0 0 2 0 0 0 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( [ 2 1 0 0 2 1 0 0 2 ] , [ 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( J 3 ( 2 ) , J 2 ( 2 ) , J 2 ( 3 ) ) 和 J B = b l k d i a g ( [ 2 1 0 0 0 2 0 0 0 0 2 1 0 0 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( [ 2 1 0 2 ] , [ 2 1 0 2 ] , [ 3 1 0 3 ] ) = b l k d i a g ( J 2 ( 2 ) , J 2 ( 2 ) , J 2 ( 3 ) ) \begin{aligned}\mathbf J_{A} &=blkdiag(\left[\begin{array}{lll|l} 2 & 1 & 0 & 0 \\0 & 2 & 1 & 0 \\0 & 0 & 2 & 0 \\\hline 0 & 0 & 0 & 2\end{array}\right],\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(\left[\begin{array}{lll}2 & 1 & 0 \\0 & 2 & 1 \\0 & 0 & 2\end{array}\right], [2], \left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(J_3(2),J_2(2),J_2(3))\end{aligned}和\begin{aligned}\mathbf J_{B}&=blkdiag(\left[\begin{array}{ll|ll} 2 & 1 & 0 & 0 \\0 & 2 & 0 & 0 \\\hline 0 & 0 & 2 & 1 \\0 & 0 & 0 & 2\end{array}\right] ,\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right]) \\ &=blkdiag(\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right], \left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right], \left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right])\\ &=blkdiag(J_2(2),J_2(2),J_2(3))\end{aligned} JA​​=blkdiag( ​2000​1200​0120​0002​​ ​,[30​13​])=blkdiag( ​200​120​012​ ​,[2],[30​13​])=blkdiag(J3​(2),J2​(2),J2​(3))​和JB​​=blkdiag( ​2000​1200​0020​0012​​ ​,[30​13​])=blkdiag([20​12​],[20​12​],[30​13​])=blkdiag(J2​(2),J2​(2),J2​(3))​
其中, J A \mathbf J_{A} JA​的特征值为 2 , 3 2,3 2,3:
特征值 2 2 2的代数重数为 4 4 4,几何重数为 2 2 2
特征值 3 3 3的代数重数为 2 2 2,几何重数为 1 1 1
J A \mathbf J_{A} JA​的特征值 2 2 2的两个特征向量为 [ 2 1 0 0 2 1 0 0 2 ] → e 1 = ( 1 , 0 , 0 , 0 , 0 , 0 ) T [ 2 ] → e 4 = ( 0 , 0 , 0 , 1 , 0 , 0 ) T \begin{aligned}{\left[\begin{array}{lll}2 & 1 & 0 \\0 & 2 & 1 \\0 & 0 & 2\end{array}\right]\rightarrow \mathbf{e}_{1}=(1,0,0,0,0,0)^{T}} \\ {[2] \rightarrow \mathbf{e}_{4}=(0,0,0,1,0,0)^{T}}\end{aligned} ​200​120​012​ ​→e1​=(1,0,0,0,0,0)T[2]→e4​=(0,0,0,1,0,0)T​;
J A \mathbf J_{A} JA​的特征值 3 3 3的特征向量为 [ 3 1 0 3 ] → e 5 = ( 0 , 0 , 0 , 0 , 1 , 0 ) T {\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right] \rightarrow \mathbf{e}_{5}=(0,0,0,0,1,0)^{T}} [30​13​]→e5​=(0,0,0,0,1,0)T

J B \mathbf J_{B} JB​的特征值为 2 , 3 2,3 2,3:
特征值 2 2 2的代数重数为 4 4 4,几何重数为 2 2 2
特征值 3 3 3的代数重数为 2 2 2,几何重数为 1 1 1
J B \mathbf J_{B} JB​的特征值 2 2 2的两个特征向量为 [ 2 1 0 2 ] → e 1 = ( 1 , 0 , 0 , 0 , 0 , 0 ) T [ 2 1 0 2 ] → e 3 = ( 0 , 0 , 1 , 0 , 0 , 0 ) T \begin{aligned}{\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right] \rightarrow \mathbf{e}_{1}=(1,0,0,0,0,0)^{T}} \\ {\left[\begin{array}{ll}2 & 1 \\0 & 2\end{array}\right] \rightarrow \mathbf{e}_{3}=(0,0,1,0,0,0)^{T}}\end{aligned} [20​12​]→e1​=(1,0,0,0,0,0)T[20​12​]→e3​=(0,0,1,0,0,0)T​;
J B \mathbf J_{B} JB​的特征值 3 3 3的特征向量为 [ 3 1 0 3 ] → e 5 = ( 0 , 0 , 0 , 0 , 1 , 0 ) T {\left[\begin{array}{ll}3 & 1 \\0 & 3\end{array}\right] \rightarrow \mathbf{e}_{5}=(0,0,0,0,1,0)^{T}} [30​13​]→e5​=(0,0,0,0,1,0)T

Jordan标准型的计算方式

见Jordan 形式大解读 (下)

Jordan标准型的应用

Jordan标准型在数值计算上的用处不大,但是可用于分析矩阵特征值情况,另外,证明两个矩阵相似的通用方法就是证明它们有相同的Jordan标准型

Reference:
Jordan 典型形式浅说 (上)
Jordan 典型形式浅说 (下)
Jordan 形式大解读 (上)
Jordan 形式大解读 (下)

矩阵理论| 基础:Jordan标准型(从Jordan标准型求代数重数/几何重数/特征向量)相关推荐

  1. 行列式因子、不变因子、初等因子、smith标准型、Jordan标准型、最小多项式的matlab实现

    版权声明:<–本博客所有内容均为自己在学习工作中的总结.摘录等-- --转载请注明出处-- --如有侵权请联系删除–> https://blog.csdn.net/ai359005521/ ...

  2. 高等工程数学 —— 第二章 (1) Smith标准型与Jordan标准型

    高等工程数学 -- 第二章 (1) Smith标准型与Jordan标准型 文章目录 高等工程数学 -- 第二章 (1) Smith标准型与Jordan标准型 不变因子与Smith标准型 行列式因子 行 ...

  3. matlab 若当标准型,若当标准型求解.pdf

    若当标准型求解 Jordan 标准形 其中 我们称 若当标准型的基本性质: • 任意矩阵A若当标准型J可以写成J=D+R 的形式, 那么DR= R D 证明:由于D和R为相同划分的块对角矩阵,因此乘积 ...

  4. PTA 基础编程题目集 7-18 二分法求多项式单根 C语言

    PTA 基础编程题目集 7-18 二分法求多项式单根 C语言 二分法求函数根的原理为:如果连续函数f(x)在区间[a,b]的两个端点取值异号,即f(a)f(b)<0,则它在这个区间内至少存在1个 ...

  5. 腾讯云服务器标准型SA2和标准型S2有什么区别?该如何选择?

    腾讯云服务器标准型S2和标准型SA2有什么区别?最大区别在于字母"A",A代表AMD CPU处理的意思,SA2是AMD处理器,而S2实例是Intel处理器,标准型SA2和标准型S2 ...

  6. 腾讯云服务器标准型SA2与标准型S2区别选择攻略

    码笔记需要购买一台腾讯云服务器,可选的腾讯云CVM实例规格有标准型S2和标准型SA2,如何选择呢?显然标准型SA2性价比更高,但是有什么区别呢?顾名思义,区别就在于SA2和S2中间的字母"A ...

  7. 腾讯云服务器标准型SA2和标准型S5哪里不同

    腾讯云标准型SA2和标准型S5区别在哪?这两款不是同一时期的机型.标准型SA2使用AMD CPU,标准型S5使用Intel CPU. 腾讯云标准型S5和标准型SA2有什么区别,看下面表格就更明白了 S ...

  8. 腾讯云服务器标准型S5和标准型SA2规格配置如何选择

    常有人问:腾讯云标准型S5和标准型SA2区别在哪里了.为啥标准S系列那么多型号,从1到5都有.其实这两个是不同时期的机型,并不能完全对标.标准型SA2大概对标标准型S5(同一时期).标准型SA1与标准 ...

  9. 腾讯云服务器cvm标准型S5以及标准型SA2规格配置是什么样的,该怎么去选择?

    常有人问:腾讯云标准型S5和标准型SA2区别在哪里了.为啥标准S系列那么多型号,从1到5都有.其实这两个是不同时期的机型,并不能完全对标.标准型SA2大概对标标准型S5(同一时期).标准型SA1与标准 ...

最新文章

  1. Mapped Statements collection does not contain value for 之运行异常原因
  2. 008_Queue消息模式发送映射消息
  3. java.lang.RuntimeException: Invalid action class configuration that references an unknown class name
  4. UVA-1515 Pool construction (最小割)
  5. 浅谈 Celery 分布式队列
  6. 小学二年几手工计算机的制作,小学二年级创意手工制作方法
  7. python无法在终端运行程序_解决项目pycharm能运行,在终端却无法运行的问题
  8. Makefile万能写法(gcc程序以及arm-linux-gcc程序)-转
  9. Luogu2467 SDOI2010 地精部落 DP
  10. 怎样快速做个 BI 系统
  11. GlobalMapper--去除tif影像黑边
  12. Markdown学习指南
  13. 2018蓝桥杯 明码 解题方法
  14. R语言检测异常值的几个案例
  15. 控制欲强的人都是什么心理?
  16. Mysql 同步 1236,因突然断电导致MySQL主从同步1236错误处理
  17. lg-1 x 怎么算_【言情】魔鬼的体温 by 藤萝为枝 敏感自卑男主x治愈天使女主 我凭美食成为国家宝藏by 十尾兔...
  18. chrome浏览器最新离线版下载 30-72版本全
  19. 以太网网卡的结构和工作原理
  20. DirectX11 纹理采样

热门文章

  1. 打包软件一键安装_InstallShield2015PremierComp打包软件安装步骤
  2. SWIM error [30006]: Comm init error: chip does not answer
  3. 两个List<T>对象做对比
  4. java 函数式接口与lambda表达式的关系
  5. 队列的存储结构和常见操作(c 语言实现)
  6. FPGA 处理视频SDRAM带宽计算(四画面视频分割器 4K@30输出)
  7. 新春钜献 | 数据科学中文速查表Hacksheet强势助攻你的大数据学习
  8. 现实中的无人机也可以像蜘蛛侠一样“吐丝”了
  9. IDEA Maven配置了阿里云代理还是报错
  10. blender大理石纹理