第五章 特征值的估计及对称矩阵的极性

文章目录

  • 第五章 特征值的估计及对称矩阵的极性
    • 一、特征值的估计
      • 1.1. 特征值的界
      • 1.2. 盖尔圆 Gerschgorin
      • 1.3. Ostrowski
    • 二、广义特征值问题
    • 三、对称矩阵特征值的极性
      • 3.1. 实对称矩阵的Rayleigh商的极性
        • 3.1.3 实对称矩阵的扰动
      • 3.2. 广义特征值的极小极大原理
    • 四、矩阵的直积与应用
      • 4.1. 直积的概念
      • 4.2. 线性矩阵方程的可解性

注:
1.本章讨论的是" 方阵“的特征值。
2.复数域上的方阵 An∗nA_{n*n}An∗n​特征值个数=阶数n。

一、特征值的估计

  • 原因/背景:
    1)大矩阵特征值的计算困难;
    2)大量应用中,不需要精确计算特征值,只需估测出其范围即可。
特征值的估计
1. 任一特征值模的上界估计
2. 所有特征值的模之积的上下界估计
3. 所有特征值的模的平方和的上界估计
特征值的实部
特征值的虚部

1.1. 特征值的界

  1. 特征值的模的上下界估计:
    是对每个特征值做估计.
- 特征值模的 虚部的 上界估计:
1)[Im(λ)]≤Mn(n−1)2[Im(\lambda)]≤M\sqrt{\frac{n(n-1)}{2}}[Im(λ)]≤M2n(n−1)​​,
其中,M=max12[ars−asr]M=max\frac{1}{2}[a_{rs}-a_{sr}]M=max21​[ars​−asr​],考察了矩阵的对称程度。
2)[Im(λ)]≤12[[A−AH]]m无穷[Im(\lambda)]≤\frac{1}{2}[[A-A^H]]_{m无穷}[Im(λ)]≤21​[[A−AH]]m无穷​
- [在估计特征值虚部的上界时,(1)比(2)结果更精准。]
- 特征值模的 实部的 上界估计:
1)[Re(λ)]≤12[[A+AH]]m无穷[Re(\lambda)]≤\frac{1}{2}[[A+A^H]]_{m无穷}[Re(λ)]≤21​[[A+AH]]m无穷​
2)[λ]≤ρ(A)≤[[A]]m无穷[\lambda]≤\rho(A)≤[[A]]_{m无穷}[λ]≤ρ(A)≤[[A]]m无穷​
- 以上 得到以下推论:
1. 实对称矩阵的特征值都是实数。
2. Hermite矩阵的特征值都是实数。A=AHA=A^HA=AH
3. 反Hermite矩阵的特征值都是零或虚数。A=−AHA=-A^HA=−AH
  1. 特征值的模之积的上下界估计:
    是对全体特征值做估计.
矩阵A满足的特点 特征值的模的积的上下界估计
1)按行严格对角占优 0<∏r=1nmr≤[detA]=∏r=1n[λr(A)]≤∏r=1nMr0<\prod_{r=1}^n m_r≤[detA]=\prod_{r=1}^n[\lambda_r(A)]≤\prod_{r=1}^n M_r0<∏r=1n​mr​≤[detA]=∏r=1n​[λr​(A)]≤∏r=1n​Mr​.
等号成立:ars=0a_{rs}=0ars​=0(s>r).
2)一般方阵 [detA]=∏r=1n[λr(A)]≤[∏s=1n(∑r=1n[ars]2)]1/2[detA]=\prod_{r=1}^n[\lambda_r(A)]≤[\prod_{s=1}^n(\sum_{r=1}^n [a_{rs}]^2)]^{1/2}[detA]=∏r=1n​[λr​(A)]≤[∏s=1n​(∑r=1n​[ars​]2)]1/2.
等号成立:某列as0=0a_{s_0}=0as0​​=0或 列向量两两相交(ar,as)=0(a_r,a_s)=0(ar​,as​)=0.
也即,特征值的模的积≤矩阵(各列元素的2-范数之和)的乘积。

其中,

- 涉及的几个小概念:
1. Rr(A)R_r(A)Rr​(A):第r行,除对角元素arra_{rr}arr​外其他所有元素的模之和
2. Mr(A)M_r(A)Mr​(A):第r行,对角元素arra_{rr}arr​与其右侧所有元素的模之和
3. mr(A)m_r(A)mr​(A):第r行,对角元素arra_{rr}arr​与其右侧所有元素的模之差
4. 按行严格对角占优:第r行,对角元素arra_{rr}arr​的模 > Rr(A)R_r(A)Rr​(A)
5. 按行弱对角占优:第r行,对角元素arra_{rr}arr​的模 ≥ Rr(A)R_r(A)Rr​(A),且存在r0∈[1,n]r_0∈[1,n]r0​∈[1,n],使得ar0r0a_{r_0r_0}ar0​r0​​的模>Rr0(A)R_{r_0}(A)Rr0​​(A)
  1. 特征值的模的平方和的上界估计:
    是对全体特征值做估计.
特征值的模的平方和的上界估计:
∑r=1n[λr]≤∑r,s=1n[ars]2=[[A]]F2\sum_{r=1}^n [\lambda_r]≤\sum_{r,s=1}^n [a_{rs}]^2=[[A]]^2_F∑r=1n​[λr​]≤∑r,s=1n​[ars​]2=[[A]]F2​
等号成立条件:A为正规矩阵,AHA=AAHA^HA=AA^HAHA=AAH.
也即,A的特征值的模的平方和≤A的所有元素的模的平方和。

1.2. 盖尔圆 Gerschgorin

  • 原因/背景:
    几何的角度估计特征值:
    Gerschgorin提出用复平面的一组圆盘覆盖矩阵的全体特征值。

对矩阵A的任一特征值λ\lambdaλ,存在i,使得对矩阵A的第i行有: ∣z−arr∣≤Ri(A)|z-a_{rr}|≤R_i(A)∣z−arr​∣≤Ri​(A),
也即,每个λi\lambda_iλi​一定在某个以(arr,0a_{rr},0arr​,0)为圆心,以RiR_iRi​为半径的圆GiG_iGi​内。

-盖尔圆与特征值的关系
1. 方阵A的所有特征值都在它的n个盖尔圆的并集内。
2. 盖尔圆并集组成的每个连通部分,若是由k个盖尔圆组成的,则此连通部分有k个特征值。
  • 特征值的隔离
    1- 原因:
    连通的盖尔圆使得无法判断特征值到底在哪一个内,希望能够每个圆内有且只有一个特征值。
    2-做法:
    调整矩阵A的盖尔圆半径,使各个GiG_iGi​孤立、不相交。
    对矩阵做相似变换,需要找到合适的对角矩阵D[D=diag(d1,d2,...dn)diag(d_1,d_2,...d_n)diag(d1​,d2​,...dn​)],使得:
    ri=∑j=1,j≠in[aij]didjr_i=\sum_{j=1,j≠i}^n [a_{ij}]\frac{d_i}{d_j}ri​=∑j=1,j​=in​[aij​]dj​di​​,
    其中,B=DAD−1=(didjaij)n∗n^{-1}=(\frac{d_i}{d_j}a_{ij})_{n*n}−1=(dj​di​​aij​)n∗n​.
    det(A)=det(B)=det(BH)det(A)=det(B)=det(B^H)det(A)=det(B)=det(BH),A和B有相同的特征值。

1.3. Ostrowski

  • 原因/背景:
    几何的角度估计特征值:
    Ostrowski提出用复平面的一组卵形覆盖矩阵的全体特征值。

Ostrowski 1:

对矩阵A的任一特征值λ\lambdaλ,存在i,使得对矩阵A的第i行有:
∣z−arr∣≤[Ri(A)]α[Ri(AT)]1−α|z-a_{rr}|≤[R_i(A)]^{\alpha}[R_i(A^T)]^{1-\alpha}∣z−arr​∣≤[Ri​(A)]α[Ri​(AT)]1−α,
其中,0≤α≤10≤\alpha≤10≤α≤1.

由于 τασ1−α≤ατ+(1−α)σ\tau^{\alpha}\sigma^{1-\alpha}≤{\alpha}\tau+(1-\alpha)\sigmaτασ1−α≤ατ+(1−α)σ,

几个推论
1. [z−arr]≤αRi(A)+(1−α)Ri(AT)[z-a_{rr}]≤{\alpha}R_i(A)+(1-\alpha)R_i(A^T)[z−arr​]≤αRi​(A)+(1−α)Ri​(AT)
2. …

Ostrowski 2:

对矩阵A的任一特征值λ\lambdaλ,存在i和j,使得对矩阵A的第i、j两行有:
Ωij(A)=\Omega_{ij}(A)=Ωij​(A)={z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)z|z∈C,|z-a_{ii}||z-a_{jj}|≤R_i(A)R_j(A)z∣z∈C,∣z−aii​∣∣z−ajj​∣≤Ri​(A)Rj​(A)},
其中,i≠ji≠ji​=j.

  • 推论:
    ∣aii∣∣ajj∣>Ri(A)Rj(A)|a_{ii}||a_{jj}|>R_i(A)R_j(A)∣aii​∣∣ajj​∣>Ri​(A)Rj​(A),则detA≠0.
    其中,i≠ji≠ji​=j.

二、广义特征值问题

  • 原因/背景:
    在振动理论中,常碰到广义特征值问题的求解问题。

  • 广义特征值:

Ax⃗=λBx⃗A\vec x=\lambda B \vec xAx=λBx,其中A为n阶实对称矩阵,B为n阶实对称正定矩阵。
λ\lambdaλ称作矩阵A相对于B的特征值,
非零解x⃗\vec xx称作λ\lambdaλ的特征向量,(x⃗1,x⃗2,...,x⃗n\vec x_1,\vec x_2,...,\vec x_nx1​,x2​,...,xn​)构成一个完备的特征向量系(正交)。

  • 广义特征值的等价形式:
  1. B−1Ax⃗=λx⃗B^{-1}A\vec x=\lambda \vec xB−1Ax=λx,其中B−1AB^{-1}AB−1A不是对称矩阵。
  2. Sy⃗=λy⃗S\vec y=\lambda \vec ySy​=λy​,其中,S=G−1A(G−1)TS=G^{-1}A(G^{-1})^TS=G−1A(G−1)T为对称矩阵。由于B是实对称正定矩阵,可以进行Cholesky分解成B=GGT9B=GG^{^T9}B=GGT9。

三、对称矩阵特征值的极性

3.1. 实对称矩阵的Rayleigh商的极性

  • 1. 实对称矩阵的Rayleigh商

R(x⃗)=x⃗TAx⃗x⃗Tx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^T\vec x},(x≠0)R(x)=xTxxTAx​,(x​=0)

Rayleigh商的性质
1. R(x)是连续函数
2. R(x)是x的零次齐次函数
3. R(kx)=R(x)=c
4. R(x)的最大/小值能够在单位圆上取到.
  • 2 实对称矩阵的极性

(1).若已知:
矩阵A的特征值由小到大排列为:λ1<λ2<...<λn\lambda_1<\lambda_2<...<\lambda_nλ1​<λ2​<...<λn​,对应的标准正交特征向量系为:L= {p1,p2,...,pnp_1,p_2,...,p_np1​,p2​,...,pn​}。

  • 得到实对称矩阵的极性:

minx≠0R(x)=λ1,maxx≠0R(x)=λnmin_{x≠0}R(x)=\lambda_1,max_{x≠0}R(x)=\lambda_nminx​=0​R(x)=λ1​,maxx​=0​R(x)=λn​
且在单位球面∣∣x∣∣2=1||x||_2=1∣∣x∣∣2​=1上,p1、pnp_1、p_np1​、pn​分别是R(x)的一个极小值点和极大值点:
R(p1)=λ1,R(pn)=λn.R(p_1)=\lambda_1,R(p_n)=\lambda_n.R(p1​)=λ1​,R(pn​)=λn​.
即,函数R(x)的最小值为最小特征值,最大值为最大特征值。
在单位圆上,R(x)在x=p1和pn处取得极值。

  • 推论:
    L的子空间L0=L_0=L0​={pr,pr+1,...,pkp_r,p_{r+1},...,p_kpr​,pr+1​,...,pk​}的极性:
    — minx≠0R(x)=λr,maxx≠0R(x)=λkmin_{x≠0}R(x)=\lambda_r,max_{x≠0}R(x)=\lambda_kminx​=0​R(x)=λr​,maxx​=0​R(x)=λk​

(2).若特征向量p1,p2,...,pnp_1,p_2,...,p_np1​,p2​,...,pn​未知时,求A的第k大的特征值为:
— λk=minvkmax\lambda_k=min_{v_k}maxλk​=minvk​​max{xTAx∣x∈Vk,∣∣x∣∣2=1x^TAx|x∈V_k,||x||_2=1xTAx∣x∈Vk​,∣∣x∣∣2​=1}

3.1.3 实对称矩阵的扰动

3.2. 广义特征值的极小极大原理

  1. 广义Rayleigh商

R(x⃗)=x⃗TAx⃗x⃗TBx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^TB\vec x},(x≠0)R(x)=xTBxxTAx​,(x​=0)

  1. 广义特征值的极性
  • 驻点
    x0x_0x0​是函数R(x)的驻点的充要条件: x0x_0x0​是Ax=λBxAx=\lambda BxAx=λBx的属于特征值λ\lambdaλ的特征向量.

  • 广义特征值的极性
    特征值的极小极大原理:— λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk​=minvk​​max(0​=x∈Vk​)​R(x)
    特征值的极大极小原理:— λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(​n−k+1)=maxvk​​min(0​=x∈Vk​)​R(x)

  • 实对称矩阵特征值的极性
    — λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk​=minvk​​max(0​=x∈Vk​)​R(x)
    — λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(​n−k+1)=maxvk​​min(0​=x∈Vk​)​R(x)

四、矩阵的直积与应用

4.1. 直积的概念

矩阵的直积:A⊗B.

直积的性质
1. 交换律 A⊗B≠B⊗A
2. 分配律 (A1+A2)⊗B=A1⊗B+A2⊗B
3. 结合律 (A⊗B)⊗C=A⊗(B⊗C)
4. 数乘 k(A⊗B)=(kA)⊗B=A⊗(kB)
5. 直积的乘积等于乘积的直积 (A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2)
6. 可逆性 Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m​,Bn∗n​都是可逆矩阵,则(A⊗B)−1^{-1}−1=A−1^{-1}−1⊗B−1^{-1}−1
7. 三角矩阵 Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m​,Bn∗n​都是三角矩阵,则(A⊗B)也是三角矩阵
8. 共轭转置 (A⊗B)H^HH=AH^HH⊗BH^HH
9. 正交酉矩阵 Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m​,Bn∗n​都是正交酉矩阵,则(A⊗B)也是正交酉矩阵
10. 秩 rank(A⊗B)=(rankA)*(rankB)
11. 相似 A∈Cm∗m,B∈Cn∗nA∈C^{m*m},B∈C^{n*n}A∈Cm∗m,B∈Cn∗n,则(A⊗B)~(B⊗A)
  • 与二元多项式结合:
    对f(x,y)=∑i=0l1∑j=0l2cijxiyjf(x,y)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}x^iy^jf(x,y)=∑i=0l1​​∑j=0l2​​cij​xiyj,以及矩阵Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m​,Bn∗n​定义m*n阶矩阵f(A,B):
    f(A,B)=∑i=0l1∑j=0l2cijAi⊗Bjf(A,B)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}A^i⊗B^jf(A,B)=∑i=0l1​​∑j=0l2​​cij​Ai⊗Bj.
f(A,B)的性质
1. 特征值 1> A的特征值{λ1,λ2,...λn\lambda_1,\lambda_2,...\lambda_nλ1​,λ2​,...λn​},B的特征值{μ1,μ2,...μn\mu_1,\mu_2,...\mu_nμ1​,μ2​,...μn​},则矩阵f(A,B)f(A,B)f(A,B)的全体特征值为f(λi,μj)f(\lambda_i,\mu_j)f(λi​,μj​);
2> 矩阵(A⊗B)的全体特征值为λiμj\lambda_i\mu_jλi​μj​.
2.行列式det A∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBmA∈C^{m*m},B∈C^{n*n},det(A⊗B)=detA^n*detB^mA∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBm
3.迹tr A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB)A∈C^{m*m},B∈C^{n*n},tr(A⊗B)=(trA)*(trB)A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB)

4.2. 线性矩阵方程的可解性

《矩阵论》学习笔记(五):第五章 特征值的估计及对称矩阵的极性相关推荐

  1. 机器学习理论《统计学习方法》学习笔记:第五章 决策树

    机器学习理论<统计学习方法>学习笔记:第五章 决策树 决策树 5.1 决策树模型与学习 5.1.1 决策树模型 5.1.2 决策树与if-then规则 5.1.3 决策树与条件概率分布 5 ...

  2. JavaScript学习笔记(十五)

    JavaScript学习笔记(十五) 事件 事件是DOM(文档对象模型)的一部分.事件流就是事件发生顺序,这是IE和其他浏览器在事件支持上的主要差别. 一.事件流 1.冒泡型事件 IE上的解决方案就是 ...

  3. OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D()

    OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D() 一个任意的仿射变换都能表示为乘以一个矩阵(线性变换)接着再加上一个向量(平移)的形式. ...

  4. MATLAB学习笔记(十五)

    MATLAB学习笔记(十五) 一.非线性方程求解与函数极值计算 1.1 非线性方程数值求解 1.2 函数极值的计算 1.2.1 无约束最优化问题 1.2.2 有约束最优化问题 一.非线性方程求解与函数 ...

  5. 学习笔记(十五)——镜像的知识点与注意事项

    学习笔记(十五)--镜像的知识点与注意事项 一.基础知识 1.SQL Server镜像只有两种模式:高安全模式和高性能模式.两种模式的主要区别在于在事务提交后的操作. 在高性能模式下,主体服务器不需要 ...

  6. cortex_m3_stm32嵌入式学习笔记(十五):待机唤醒实验(WK_UP外部中断)

    cortex_m3_stm32嵌入式学习笔记(十五):待机唤醒实验(WK_UP外部中断) https://blog.csdn.net/qq_16255321/article/details/43086 ...

  7. Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取

    Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取 zouxy09@qq.com http://blog.csdn.net/zouxy09 我的Kinect开发平台是: Win7 x86 ...

  8. Cty的Linux学习笔记(十五——wget)

    Linux学习笔记--第十五篇 wget命令用于在终端中下载网络文件,格式为"wget  [参数]  下载地址" 参数: -b:后台下载模式 -P:下载到指定目录 -t:最大尝试次 ...

  9. PMBOK(第六版) 学习笔记 ——《第七章 项目成本管理》

    系列文章目录 PMBOK(第六版) 学习笔记 --<第一章 引论> PMBOK(第六版) 学习笔记 --<第二章 项目运行环境> PMBOK(第六版) 学习笔记 --<第 ...

最新文章

  1. php用户类,php用户登陆类
  2. java平衡二叉树,最全Java知识总结
  3. python的none是什么-python 中None,is和==的深入探讨
  4. python人头识别_python+opencv实现人头检测
  5. 高等数学下-赵立军-北京大学出版社-题解-练习11.3
  6. MySQL基本操作指令
  7. 【英语学习】【WOTD】chockablock 释义/词源/示例
  8. 用例子看Swift4的GCD
  9. 南阳58--最小步数(BFS)
  10. TFS2010 - 强制撤销签出
  11. 《人月神话》(The Mythical Man-Month)4概念一致性:专制、民主和系统设计(System Design)...
  12. 如何提高游戏中的打击感?
  13. 【软路由安装(PVE+ikuai)】
  14. 为什么使用阿里普惠体没效果
  15. 越来越大的人使用计算机的原因,为什么越来越多的人喜欢用WPS这款电脑软件?这几点是关键原因...
  16. 多张照片怎么添加时间水印
  17. Linux查看文件编码格式
  18. 魔推mpush:实现精准智能消息推送的五个关键
  19. IPv6和IPv4的区别
  20. PC微信逆向:两种姿势教你解密数据库文件

热门文章

  1. 通用方法配置Windows 10 1909 1903 2004等版本下配置多用户同时远程访问
  2. mkv封装字幕乱码问题
  3. 【案例教程】地下水环评(一级)实践技术及Modflow地下水数值模拟
  4. WPS批量设置及批量打印文档
  5. Vue电商项目—数据统计—数据报表模块-11
  6. Windows下LaTeX报错error font simsun not found的解决方案
  7. python实现pdf转word/txt
  8. AdminLTE入门使用
  9. C4D中无法连接对象+删除?
  10. Property ‘next‘ does not exist on type ‘Component<any, {}, any>‘问题的解决方法