第五章特征值的估计及对称矩阵的极性

文章目录

第五章特征值的估计及对称矩阵的极性
- 一、特征值的估计
- - 1.1. 特征值的界
  - 1.2. 盖尔圆 Gerschgorin
  - 1.3. Ostrowski
- 二、广义特征值问题
- 三、对称矩阵特征值的极性
- - 3.1. 实对称矩阵的Rayleigh商的极性
  - - 3.1.3 实对称矩阵的扰动
  - 3.2. 广义特征值的极小极大原理
- 四、矩阵的直积与应用
- - 4.1. 直积的概念
  - 4.2. 线性矩阵方程的可解性

注：
1.本章讨论的是" 方阵“的特征值。
2.复数域上的方阵 An∗nA_{n*n}An∗n特征值个数=阶数n。

一、特征值的估计

原因/背景：
1）大矩阵特征值的计算困难；
2）大量应用中，不需要精确计算特征值，只需估测出其范围即可。

特征值的估计

1. 任一特征值模的上界估计

2. 所有特征值的模之积的上下界估计

3. 所有特征值的模的平方和的上界估计

特征值的实部

特征值的虚部

1.1. 特征值的界

特征值的模的上下界估计：
是对每个特征值做估计.

- 特征值模的虚部的上界估计：
1）[Im(λ)]≤Mn(n−1)2[Im(\lambda)]≤M\sqrt{\frac{n(n-1)}{2}}[Im(λ)]≤M2n(n−1)，其中，M=max12[ars−asr]M=max\frac{1}{2}[a_{rs}-a_{sr}]M=max21[ars−asr]，考察了矩阵的对称程度。
2）[Im(λ)]≤12[[A−AH]]m无穷[Im(\lambda)]≤\frac{1}{2}[[A-A^H]]_{m无穷}[Im(λ)]≤21[[A−AH]]m无穷
- [在估计特征值虚部的上界时，(1)比(2)结果更精准。]

- 特征值模的实部的上界估计：
1）[Re(λ)]≤12[[A+AH]]m无穷[Re(\lambda)]≤\frac{1}{2}[[A+A^H]]_{m无穷}[Re(λ)]≤21[[A+AH]]m无穷
2）[λ]≤ρ(A)≤[[A]]m无穷[\lambda]≤\rho(A)≤[[A]]_{m无穷}[λ]≤ρ(A)≤[[A]]m无穷

- 以上得到以下推论：
1. 实对称矩阵的特征值都是实数。
2. Hermite矩阵的特征值都是实数。A=AHA=A^HA=AH
3. 反Hermite矩阵的特征值都是零或虚数。A=−AHA=-A^HA=−AH

特征值的模之积的上下界估计：
是对全体特征值做估计.

矩阵A满足的特点	特征值的模的积的上下界估计
1）按行严格对角占优	0<∏r=1nmr≤[detA]=∏r=1n[λr(A)]≤∏r=1nMr0<\prod_{r=1}^n m_r≤[detA]=\prod_{r=1}^n[\lambda_r(A)]≤\prod_{r=1}^n M_r0<∏r=1nmr≤[detA]=∏r=1n[λr(A)]≤∏r=1nMr. 等号成立：ars=0a_{rs}=0ars=0(s>r).
2）一般方阵	[detA]=∏r=1n[λr(A)]≤[∏s=1n(∑r=1n[ars]2)]1/2[detA]=\prod_{r=1}^n[\lambda_r(A)]≤[\prod_{s=1}^n(\sum_{r=1}^n [a_{rs}]^2)]^{1/2}[detA]=∏r=1n[λr(A)]≤[∏s=1n(∑r=1n[ars]2)]1/2. 等号成立：某列as0=0a_{s_0}=0as0=0或列向量两两相交(ar,as)=0(a_r,a_s)=0(ar,as)=0. 也即，特征值的模的积≤矩阵(各列元素的2-范数之和)的乘积。

其中，

- 涉及的几个小概念：
1. Rr(A)R_r(A)Rr(A)：第r行，除对角元素arra_{rr}arr外其他所有元素的模之和
2. Mr(A)M_r(A)Mr(A)：第r行，对角元素arra_{rr}arr与其右侧所有元素的模之和
3. mr(A)m_r(A)mr(A)：第r行，对角元素arra_{rr}arr与其右侧所有元素的模之差
4. 按行严格对角占优：第r行，对角元素arra_{rr}arr的模 > Rr(A)R_r(A)Rr(A)
5. 按行弱对角占优：第r行，对角元素arra_{rr}arr的模 ≥ Rr(A)R_r(A)Rr(A)，且存在r0∈[1,n]r_0∈[1,n]r0∈[1,n]，使得ar0r0a_{r_0r_0}ar0r0的模>Rr0(A)R_{r_0}(A)Rr0(A)

特征值的模的平方和的上界估计：
是对全体特征值做估计.

特征值的模的平方和的上界估计：
∑r=1n[λr]≤∑r,s=1n[ars]2=[[A]]F2\sum_{r=1}^n [\lambda_r]≤\sum_{r,s=1}^n [a_{rs}]^2=[[A]]^2_F∑r=1n[λr]≤∑r,s=1n[ars]2=[[A]]F2
等号成立条件：A为正规矩阵，AHA=AAHA^HA=AA^HAHA=AAH. 也即，A的特征值的模的平方和≤A的所有元素的模的平方和。

1.2. 盖尔圆 Gerschgorin

原因/背景：
几何的角度估计特征值：
Gerschgorin提出用复平面的一组圆盘覆盖矩阵的全体特征值。

对矩阵A的任一特征值λ\lambdaλ，存在i，使得对矩阵A的第i行有： ∣z−arr∣≤Ri(A)|z-a_{rr}|≤R_i(A)∣z−arr∣≤Ri(A)，
也即，每个λi\lambda_iλi一定在某个以(arr,0a_{rr},0arr,0)为圆心，以RiR_iRi为半径的圆GiG_iGi内。

-盖尔圆与特征值的关系
1. 方阵A的所有特征值都在它的n个盖尔圆的并集内。
2. 盖尔圆并集组成的每个连通部分，若是由k个盖尔圆组成的，则此连通部分有k个特征值。

特征值的隔离
1- 原因：
连通的盖尔圆使得无法判断特征值到底在哪一个内，希望能够每个圆内有且只有一个特征值。
2-做法：
调整矩阵A的盖尔圆半径，使各个GiG_iGi孤立、不相交。
对矩阵做相似变换，需要找到合适的对角矩阵D[D=diag(d1,d2,...dn)diag(d_1,d_2,...d_n)diag(d1,d2,...dn)]，使得：
ri=∑j=1,j≠in[aij]didjr_i=\sum_{j=1,j≠i}^n [a_{ij}]\frac{d_i}{d_j}ri=∑j=1,j=in[aij]djdi，
其中，B=DAD−1=(didjaij)n∗n^{-1}=(\frac{d_i}{d_j}a_{ij})_{n*n}−1=(djdiaij)n∗n.
det(A)=det(B)=det(BH)det(A)=det(B)=det(B^H)det(A)=det(B)=det(BH)，A和B有相同的特征值。

1.3. Ostrowski

原因/背景：
几何的角度估计特征值：
Ostrowski提出用复平面的一组卵形覆盖矩阵的全体特征值。

Ostrowski 1：

对矩阵A的任一特征值λ\lambdaλ，存在i，使得对矩阵A的第i行有：
∣z−arr∣≤[Ri(A)]α[Ri(AT)]1−α|z-a_{rr}|≤[R_i(A)]^{\alpha}[R_i(A^T)]^{1-\alpha}∣z−arr∣≤[Ri(A)]α[Ri(AT)]1−α，
其中，0≤α≤10≤\alpha≤10≤α≤1.

由于 τασ1−α≤ατ+(1−α)σ\tau^{\alpha}\sigma^{1-\alpha}≤{\alpha}\tau+(1-\alpha)\sigmaτασ1−α≤ατ+(1−α)σ，

几个推论
1. [z−arr]≤αRi(A)+(1−α)Ri(AT)[z-a_{rr}]≤{\alpha}R_i(A)+(1-\alpha)R_i(A^T)[z−arr]≤αRi(A)+(1−α)Ri(AT)
2. …

Ostrowski 2：

对矩阵A的任一特征值λ\lambdaλ，存在i和j，使得对矩阵A的第i、j两行有：
Ωij(A)=\Omega_{ij}(A)=Ωij(A)={z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)z|z∈C,|z-a_{ii}||z-a_{jj}|≤R_i(A)R_j(A)z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)}，
其中，i≠ji≠ji=j.

推论：
∣aii∣∣ajj∣>Ri(A)Rj(A)|a_{ii}||a_{jj}|>R_i(A)R_j(A)∣aii∣∣ajj∣>Ri(A)Rj(A)，则detA≠0.
其中，i≠ji≠ji=j.

二、广义特征值问题

原因/背景：
在振动理论中，常碰到广义特征值问题的求解问题。
广义特征值：

Ax⃗=λBx⃗A\vec x=\lambda B \vec xAx=λBx，其中A为n阶实对称矩阵，B为n阶实对称正定矩阵。
λ\lambdaλ称作矩阵A相对于B的特征值，
非零解x⃗\vec xx称作λ\lambdaλ的特征向量，(x⃗1,x⃗2,...,x⃗n\vec x_1,\vec x_2,...,\vec x_nx1,x2,...,xn)构成一个完备的特征向量系(正交)。

广义特征值的等价形式：

B−1Ax⃗=λx⃗B^{-1}A\vec x=\lambda \vec xB−1Ax=λx，其中B−1AB^{-1}AB−1A不是对称矩阵。
Sy⃗=λy⃗S\vec y=\lambda \vec ySy=λy，其中，S=G−1A(G−1)TS=G^{-1}A(G^{-1})^TS=G−1A(G−1)T为对称矩阵。由于B是实对称正定矩阵，可以进行Cholesky分解成B=GGT9B=GG^{^T9}B=GGT9。

三、对称矩阵特征值的极性

3.1. 实对称矩阵的Rayleigh商的极性

1. 实对称矩阵的Rayleigh商

R(x⃗)=x⃗TAx⃗x⃗Tx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^T\vec x},(x≠0)R(x)=xTxxTAx,(x=0)

Rayleigh商的性质
1. R(x)是连续函数
2. R(x)是x的零次齐次函数
3. R(kx)=R(x)=c
4. R(x)的最大/小值能够在单位圆上取到.

2 实对称矩阵的极性

(1).若已知：
矩阵A的特征值由小到大排列为：λ1<λ2<...<λn\lambda_1<\lambda_2<...<\lambda_nλ1<λ2<...<λn，对应的标准正交特征向量系为：L= {p1,p2,...,pnp_1,p_2,...,p_np1,p2,...,pn}。

得到实对称矩阵的极性：

minx≠0R(x)=λ1，maxx≠0R(x)=λnmin_{x≠0}R(x)=\lambda_1，max_{x≠0}R(x)=\lambda_nminx=0R(x)=λ1，maxx=0R(x)=λn
且在单位球面∣∣x∣∣2=1||x||_2=1∣∣x∣∣2=1上，p1、pnp_1、p_np1、pn分别是R(x)的一个极小值点和极大值点：
R(p1)=λ1，R(pn)=λn.R(p_1)=\lambda_1，R(p_n)=\lambda_n.R(p1)=λ1，R(pn)=λn.
即，函数R(x)的最小值为最小特征值，最大值为最大特征值。
在单位圆上，R(x)在x=p1和pn处取得极值。

推论：
L的子空间L0=L_0=L0={pr,pr+1,...,pkp_r,p_{r+1},...,p_kpr,pr+1,...,pk}的极性：
— minx≠0R(x)=λr，maxx≠0R(x)=λkmin_{x≠0}R(x)=\lambda_r，max_{x≠0}R(x)=\lambda_kminx=0R(x)=λr，maxx=0R(x)=λk

(2).若特征向量p1,p2,...,pnp_1,p_2,...,p_np1,p2,...,pn未知时，求A的第k大的特征值为：
— λk=minvkmax\lambda_k=min_{v_k}maxλk=minvkmax{xTAx∣x∈Vk，∣∣x∣∣2=1x^TAx|x∈V_k，||x||_2=1xTAx∣x∈Vk，∣∣x∣∣2=1}

3.1.3 实对称矩阵的扰动

3.2. 广义特征值的极小极大原理

广义Rayleigh商

R(x⃗)=x⃗TAx⃗x⃗TBx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^TB\vec x},(x≠0)R(x)=xTBxxTAx,(x=0)

广义特征值的极性

驻点：
x0x_0x0是函数R(x)的驻点的充要条件： x0x_0x0是Ax=λBxAx=\lambda BxAx=λBx的属于特征值λ\lambdaλ的特征向量.
广义特征值的极性：
特征值的极小极大原理：— λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk=minvkmax(0=x∈Vk)R(x)
特征值的极大极小原理：— λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)
实对称矩阵特征值的极性：
— λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk=minvkmax(0=x∈Vk)R(x)
— λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)

四、矩阵的直积与应用

4.1. 直积的概念

矩阵的直积：A⊗B.

直积的性质
1. 交换律	A⊗B≠B⊗A
2. 分配律	(A1+A2)⊗B=A1⊗B+A2⊗B
3. 结合律	(A⊗B)⊗C=A⊗(B⊗C)
4. 数乘	k(A⊗B)=(kA)⊗B=A⊗(kB)
5. 直积的乘积等于乘积的直积	(A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2)
6. 可逆性	Am∗m,Bn∗nA_{mm},B_{nn}Am∗m,Bn∗n都是可逆矩阵，则(A⊗B)−1^{-1}−1=A−1^{-1}−1⊗B−1^{-1}−1
7. 三角矩阵	Am∗m,Bn∗nA_{mm},B_{nn}Am∗m,Bn∗n都是三角矩阵，则(A⊗B)也是三角矩阵
8. 共轭转置	(A⊗B)H^HH=AH^HH⊗BH^HH
9. 正交酉矩阵	Am∗m,Bn∗nA_{mm},B_{nn}Am∗m,Bn∗n都是正交酉矩阵，则(A⊗B)也是正交酉矩阵
10. 秩	rank(A⊗B)=(rankA)*(rankB)
11. 相似	A∈Cm∗m,B∈Cn∗nA∈C^{mm},B∈C^{nn}A∈Cm∗m,B∈Cn∗n，则(A⊗B)~(B⊗A)

与二元多项式结合：
对f(x,y)=∑i=0l1∑j=0l2cijxiyjf(x,y)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}x^iy^jf(x,y)=∑i=0l1∑j=0l2cijxiyj，以及矩阵Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m,Bn∗n定义m*n阶矩阵f(A,B)：
f(A,B)=∑i=0l1∑j=0l2cijAi⊗Bjf(A,B)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}A^i⊗B^jf(A,B)=∑i=0l1∑j=0l2cijAi⊗Bj.

f(A,B)的性质
1. 特征值	1> A的特征值{λ1,λ2,...λn\lambda_1,\lambda_2,...\lambda_nλ1,λ2,...λn},B的特征值{μ1,μ2,...μn\mu_1,\mu_2,...\mu_nμ1,μ2,...μn},则矩阵f(A,B)f(A,B)f(A,B)的全体特征值为f(λi,μj)f(\lambda_i,\mu_j)f(λi,μj); 2> 矩阵(A⊗B)的全体特征值为λiμj\lambda_i\mu_jλiμj.
2.行列式det	A∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBmA∈C^{mm},B∈C^{nn},det(A⊗B)=detA^n*detB^mA∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBm
3.迹tr	A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB)A∈C^{mm},B∈C^{nn},tr(A⊗B)=(trA)*(trB)A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB)

4.2. 线性矩阵方程的可解性

《矩阵论》学习笔记（五）：第五章特征值的估计及对称矩阵的极性相关推荐

机器学习理论《统计学习方法》学习笔记：第五章决策树
机器学习理论<统计学习方法>学习笔记:第五章决策树决策树 5.1 决策树模型与学习 5.1.1 决策树模型 5.1.2 决策树与if-then规则 5.1.3 决策树与条件概率分布 5 ...
JavaScript学习笔记（十五）
JavaScript学习笔记(十五) 事件事件是DOM(文档对象模型)的一部分.事件流就是事件发生顺序,这是IE和其他浏览器在事件支持上的主要差别. 一.事件流 1.冒泡型事件 IE上的解决方案就是 ...
OpenCV学习笔记（十五）：图像仿射变换：warpAffine(),getRotationMatrix2D()
OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D() 一个任意的仿射变换都能表示为乘以一个矩阵(线性变换)接着再加上一个向量(平移)的形式. ...
MATLAB学习笔记（十五）
MATLAB学习笔记(十五) 一.非线性方程求解与函数极值计算 1.1 非线性方程数值求解 1.2 函数极值的计算 1.2.1 无约束最优化问题 1.2.2 有约束最优化问题一.非线性方程求解与函数 ...
学习笔记（十五）——镜像的知识点与注意事项
学习笔记(十五)--镜像的知识点与注意事项一.基础知识 1.SQL Server镜像只有两种模式:高安全模式和高性能模式.两种模式的主要区别在于在事务提交后的操作. 在高性能模式下,主体服务器不需要 ...
cortex_m3_stm32嵌入式学习笔记（十五）：待机唤醒实验（WK_UP外部中断）
cortex_m3_stm32嵌入式学习笔记(十五):待机唤醒实验(WK_UP外部中断) https://blog.csdn.net/qq_16255321/article/details/43086 ...
Kinect开发学习笔记之（五）不带游戏者ID的深度数据的提取
Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取 zouxy09@qq.com http://blog.csdn.net/zouxy09 我的Kinect开发平台是: Win7 x86 ...
Cty的Linux学习笔记（十五——wget）
Linux学习笔记--第十五篇 wget命令用于在终端中下载网络文件,格式为"wget [参数] 下载地址" 参数: -b:后台下载模式 -P:下载到指定目录 -t:最大尝试次 ...
PMBOK(第六版) 学习笔记 ——《第七章项目成本管理》
系列文章目录 PMBOK(第六版) 学习笔记 --<第一章引论> PMBOK(第六版) 学习笔记 --<第二章项目运行环境> PMBOK(第六版) 学习笔记 --<第 ...

《矩阵论》学习笔记（五）：第五章特征值的估计及对称矩阵的极性

第五章特征值的估计及对称矩阵的极性

文章目录

一、特征值的估计

1.1. 特征值的界

1.2. 盖尔圆 Gerschgorin

1.3. Ostrowski

二、广义特征值问题

三、对称矩阵特征值的极性

3.1. 实对称矩阵的Rayleigh商的极性

3.1.3 实对称矩阵的扰动

3.2. 广义特征值的极小极大原理

四、矩阵的直积与应用

4.1. 直积的概念

4.2. 线性矩阵方程的可解性

《矩阵论》学习笔记（五）：第五章特征值的估计及对称矩阵的极性相关推荐

最新文章

热门文章

《矩阵论》学习笔记（五）：第五章 特征值的估计及对称矩阵的极性

第五章 特征值的估计及对称矩阵的极性

文章目录

一、特征值的估计

1.1. 特征值的界

1.2. 盖尔圆 Gerschgorin

1.3. Ostrowski

二、广义特征值问题

三、对称矩阵特征值的极性

3.1. 实对称矩阵的Rayleigh商的极性

3.1.3 实对称矩阵的扰动

3.2. 广义特征值的极小极大原理

四、矩阵的直积与应用

4.1. 直积的概念

4.2. 线性矩阵方程的可解性

《矩阵论》学习笔记（五）：第五章 特征值的估计及对称矩阵的极性相关推荐

最新文章

热门文章

《矩阵论》学习笔记（五）：第五章特征值的估计及对称矩阵的极性

第五章特征值的估计及对称矩阵的极性

《矩阵论》学习笔记（五）：第五章特征值的估计及对称矩阵的极性相关推荐