《矩阵论》学习笔记(五):第五章 特征值的估计及对称矩阵的极性
第五章 特征值的估计及对称矩阵的极性
文章目录
- 第五章 特征值的估计及对称矩阵的极性
- 一、特征值的估计
- 1.1. 特征值的界
- 1.2. 盖尔圆 Gerschgorin
- 1.3. Ostrowski
- 二、广义特征值问题
- 三、对称矩阵特征值的极性
- 3.1. 实对称矩阵的Rayleigh商的极性
- 3.1.3 实对称矩阵的扰动
- 3.2. 广义特征值的极小极大原理
- 四、矩阵的直积与应用
- 4.1. 直积的概念
- 4.2. 线性矩阵方程的可解性
注:
1.本章讨论的是" 方阵“的特征值。
2.复数域上的方阵 An∗nA_{n*n}An∗n特征值个数=阶数n。
一、特征值的估计
- 原因/背景:
1)大矩阵特征值的计算困难;
2)大量应用中,不需要精确计算特征值,只需估测出其范围即可。
1.1. 特征值的界
- 特征值的模的上下界估计:
是对每个特征值做估计.
- 特征值模的 虚部的 上界估计: |
---|
1)[Im(λ)]≤Mn(n−1)2[Im(\lambda)]≤M\sqrt{\frac{n(n-1)}{2}}[Im(λ)]≤M2n(n−1), 其中,M=max12[ars−asr]M=max\frac{1}{2}[a_{rs}-a_{sr}]M=max21[ars−asr],考察了矩阵的对称程度。 |
2)[Im(λ)]≤12[[A−AH]]m无穷[Im(\lambda)]≤\frac{1}{2}[[A-A^H]]_{m无穷}[Im(λ)]≤21[[A−AH]]m无穷 |
- [在估计特征值虚部的上界时,(1)比(2)结果更精准。] |
- 特征值模的 实部的 上界估计: |
---|
1)[Re(λ)]≤12[[A+AH]]m无穷[Re(\lambda)]≤\frac{1}{2}[[A+A^H]]_{m无穷}[Re(λ)]≤21[[A+AH]]m无穷 |
2)[λ]≤ρ(A)≤[[A]]m无穷[\lambda]≤\rho(A)≤[[A]]_{m无穷}[λ]≤ρ(A)≤[[A]]m无穷 |
- 以上 得到以下推论: |
---|
1. 实对称矩阵的特征值都是实数。 |
2. Hermite矩阵的特征值都是实数。A=AHA=A^HA=AH |
3. 反Hermite矩阵的特征值都是零或虚数。A=−AHA=-A^HA=−AH |
- 特征值的模之积的上下界估计:
是对全体特征值做估计.
矩阵A满足的特点 | 特征值的模的积的上下界估计 |
---|---|
1)按行严格对角占优 |
0<∏r=1nmr≤[detA]=∏r=1n[λr(A)]≤∏r=1nMr0<\prod_{r=1}^n m_r≤[detA]=\prod_{r=1}^n[\lambda_r(A)]≤\prod_{r=1}^n M_r0<∏r=1nmr≤[detA]=∏r=1n[λr(A)]≤∏r=1nMr. 等号成立:ars=0a_{rs}=0ars=0(s>r). |
2)一般方阵 |
[detA]=∏r=1n[λr(A)]≤[∏s=1n(∑r=1n[ars]2)]1/2[detA]=\prod_{r=1}^n[\lambda_r(A)]≤[\prod_{s=1}^n(\sum_{r=1}^n [a_{rs}]^2)]^{1/2}[detA]=∏r=1n[λr(A)]≤[∏s=1n(∑r=1n[ars]2)]1/2. 等号成立:某列as0=0a_{s_0}=0as0=0或 列向量两两相交(ar,as)=0(a_r,a_s)=0(ar,as)=0. 也即,特征值的模的积≤矩阵(各列元素的2-范数之和)的乘积。 |
其中,
- 涉及的几个小概念: |
---|
1. Rr(A)R_r(A)Rr(A):第r行,除对角元素arra_{rr}arr外其他所有元素的模之和 |
2. Mr(A)M_r(A)Mr(A):第r行,对角元素arra_{rr}arr与其右侧所有元素的模之和 |
3. mr(A)m_r(A)mr(A):第r行,对角元素arra_{rr}arr与其右侧所有元素的模之差 |
4. 按行严格对角占优:第r行,对角元素arra_{rr}arr的模 > Rr(A)R_r(A)Rr(A) |
5. 按行弱对角占优:第r行,对角元素arra_{rr}arr的模 ≥ Rr(A)R_r(A)Rr(A),且存在r0∈[1,n]r_0∈[1,n]r0∈[1,n],使得ar0r0a_{r_0r_0}ar0r0的模>Rr0(A)R_{r_0}(A)Rr0(A) |
- 特征值的模的平方和的上界估计:
是对全体特征值做估计.
特征值的模的平方和的上界估计: |
---|
∑r=1n[λr]≤∑r,s=1n[ars]2=[[A]]F2\sum_{r=1}^n [\lambda_r]≤\sum_{r,s=1}^n [a_{rs}]^2=[[A]]^2_F∑r=1n[λr]≤∑r,s=1n[ars]2=[[A]]F2 |
等号成立条件:A为正规矩阵,AHA=AAHA^HA=AA^HAHA=AAH. 也即,A的特征值的模的平方和≤A的所有元素的模的平方和。 |
1.2. 盖尔圆 Gerschgorin
- 原因/背景:
几何的角度估计特征值:
Gerschgorin提出用复平面的一组圆盘覆盖矩阵的全体特征值。
对矩阵A的任一特征值λ\lambdaλ,存在i,使得对矩阵A的第i行有: ∣z−arr∣≤Ri(A)|z-a_{rr}|≤R_i(A)∣z−arr∣≤Ri(A),
也即,每个λi\lambda_iλi一定在某个以(arr,0a_{rr},0arr,0)为圆心,以RiR_iRi为半径的圆GiG_iGi内。
-盖尔圆与特征值的关系 |
---|
1. 方阵A的所有特征值都在它的n个盖尔圆的并集内。 |
2. 盖尔圆并集组成的每个连通部分,若是由k个盖尔圆组成的,则此连通部分有k个特征值。 |
- 特征值的隔离
1- 原因:
连通的盖尔圆使得无法判断特征值到底在哪一个内,希望能够每个圆内有且只有一个特征值。
2-做法:
调整矩阵A的盖尔圆半径,使各个GiG_iGi孤立、不相交。
对矩阵做相似变换,需要找到合适的对角矩阵D[D=diag(d1,d2,...dn)diag(d_1,d_2,...d_n)diag(d1,d2,...dn)],使得:
ri=∑j=1,j≠in[aij]didjr_i=\sum_{j=1,j≠i}^n [a_{ij}]\frac{d_i}{d_j}ri=∑j=1,j=in[aij]djdi,
其中,B=DAD−1=(didjaij)n∗n^{-1}=(\frac{d_i}{d_j}a_{ij})_{n*n}−1=(djdiaij)n∗n.
det(A)=det(B)=det(BH)det(A)=det(B)=det(B^H)det(A)=det(B)=det(BH),A和B有相同的特征值。
1.3. Ostrowski
- 原因/背景:
几何的角度估计特征值:
Ostrowski提出用复平面的一组卵形覆盖矩阵的全体特征值。
Ostrowski 1:
对矩阵A的任一特征值λ\lambdaλ,存在i,使得对矩阵A的第i行有:
∣z−arr∣≤[Ri(A)]α[Ri(AT)]1−α|z-a_{rr}|≤[R_i(A)]^{\alpha}[R_i(A^T)]^{1-\alpha}∣z−arr∣≤[Ri(A)]α[Ri(AT)]1−α,
其中,0≤α≤10≤\alpha≤10≤α≤1.
由于 τασ1−α≤ατ+(1−α)σ\tau^{\alpha}\sigma^{1-\alpha}≤{\alpha}\tau+(1-\alpha)\sigmaτασ1−α≤ατ+(1−α)σ,
几个推论 |
---|
1. [z−arr]≤αRi(A)+(1−α)Ri(AT)[z-a_{rr}]≤{\alpha}R_i(A)+(1-\alpha)R_i(A^T)[z−arr]≤αRi(A)+(1−α)Ri(AT) |
2. … |
Ostrowski 2:
对矩阵A的任一特征值λ\lambdaλ,存在i和j,使得对矩阵A的第i、j两行有:
Ωij(A)=\Omega_{ij}(A)=Ωij(A)={z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)z|z∈C,|z-a_{ii}||z-a_{jj}|≤R_i(A)R_j(A)z∣z∈C,∣z−aii∣∣z−ajj∣≤Ri(A)Rj(A)},
其中,i≠ji≠ji=j.
- 推论:
∣aii∣∣ajj∣>Ri(A)Rj(A)|a_{ii}||a_{jj}|>R_i(A)R_j(A)∣aii∣∣ajj∣>Ri(A)Rj(A),则detA≠0.
其中,i≠ji≠ji=j.
二、广义特征值问题
原因/背景:
在振动理论中,常碰到广义特征值问题的求解问题。广义特征值:
Ax⃗=λBx⃗A\vec x=\lambda B \vec xAx=λBx,其中A为n阶实对称矩阵,B为n阶实对称正定矩阵。
λ\lambdaλ称作矩阵A相对于B的特征值,
非零解x⃗\vec xx称作λ\lambdaλ的特征向量,(x⃗1,x⃗2,...,x⃗n\vec x_1,\vec x_2,...,\vec x_nx1,x2,...,xn)构成一个完备的特征向量系(正交)。
- 广义特征值的等价形式:
- B−1Ax⃗=λx⃗B^{-1}A\vec x=\lambda \vec xB−1Ax=λx,其中B−1AB^{-1}AB−1A不是对称矩阵。
- Sy⃗=λy⃗S\vec y=\lambda \vec ySy=λy,其中,S=G−1A(G−1)TS=G^{-1}A(G^{-1})^TS=G−1A(G−1)T为对称矩阵。由于B是实对称正定矩阵,可以进行Cholesky分解成B=GGT9B=GG^{^T9}B=GGT9。
三、对称矩阵特征值的极性
3.1. 实对称矩阵的Rayleigh商的极性
- 1. 实对称矩阵的Rayleigh商
R(x⃗)=x⃗TAx⃗x⃗Tx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^T\vec x},(x≠0)R(x)=xTxxTAx,(x=0)
Rayleigh商的性质 |
---|
1. R(x)是连续函数 |
2. R(x)是x的零次齐次函数 |
3. R(kx)=R(x)=c |
4. R(x)的最大/小值能够在单位圆上取到. |
- 2 实对称矩阵的极性
(1).若已知:
矩阵A的特征值由小到大排列为:λ1<λ2<...<λn\lambda_1<\lambda_2<...<\lambda_nλ1<λ2<...<λn,对应的标准正交特征向量系为:L= {p1,p2,...,pnp_1,p_2,...,p_np1,p2,...,pn}。
- 得到实对称矩阵的极性:
minx≠0R(x)=λ1,maxx≠0R(x)=λnmin_{x≠0}R(x)=\lambda_1,max_{x≠0}R(x)=\lambda_nminx=0R(x)=λ1,maxx=0R(x)=λn
且在单位球面∣∣x∣∣2=1||x||_2=1∣∣x∣∣2=1上,p1、pnp_1、p_np1、pn分别是R(x)的一个极小值点和极大值点:
R(p1)=λ1,R(pn)=λn.R(p_1)=\lambda_1,R(p_n)=\lambda_n.R(p1)=λ1,R(pn)=λn.
即,函数R(x)的最小值为最小特征值,最大值为最大特征值。
在单位圆上,R(x)在x=p1和pn处取得极值。
- 推论:
L的子空间L0=L_0=L0={pr,pr+1,...,pkp_r,p_{r+1},...,p_kpr,pr+1,...,pk}的极性:
— minx≠0R(x)=λr,maxx≠0R(x)=λkmin_{x≠0}R(x)=\lambda_r,max_{x≠0}R(x)=\lambda_kminx=0R(x)=λr,maxx=0R(x)=λk
(2).若特征向量p1,p2,...,pnp_1,p_2,...,p_np1,p2,...,pn未知时,求A的第k大的特征值为:
— λk=minvkmax\lambda_k=min_{v_k}maxλk=minvkmax{xTAx∣x∈Vk,∣∣x∣∣2=1x^TAx|x∈V_k,||x||_2=1xTAx∣x∈Vk,∣∣x∣∣2=1}
3.1.3 实对称矩阵的扰动
3.2. 广义特征值的极小极大原理
- 广义Rayleigh商
R(x⃗)=x⃗TAx⃗x⃗TBx⃗,(x≠0)R( \vec x)=\frac{\vec x^TA\vec x}{\vec x^TB\vec x},(x≠0)R(x)=xTBxxTAx,(x=0)
- 广义特征值的极性
驻点:
x0x_0x0是函数R(x)的驻点的充要条件: x0x_0x0是Ax=λBxAx=\lambda BxAx=λBx的属于特征值λ\lambdaλ的特征向量.广义特征值的极性:
特征值的极小极大原理:— λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk=minvkmax(0=x∈Vk)R(x)
特征值的极大极小原理:— λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)实对称矩阵特征值的极性:
— λk=minvkmax(0≠x∈Vk)R(x)\lambda_k=min_{v_k}max_{(0≠x∈V_k)}R(x)λk=minvkmax(0=x∈Vk)R(x)
— λ(n−k+1)=maxvkmin(0≠x∈Vk)R(x)\lambda_(n-k+1)=max_{v_k}min_{(0≠x∈V_k)}R(x)λ(n−k+1)=maxvkmin(0=x∈Vk)R(x)
四、矩阵的直积与应用
4.1. 直积的概念
矩阵的直积:A⊗B.
直积的性质 | |
---|---|
1. 交换律 | A⊗B≠B⊗A |
2. 分配律 | (A1+A2)⊗B=A1⊗B+A2⊗B |
3. 结合律 | (A⊗B)⊗C=A⊗(B⊗C) |
4. 数乘 | k(A⊗B)=(kA)⊗B=A⊗(kB) |
5. 直积的乘积等于乘积的直积 | (A1⊗B1)(A2⊗B2)=(A1A2)⊗(B1B2) |
6. 可逆性 | Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m,Bn∗n都是可逆矩阵,则(A⊗B)−1^{-1}−1=A−1^{-1}−1⊗B−1^{-1}−1 |
7. 三角矩阵 | Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m,Bn∗n都是三角矩阵,则(A⊗B)也是三角矩阵 |
8. 共轭转置 | (A⊗B)H^HH=AH^HH⊗BH^HH |
9. 正交酉矩阵 | Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m,Bn∗n都是正交酉矩阵,则(A⊗B)也是正交酉矩阵 |
10. 秩 | rank(A⊗B)=(rankA)*(rankB) |
11. 相似 | A∈Cm∗m,B∈Cn∗nA∈C^{m*m},B∈C^{n*n}A∈Cm∗m,B∈Cn∗n,则(A⊗B)~(B⊗A) |
- 与二元多项式结合:
对f(x,y)=∑i=0l1∑j=0l2cijxiyjf(x,y)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}x^iy^jf(x,y)=∑i=0l1∑j=0l2cijxiyj,以及矩阵Am∗m,Bn∗nA_{m*m},B_{n*n}Am∗m,Bn∗n定义m*n阶矩阵f(A,B):
f(A,B)=∑i=0l1∑j=0l2cijAi⊗Bjf(A,B)=\sum_{i=0}^{l_1}\sum_{j=0}^{l_2}c_{ij}A^i⊗B^jf(A,B)=∑i=0l1∑j=0l2cijAi⊗Bj.
f(A,B)的性质 | |
---|---|
1. 特征值 |
1> A的特征值{λ1,λ2,...λn\lambda_1,\lambda_2,...\lambda_nλ1,λ2,...λn},B的特征值{μ1,μ2,...μn\mu_1,\mu_2,...\mu_nμ1,μ2,...μn},则矩阵f(A,B)f(A,B)f(A,B)的全体特征值为f(λi,μj)f(\lambda_i,\mu_j)f(λi,μj); 2> 矩阵(A⊗B)的全体特征值为λiμj\lambda_i\mu_jλiμj. |
2.行列式det | A∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBmA∈C^{m*m},B∈C^{n*n},det(A⊗B)=detA^n*detB^mA∈Cm∗m,B∈Cn∗n,det(A⊗B)=detAn∗detBm |
3.迹tr | A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB)A∈C^{m*m},B∈C^{n*n},tr(A⊗B)=(trA)*(trB)A∈Cm∗m,B∈Cn∗n,tr(A⊗B)=(trA)∗(trB) |
4.2. 线性矩阵方程的可解性
《矩阵论》学习笔记(五):第五章 特征值的估计及对称矩阵的极性相关推荐
- 机器学习理论《统计学习方法》学习笔记:第五章 决策树
机器学习理论<统计学习方法>学习笔记:第五章 决策树 决策树 5.1 决策树模型与学习 5.1.1 决策树模型 5.1.2 决策树与if-then规则 5.1.3 决策树与条件概率分布 5 ...
- JavaScript学习笔记(十五)
JavaScript学习笔记(十五) 事件 事件是DOM(文档对象模型)的一部分.事件流就是事件发生顺序,这是IE和其他浏览器在事件支持上的主要差别. 一.事件流 1.冒泡型事件 IE上的解决方案就是 ...
- OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D()
OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D() 一个任意的仿射变换都能表示为乘以一个矩阵(线性变换)接着再加上一个向量(平移)的形式. ...
- MATLAB学习笔记(十五)
MATLAB学习笔记(十五) 一.非线性方程求解与函数极值计算 1.1 非线性方程数值求解 1.2 函数极值的计算 1.2.1 无约束最优化问题 1.2.2 有约束最优化问题 一.非线性方程求解与函数 ...
- 学习笔记(十五)——镜像的知识点与注意事项
学习笔记(十五)--镜像的知识点与注意事项 一.基础知识 1.SQL Server镜像只有两种模式:高安全模式和高性能模式.两种模式的主要区别在于在事务提交后的操作. 在高性能模式下,主体服务器不需要 ...
- cortex_m3_stm32嵌入式学习笔记(十五):待机唤醒实验(WK_UP外部中断)
cortex_m3_stm32嵌入式学习笔记(十五):待机唤醒实验(WK_UP外部中断) https://blog.csdn.net/qq_16255321/article/details/43086 ...
- Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取
Kinect开发学习笔记之(五)不带游戏者ID的深度数据的提取 zouxy09@qq.com http://blog.csdn.net/zouxy09 我的Kinect开发平台是: Win7 x86 ...
- Cty的Linux学习笔记(十五——wget)
Linux学习笔记--第十五篇 wget命令用于在终端中下载网络文件,格式为"wget [参数] 下载地址" 参数: -b:后台下载模式 -P:下载到指定目录 -t:最大尝试次 ...
- PMBOK(第六版) 学习笔记 ——《第七章 项目成本管理》
系列文章目录 PMBOK(第六版) 学习笔记 --<第一章 引论> PMBOK(第六版) 学习笔记 --<第二章 项目运行环境> PMBOK(第六版) 学习笔记 --<第 ...
最新文章
- php用户类,php用户登陆类
- java平衡二叉树,最全Java知识总结
- python的none是什么-python 中None,is和==的深入探讨
- python人头识别_python+opencv实现人头检测
- 高等数学下-赵立军-北京大学出版社-题解-练习11.3
- MySQL基本操作指令
- 【英语学习】【WOTD】chockablock 释义/词源/示例
- 用例子看Swift4的GCD
- 南阳58--最小步数(BFS)
- TFS2010 - 强制撤销签出
- 《人月神话》(The Mythical Man-Month)4概念一致性:专制、民主和系统设计(System Design)...
- 如何提高游戏中的打击感?
- 【软路由安装(PVE+ikuai)】
- 为什么使用阿里普惠体没效果
- 越来越大的人使用计算机的原因,为什么越来越多的人喜欢用WPS这款电脑软件?这几点是关键原因...
- 多张照片怎么添加时间水印
- Linux查看文件编码格式
- 魔推mpush:实现精准智能消息推送的五个关键
- IPv6和IPv4的区别
- PC微信逆向:两种姿势教你解密数据库文件
热门文章
- 通用方法配置Windows 10 1909 1903 2004等版本下配置多用户同时远程访问
- mkv封装字幕乱码问题
- 【案例教程】地下水环评(一级)实践技术及Modflow地下水数值模拟
- WPS批量设置及批量打印文档
- Vue电商项目—数据统计—数据报表模块-11
- Windows下LaTeX报错error font simsun not found的解决方案
- python实现pdf转word/txt
- AdminLTE入门使用
- C4D中无法连接对象+删除?
- Property ‘next‘ does not exist on type ‘Component<any, {}, any>‘问题的解决方法