UA MATH567 高维统计III 随机矩阵2 算子范数与Frobenius范数 基于SVD的low-rank approximation
UA MATH567 高维统计III 随机矩阵2 算子范数与Frobenius范数 基于SVD的low-rank approximation
矩阵的范数
假设AAA是从nnn维欧氏空间到mmm维欧氏空间的线性算子,称∥A∥\left\| A\right\|∥A∥是它的算子范数:
∥A∥=maxx∈Sn−1∥Ax∥2\left\| A\right\| = \max_{x \in S^{n-1}}\left\| Ax \right\|_2∥A∥=x∈Sn−1max∥Ax∥2
其中Sn−1S^{n-1}Sn−1是nnn维球面,另一种等价定义是
∥A∥=maxx,y∈Sn−1⟨Ax,y⟩=maxx,y∈Sn−1xTAy\left\| A\right\| = \max_{x,y \in S^{n-1}} \langle Ax,y \rangle = \max_{x,y \in S^{n-1}} x^TAy∥A∥=x,y∈Sn−1max⟨Ax,y⟩=x,y∈Sn−1maxxTAy
根据Rayleigh定理,
∥A∥=s1(A)\left\| A\right\| = s_1(A)∥A∥=s1(A)
称∥A∥F\left\| A \right\|_F∥A∥F是AAA的Frobenius范数:
∥A∥F=∑Ai,j2=tr(ATA)=∑i=1rsi2(A)\left\| A \right\|_F = \sqrt{\sum A_{i,j}^2} = \sqrt{tr(A^TA)}=\sqrt{\sum_{i=1}^r s_i^2(A)}∥A∥F=∑Ai,j2=tr(ATA)=i=1∑rsi2(A)
关于这两个范数有如下大小关系:
∥A∥≤∥A∥F≤r∥A∥\left\| A\right\| \le \left\| A \right\|_F \le \sqrt{r}\left\| A \right\|∥A∥≤∥A∥F≤r∥A∥
当且仅当只有s1s_1s1非零时,第一个不等号取等;当且仅当所有奇异值相等时,第二个不等号取等。
Low-rank approximation
假设AAA是m×nm \times nm×n的矩阵,r=rank(A)≤min(m,n)r=rank(A) \le \min(m,n)r=rank(A)≤min(m,n),我们的目标是找到一个rank为kkk的矩阵AkA_kAk,使得A−AkA-A_kA−Ak的范数最小。这个操作在AAA是高维数据时非常有用,因为它能提供一种数据降维的方法。
有一种可行的办法是基于矩阵AAA的SVD寻找它的Low-rank approximation,记它的SVD为
A=∑i=1rsiuiviTA = \sum_{i=1}^rs_iu_iv_i^TA=i=1∑rsiuiviT
我们用前kkk个奇异值与奇异向量构造Low-rank approximation:
Eckart-Young-Mirsky定理
假设
Ak=∑i=1ksiuiviTA_k = \sum_{i=1}^ks_iu_iv_i^TAk=i=1∑ksiuiviT
则使用算子范数或者Frobenius范数,A−AkA-A_kA−Ak的范数都是最小的。
Approximate Isometry
假设AAA是m×nm \times nm×n的矩阵,m≥nm \ge nm≥n,或者把AAA理解为从nnn维欧氏空间到mmm维欧氏空间的线性算子,奇异值为s1≥s2≥⋯≥sns_1 \ge s_2 \ge \cdots \ge s_ns1≥s2≥⋯≥sn,则根据算子范数的定义:
sn∥x∥2≤∥Ax∥2≤s1∥x∥2s_n \left\| x \right\|_2 \le \left\| Ax \right\|_2 \le s_1 \left\| x \right\|_2 sn∥x∥2≤∥Ax∥2≤s1∥x∥2
引理 s1=sn=1⇔ATA=In⇔P=AATs_1=s_n=1 \Leftrightarrow A^TA = I_n \Leftrightarrow P=AA^Ts1=sn=1⇔ATA=In⇔P=AAT是一个正交投影矩阵。
我们称ATA=InA^TA=I_nATA=In的性质为Isometry,也就相当于ATAA^TAATA表示一个等距线性算子。那么对一般的矩阵有没有类似Isometry的性质呢?
引理续 如果δ>0\delta>0δ>0,∥ATA−In∥≤max(δ,δ2)\left\| A^TA - I_n\right\| \le \max(\delta,\delta^2)∥∥ATA−In∥∥≤max(δ,δ2),这个结论蕴涵1−δ≤sn(A)≤s1(A)≤1+δ1-\delta \le s_n(A) \le s_1(A) \le 1+\delta1−δ≤sn(A)≤s1(A)≤1+δ。
简单计算一下即可,
max(δ,δ2)≥∥ATA−In∥≥xT(ATA−In)x,x∈Sn−1=∣∥Ax∥22−∥x∥22∣=∣∥Ax∥22−1∣≥max(∣∥Ax∥2−1∣,∣∥Ax∥22−1∣)\max(\delta,\delta^2) \ge \left\| A^TA - I_n\right\| \ge x^T(A^TA-I_n)x,x \in S^{n-1} \\ = |\left\| Ax \right\|_2^2 - \left\| x \right\|_2^2 | = |\left\| Ax \right\|_2^2 - 1 | \\ \ge \max(|\left\| Ax \right\|_2-1|,|\left\| Ax \right\|_2^2 - 1 |)max(δ,δ2)≥∥∥ATA−In∥∥≥xT(ATA−In)x,x∈Sn−1=∣∥Ax∥22−∥x∥22∣=∣∥Ax∥22−1∣≥max(∣∥Ax∥2−1∣,∣∥Ax∥22−1∣)
所以
δ≥∣∥Ax∥2−1∣\delta \ge |\left\| Ax \right\|_2-1|δ≥∣∥Ax∥2−1∣
UA MATH567 高维统计III 随机矩阵2 算子范数与Frobenius范数 基于SVD的low-rank approximation相关推荐
- UA MATH567 高维统计III 随机矩阵10 亚高斯矩阵的应用:协方差估计与聚类问题的样本量需求计算
UA MATH567 高维统计III 随机矩阵10 亚高斯矩阵的应用:协方差估计与聚类的样本量 如果XXX是零均值的随机变量,则Σ=EXXT\Sigma = EXX^TΣ=EXXT,假设{Xi}i=1 ...
- UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数
UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数 在前五讲的理论基础上,我们现在开始正式讨论随机矩阵.假设AAA是一个m×nm \times nm×n的随机矩阵,它的元素AijA_{ ...
- UA MATH567 高维统计III 随机矩阵12 整数环上的区间的应用:DNA序列突变点侦测的统计量及假设检验
UA MATH567 高维统计III 随机矩阵12 整数环上的区间的应用:拐点侦测的统计量及假设检验 整数环上的区间作为随机变量的下标 最大值的概率不等式 应用:DNA序列突变点侦测 整数环上的区间作 ...
- UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析
UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析 上一讲我们完成了Stochastic Block Model与社区发现问题的建模,并描述了 ...
- UA MATH567 高维统计III 随机矩阵7 亚高斯矩阵的应用:Stochastic Block Model与社区发现 问题描述
UA MATH567 高维统计III 随机矩阵7 亚高斯矩阵的应用:Stochastic Block Model与社区发现 我们来介绍亚高斯矩阵的一个应用:评估社区发现算法的效率.Community ...
- UA MATH567 高维统计III 随机矩阵4 欧氏空间上的集网与覆盖
UA MATH567 高维统计III 随机矩阵4 欧氏空间上的集网与覆盖 这一讲我们进一步介绍ϵ\epsilonϵ-网,上一讲的定义net.covering与packing是比较抽象的,这一讲我们在n ...
- UA MATH567 高维统计III 随机矩阵3 集网与覆盖
UA MATH567 高维统计III 随机矩阵3 集网与覆盖 在介绍随机矩阵的concentration与尾部概率行为之前,我们先介绍一个在监督学习理论.高维统计与随机矩阵等领域都非常有用的工具:ϵ\ ...
- UA MATH567 高维统计I 概率不等式8 亚指数范数
UA MATH567 高维统计I 概率不等式8 亚指数范数 类似亚高斯范数,我们也可以定义随机变量的亚指数范数(sub-exponential norm): ∥X∥ψ1=inf{t>0:Ee∣ ...
- UA MATH567 高维统计专题1 稀疏信号及其恢复5 LASSO的估计误差
UA MATH567 高维统计专题1 稀疏信号及其恢复5 LASSO的估计误差 Signal Recovery Noisy Setting LASSO的估计误差 Signal Recovery Noi ...
最新文章
- ZOJ 3597 Hit the Target! (线段树扫描线 -- 矩形所能覆盖的最多的点数)
- springmvc +bootstrap创建简单web项目
- Python全栈之路系列----之-----内置函数和匿名函数lamdba
- Java培训教程之this关键字讲解
- QDoc上下文命令contextcommands
- 什么时候使用 InheritableThreadLocal
- C# 中 Struct 和 Class 的区别总结
- [SlickEdit] SlickEdit支持目录别名FTP控件更新
- 如何用tf2.0训练中文聊天机器人chatbot
- Unity的渲染管线
- unix编程艺术中的17点编程原则--设计开发者的至高准则
- AI房产户型图识别3DRender
- zblog插件全自动采集伪原创发布插件免费
- 【转】传教士和野人问题(Missionaries and Cannibals)
- java ttf_java直接使用ttf字体,解决window和linux之间的差异
- 传感器与检测技术考试
- 激活DataGrip
- 开启VPN和NAT服务
- 使用FleaPHP框架构建简单留言本应用
- 实用算法的分析与程序设计——递推法(倒推法)