UA MATH567 高维统计III 随机矩阵2 算子范数与Frobenius范数 基于SVD的low-rank approximation


矩阵的范数

假设AAA是从nnn维欧氏空间到mmm维欧氏空间的线性算子,称∥A∥\left\| A\right\|∥A∥是它的算子范数:
∥A∥=max⁡x∈Sn−1∥Ax∥2\left\| A\right\| = \max_{x \in S^{n-1}}\left\| Ax \right\|_2∥A∥=x∈Sn−1max​∥Ax∥2​

其中Sn−1S^{n-1}Sn−1是nnn维球面,另一种等价定义是
∥A∥=max⁡x,y∈Sn−1⟨Ax,y⟩=max⁡x,y∈Sn−1xTAy\left\| A\right\| = \max_{x,y \in S^{n-1}} \langle Ax,y \rangle = \max_{x,y \in S^{n-1}} x^TAy∥A∥=x,y∈Sn−1max​⟨Ax,y⟩=x,y∈Sn−1max​xTAy

根据Rayleigh定理,
∥A∥=s1(A)\left\| A\right\| = s_1(A)∥A∥=s1​(A)

称∥A∥F\left\| A \right\|_F∥A∥F​是AAA的Frobenius范数:
∥A∥F=∑Ai,j2=tr(ATA)=∑i=1rsi2(A)\left\| A \right\|_F = \sqrt{\sum A_{i,j}^2} = \sqrt{tr(A^TA)}=\sqrt{\sum_{i=1}^r s_i^2(A)}∥A∥F​=∑Ai,j2​​=tr(ATA)​=i=1∑r​si2​(A)​

关于这两个范数有如下大小关系:
∥A∥≤∥A∥F≤r∥A∥\left\| A\right\| \le \left\| A \right\|_F \le \sqrt{r}\left\| A \right\|∥A∥≤∥A∥F​≤r​∥A∥

当且仅当只有s1s_1s1​非零时,第一个不等号取等;当且仅当所有奇异值相等时,第二个不等号取等。


Low-rank approximation

假设AAA是m×nm \times nm×n的矩阵,r=rank(A)≤min⁡(m,n)r=rank(A) \le \min(m,n)r=rank(A)≤min(m,n),我们的目标是找到一个rank为kkk的矩阵AkA_kAk​,使得A−AkA-A_kA−Ak​的范数最小。这个操作在AAA是高维数据时非常有用,因为它能提供一种数据降维的方法。

有一种可行的办法是基于矩阵AAA的SVD寻找它的Low-rank approximation,记它的SVD为
A=∑i=1rsiuiviTA = \sum_{i=1}^rs_iu_iv_i^TA=i=1∑r​si​ui​viT​

我们用前kkk个奇异值与奇异向量构造Low-rank approximation:

Eckart-Young-Mirsky定理
假设
Ak=∑i=1ksiuiviTA_k = \sum_{i=1}^ks_iu_iv_i^TAk​=i=1∑k​si​ui​viT​

则使用算子范数或者Frobenius范数,A−AkA-A_kA−Ak​的范数都是最小的。


Approximate Isometry
假设AAA是m×nm \times nm×n的矩阵,m≥nm \ge nm≥n,或者把AAA理解为从nnn维欧氏空间到mmm维欧氏空间的线性算子,奇异值为s1≥s2≥⋯≥sns_1 \ge s_2 \ge \cdots \ge s_ns1​≥s2​≥⋯≥sn​,则根据算子范数的定义:
sn∥x∥2≤∥Ax∥2≤s1∥x∥2s_n \left\| x \right\|_2 \le \left\| Ax \right\|_2 \le s_1 \left\| x \right\|_2 sn​∥x∥2​≤∥Ax∥2​≤s1​∥x∥2​

引理 s1=sn=1⇔ATA=In⇔P=AATs_1=s_n=1 \Leftrightarrow A^TA = I_n \Leftrightarrow P=AA^Ts1​=sn​=1⇔ATA=In​⇔P=AAT是一个正交投影矩阵。

我们称ATA=InA^TA=I_nATA=In​的性质为Isometry,也就相当于ATAA^TAATA表示一个等距线性算子。那么对一般的矩阵有没有类似Isometry的性质呢?

引理续 如果δ>0\delta>0δ>0,∥ATA−In∥≤max⁡(δ,δ2)\left\| A^TA - I_n\right\| \le \max(\delta,\delta^2)∥∥​ATA−In​∥∥​≤max(δ,δ2),这个结论蕴涵1−δ≤sn(A)≤s1(A)≤1+δ1-\delta \le s_n(A) \le s_1(A) \le 1+\delta1−δ≤sn​(A)≤s1​(A)≤1+δ。

简单计算一下即可,
max⁡(δ,δ2)≥∥ATA−In∥≥xT(ATA−In)x,x∈Sn−1=∣∥Ax∥22−∥x∥22∣=∣∥Ax∥22−1∣≥max⁡(∣∥Ax∥2−1∣,∣∥Ax∥22−1∣)\max(\delta,\delta^2) \ge \left\| A^TA - I_n\right\| \ge x^T(A^TA-I_n)x,x \in S^{n-1} \\ = |\left\| Ax \right\|_2^2 - \left\| x \right\|_2^2 | = |\left\| Ax \right\|_2^2 - 1 | \\ \ge \max(|\left\| Ax \right\|_2-1|,|\left\| Ax \right\|_2^2 - 1 |)max(δ,δ2)≥∥∥​ATA−In​∥∥​≥xT(ATA−In​)x,x∈Sn−1=∣∥Ax∥22​−∥x∥22​∣=∣∥Ax∥22​−1∣≥max(∣∥Ax∥2​−1∣,∣∥Ax∥22​−1∣)

所以
δ≥∣∥Ax∥2−1∣\delta \ge |\left\| Ax \right\|_2-1|δ≥∣∥Ax∥2​−1∣

UA MATH567 高维统计III 随机矩阵2 算子范数与Frobenius范数 基于SVD的low-rank approximation相关推荐

  1. UA MATH567 高维统计III 随机矩阵10 亚高斯矩阵的应用:协方差估计与聚类问题的样本量需求计算

    UA MATH567 高维统计III 随机矩阵10 亚高斯矩阵的应用:协方差估计与聚类的样本量 如果XXX是零均值的随机变量,则Σ=EXXT\Sigma = EXX^TΣ=EXXT,假设{Xi}i=1 ...

  2. UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数

    UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数 在前五讲的理论基础上,我们现在开始正式讨论随机矩阵.假设AAA是一个m×nm \times nm×n的随机矩阵,它的元素AijA_{ ...

  3. UA MATH567 高维统计III 随机矩阵12 整数环上的区间的应用:DNA序列突变点侦测的统计量及假设检验

    UA MATH567 高维统计III 随机矩阵12 整数环上的区间的应用:拐点侦测的统计量及假设检验 整数环上的区间作为随机变量的下标 最大值的概率不等式 应用:DNA序列突变点侦测 整数环上的区间作 ...

  4. UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析

    UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析 上一讲我们完成了Stochastic Block Model与社区发现问题的建模,并描述了 ...

  5. UA MATH567 高维统计III 随机矩阵7 亚高斯矩阵的应用:Stochastic Block Model与社区发现 问题描述

    UA MATH567 高维统计III 随机矩阵7 亚高斯矩阵的应用:Stochastic Block Model与社区发现 我们来介绍亚高斯矩阵的一个应用:评估社区发现算法的效率.Community ...

  6. UA MATH567 高维统计III 随机矩阵4 欧氏空间上的集网与覆盖

    UA MATH567 高维统计III 随机矩阵4 欧氏空间上的集网与覆盖 这一讲我们进一步介绍ϵ\epsilonϵ-网,上一讲的定义net.covering与packing是比较抽象的,这一讲我们在n ...

  7. UA MATH567 高维统计III 随机矩阵3 集网与覆盖

    UA MATH567 高维统计III 随机矩阵3 集网与覆盖 在介绍随机矩阵的concentration与尾部概率行为之前,我们先介绍一个在监督学习理论.高维统计与随机矩阵等领域都非常有用的工具:ϵ\ ...

  8. UA MATH567 高维统计I 概率不等式8 亚指数范数

    UA MATH567 高维统计I 概率不等式8 亚指数范数 类似亚高斯范数,我们也可以定义随机变量的亚指数范数(sub-exponential norm): ∥X∥ψ1=inf⁡{t>0:Ee∣ ...

  9. UA MATH567 高维统计专题1 稀疏信号及其恢复5 LASSO的估计误差

    UA MATH567 高维统计专题1 稀疏信号及其恢复5 LASSO的估计误差 Signal Recovery Noisy Setting LASSO的估计误差 Signal Recovery Noi ...

最新文章

  1. ZOJ 3597 Hit the Target! (线段树扫描线 -- 矩形所能覆盖的最多的点数)
  2. springmvc +bootstrap创建简单web项目
  3. Python全栈之路系列----之-----内置函数和匿名函数lamdba
  4. Java培训教程之this关键字讲解
  5. QDoc上下文命令contextcommands
  6. 什么时候使用 InheritableThreadLocal
  7. C# 中 Struct 和 Class 的区别总结
  8. [SlickEdit] SlickEdit支持目录别名FTP控件更新
  9. 如何用tf2.0训练中文聊天机器人chatbot
  10. Unity的渲染管线
  11. unix编程艺术中的17点编程原则--设计开发者的至高准则
  12. AI房产户型图识别3DRender
  13. zblog插件全自动采集伪原创发布插件免费
  14. 【转】传教士和野人问题(Missionaries and Cannibals)
  15. java ttf_java直接使用ttf字体,解决window和linux之间的差异
  16. 传感器与检测技术考试
  17. 激活DataGrip
  18. 开启VPN和NAT服务
  19. 使用FleaPHP框架构建简单留言本应用
  20. 实用算法的分析与程序设计——递推法(倒推法)

热门文章

  1. 利用零碎时间来提升自己的50条建议(新年必读!)
  2. Java捕获异常Exception e中e的的含义
  3. ntp校时服务器(NTP校时器)介绍
  4. 网易技术美术总监:深度解析次世代手游的贴图与着色技巧
  5. 配置maven中央仓库镜像
  6. Python:实现inverse matrix逆矩阵算法(附完整源码)
  7. 《民法典》实施后,婚后父母出资购房归属问题
  8. 质量小议26 -- 信度 和 效度
  9. linux bonding 原理,linux的bonding技术
  10. Android Hook式插件化教程(一)Hook从入门到精通