数值计算之 最小二乘法(3)最小二乘的矩阵解法

  • 前言
  • 回顾最小二乘的线性解
  • 列满秩矩阵的最小二乘解法
    • Cholesky分解求线性最小二乘解
    • QR分解求线性最小二乘解
  • 亏秩矩阵的最小二乘解法
    • SVD分解求亏秩最小二乘解
  • 补充1:超定齐次方程组的线性最小二乘解法
  • 补充2:欠定行满秩方程组的线性最小二乘解法
  • 后记

前言

之前将最小二乘法与线性方程组求解关联,得到了线性最小二乘的矩阵形式,以及线性最小二乘的几何意义。

本篇将介绍线性最小二乘的矩阵解法。

回顾最小二乘的线性解

对于线性超定方程组 A x = b , A ∈ R m × n , m > n Ax=b,A\in R^{m\times n},m>n Ax=b,A∈Rm×n,m>n,其最小二乘解可表示为:
arg min ⁡ x ∣ ∣ A x − b ∣ ∣ 2 2 = arg min ⁡ x ( A x − b ) T ( A x − b ) → A T A x = A T b i f r a n k ( A ) = n , x = ( A T A ) − 1 A T b \argmin_x ||Ax-b||^2_2=\argmin_x (Ax-b)^T(Ax-b) \\ \to A^TAx=A^Tb \\ \quad \\ if \quad rank(A)=n, x=(A^TA)^{-1}A^Tb xargmin​∣∣Ax−b∣∣22​=xargmin​(Ax−b)T(Ax−b)→ATAx=ATbifrank(A)=n,x=(ATA)−1ATb

以上解法具有两个问题:① A T A A^TA ATA求逆运算的效率;② r a n k ( A ) < n rank(A)<n rank(A)<n时的最小二乘解。

首先讨论问题①。

列满秩矩阵的最小二乘解法

对于线性方程组 A x = b , A ∈ R m × n , m > n , r a n k ( A ) = n Ax=b,A\in R^{m\times n},m>n,rank(A)=n Ax=b,A∈Rm×n,m>n,rank(A)=n,有 A T A A^TA ATA对称且可逆。回顾矩阵分解的知识,可知 A T A A^TA ATA矩阵能够进行Cholesky分解和QR分解。

Cholesky分解求线性最小二乘解

通过将 A T A A^TA ATA分解为下三角矩阵 L L L的乘积 L L T LL^T LLT:
A T A = L L T A^TA=LL^T ATA=LLT
则可以将复杂的线性方程组求解:
A T A x = A T b A^TAx=A^Tb ATAx=ATb
转化为两个简单的三角线性方程组求解:
L L T x = A T b → L T x = y , L y = A T b LL^Tx=A^Tb \to L^Tx=y, Ly=A^Tb LLTx=ATb→LTx=y,Ly=ATb

Cholesky分解速度很快,但精度一般,稳定性差。适合在限定时间内的大规模超定线性方程计算求解。

QR分解求线性最小二乘解

对于列满秩矩阵 A A A而言,可以唯一分解为正交矩阵与对角元为正的上三角矩阵的乘积:
A = Q R = Q [ R 0 ] A=QR=Q\begin{bmatrix} R \\ 0 \end{bmatrix} A=QR=Q[R0​]
现在考虑最小二乘法的QR分解法:
arg min ⁡ x ∣ ∣ A x − b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ Q [ R 0 ] x − b ∣ ∣ = arg min ⁡ x ∣ ∣ [ R 0 ] x − Q T b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ [ R x 0 ] − [ β 1 β 2 ] ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ R x − β 1 ∣ ∣ 2 2 + ∣ ∣ β 2 ∣ ∣ 2 2 ⟺ arg min ⁡ x ∣ ∣ R x − β 1 ∣ ∣ 2 2 → R x = β 1 , x = R − 1 β 1 [ β 1 β 2 ] = Q T b \argmin_x ||Ax-b||^2_2=\argmin_x ||Q\begin{bmatrix} R \\ 0 \end{bmatrix}x-b|| \\ = \argmin_x ||\begin{bmatrix} R \\ 0 \end{bmatrix}x-Q^Tb||^2_2 \\ = \argmin_x ||\begin{bmatrix} Rx \\ 0 \end{bmatrix} - \begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix}||^2_2 \\ = \argmin_x ||Rx-\beta_1||^2_2 + ||\beta_2||^2_2 \\ \iff \argmin_x ||Rx-\beta_1||^2_2 \\ \to Rx=\beta_1,x=R^{-1}\beta_1 \\ \quad \\ \begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix} = Q^Tb xargmin​∣∣Ax−b∣∣22​=xargmin​∣∣Q[R0​]x−b∣∣=xargmin​∣∣[R0​]x−QTb∣∣22​=xargmin​∣∣[Rx0​]−[β1​β2​​]∣∣22​=xargmin​∣∣Rx−β1​∣∣22​+∣∣β2​∣∣22​⟺xargmin​∣∣Rx−β1​∣∣22​→Rx=β1​,x=R−1β1​[β1​β2​​]=QTb

QR分解的速度较快,精度一般。不过由于存在高精度的QR分解方式,因此适合需要高精度解的小规模超定方程组计算。

亏秩矩阵的最小二乘解法

对于线性方程组 A x = b , A ∈ R m × n , m > n , r a n k ( A ) < n Ax=b,A\in R^{m\times n},m>n,rank(A)<n Ax=b,A∈Rm×n,m>n,rank(A)<n,称为亏秩超定方程组。此时 A T A A^TA ATA不是正定矩阵,QR分解也不是唯一的。通常使用SVD来解决亏秩问题。

SVD分解求亏秩最小二乘解

对于矩阵 A m × n , m > n , r a n k ( A ) = r < n A_{m\times n},m>n,rank(A)=r<n Am×n​,m>n,rank(A)=r<n,可分解为正交矩阵与奇异值矩阵的乘积:
A = U m × m [ Σ r × r 0 r × ( n − r ) 0 ( m − r ) × r 0 ( m − r ) × ( n − r ) ] V n × n T U T U = E , V T V = E A=U_{m\times m}\begin{bmatrix}\Sigma_{r\times r} & 0_{r\times (n-r)} \\ 0_{(m-r)\times r} & 0_{(m-r)\times (n-r)}\end{bmatrix} V_{n\times n}^T \\ \quad \\ U^TU=E,V^TV=E A=Um×m​[Σr×r​0(m−r)×r​​0r×(n−r)​0(m−r)×(n−r)​​]Vn×nT​UTU=E,VTV=E
现在考虑最小二乘法的SVD解法:
arg min ⁡ x ∣ ∣ A x − b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ U T A x − U T b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ U T U [ Σ 0 0 0 ] V T x − U T b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ [ Σ 0 0 0 ] V T x − U T b ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ [ Σ 0 0 0 ] [ α 1 α 2 ] − [ β 1 β 2 ] ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ [ Σ α 1 0 ] − [ β 1 β 2 ] ∣ ∣ 2 2 = arg min ⁡ x ∣ ∣ Σ α 1 − β 1 ∣ ∣ 2 2 + ∣ ∣ β 2 ∣ ∣ 2 2 → Σ α 1 = β 1 [ α 1 α 2 ] = V T x , [ β 1 β 2 ] = U T b α 1 = Σ − 1 β 1 , x = V [ α 1 α 2 ] \argmin_x ||Ax-b||^2_2 = \argmin_x ||U^TAx-U^Tb||^2_2 \\ = \argmin_x ||U^TU\begin{bmatrix}\Sigma & 0 \\ 0 & 0 \end{bmatrix}V^Tx-U^Tb||^2_2 \\ = \argmin_x ||\begin{bmatrix}\Sigma & 0 \\ 0 & 0 \end{bmatrix}V^Tx-U^Tb||^2_2 \\ = \argmin_x ||\begin{bmatrix}\Sigma & 0 \\ 0 & 0 \end{bmatrix}\begin{bmatrix} \alpha_1 \\ \alpha_2 \end{bmatrix}-\begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix}||^2_2 \\ = \argmin_x ||\begin{bmatrix}\Sigma\alpha_1 \\ 0 \end{bmatrix}-\begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix}||^2_2 \\ = \argmin_x ||\Sigma\alpha_1-\beta_1||^2_2 +||\beta_2||^2_2 \\ \to \Sigma\alpha_1=\beta_1 \\ \quad \\ \begin{bmatrix} \alpha_1 \\ \alpha_2 \end{bmatrix} = V^Tx,\begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix}=U^Tb \\ \quad \\ \alpha_1=\Sigma^{-1}\beta_1,x =V\begin{bmatrix} \alpha_1 \\ \alpha_2 \end{bmatrix} \\ \quad \\ xargmin​∣∣Ax−b∣∣22​=xargmin​∣∣UTAx−UTb∣∣22​=xargmin​∣∣UTU[Σ0​00​]VTx−UTb∣∣22​=xargmin​∣∣[Σ0​00​]VTx−UTb∣∣22​=xargmin​∣∣[Σ0​00​][α1​α2​​]−[β1​β2​​]∣∣22​=xargmin​∣∣[Σα1​0​]−[β1​β2​​]∣∣22​=xargmin​∣∣Σα1​−β1​∣∣22​+∣∣β2​∣∣22​→Σα1​=β1​[α1​α2​​]=VTx,[β1​β2​​]=UTbα1​=Σ−1β1​,x=V[α1​α2​​]
在上面的解法中,由于 α 2 \alpha_2 α2​是一个任意向量,因此求出的 x x x不是唯一的。即亏秩方程的最小二乘解不唯一。可以选择范数最小的最小二乘解作为亏秩方程的解,即 α 2 = 0 ⃗ \alpha_2=\vec 0 α2​=0 。

可以通过正交矩阵分块,将SVD最小二乘解进一步化简:
U = [ U 1 , U 2 ] , V = [ V 1 , V 2 ] U 1 ∈ R m × r , V 1 ∈ R n × r α 1 = Σ − 1 β 1 [ α 1 α 2 ] = [ V 1 T V 2 T ] x [ β 1 β 2 ] = [ U 1 T U 2 T ] b V 1 T x = Σ − 1 U 1 T b x = V 1 Σ − 1 U 1 T b U=[U_1,U_2],V=[V_1,V_2] \\ U_1\in R^{m\times r},V_1\in R^{n\times r} \\ \quad \\ \alpha_1=\Sigma^{-1}\beta_1 \\ \quad \\ \begin{bmatrix} \alpha_1 \\ \alpha_2 \end{bmatrix} = \begin{bmatrix} V_1^T \\ V_2^T \end{bmatrix} x \\ \quad \\ \begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix} = \begin{bmatrix} U_1^T \\ U_2^T \end{bmatrix} b \\ \quad \\ V_1^Tx=\Sigma^{-1} U_1^Tb \\ \quad \\ x=V_1\Sigma^{-1} U_1^Tb \\ U=[U1​,U2​],V=[V1​,V2​]U1​∈Rm×r,V1​∈Rn×rα1​=Σ−1β1​[α1​α2​​]=[V1T​V2T​​]x[β1​β2​​]=[U1T​U2T​​]bV1T​x=Σ−1U1T​bx=V1​Σ−1U1T​b

需要说明的是,SVD也适用于列满秩矩阵的最小二乘求解实际上SVD分解是最常用的线性最小二乘解法之一

补充1:超定齐次方程组的线性最小二乘解法

之前的最小二乘法都在考虑 A x = b Ax=b Ax=b的最小非齐次方程组问题。现在补充齐次方程组的最小二乘解法。

对于齐次方程组 A m × n x = 0 , m > n A_{m\times n}x=0,m>n Am×n​x=0,m>n而言,其最小二乘解就是 A A A的SVD分解后的 V V V的最后一个列向量

证明:
A = U [ Σ 0 ] V T A x = U [ Σ 0 ] V T x = 0 y = V T x , Σ y = 0 也 就 是 说 , 求 A x = 0 , 转 换 为 求 Σ y = 0 的 最 小 二 乘 解 arg min ⁡ y ∣ ∣ Σ y ∣ ∣ 2 2 = arg min ⁡ y y T Σ T Σ y = arg min ⁡ y ∑ i = 1 n σ i 2 y i 2 s . t . ∣ ∣ y ∣ ∣ > 0 Σ 对 角 线 元 素 由 大 到 小 排 列 , 则 满 足 y = [ 0 , 0 , … , 0 , y n ] T , y n ≠ 0 时 , 获 得 Σ y 的 最 小 二 乘 解 V T x = y , x = V y = y n v n i f ∣ ∣ y ∣ ∣ 2 = 1 t h e n x = v n A=U\begin{bmatrix} \Sigma \\ 0 \end{bmatrix} V^T \\ \quad \\ Ax= U\begin{bmatrix} \Sigma \\ 0 \end{bmatrix} V^Tx=0 \\ \quad \\ y=V^Tx,\Sigma y=0 \\ \quad \\ 也就是说,求Ax=0,转换为求\Sigma y=0的最小二乘解 \\ \quad \\ \argmin_y ||\Sigma y||^2_2 \\ =\argmin_y y^T\Sigma^T\Sigma y \\ =\argmin_y \sum_{i=1}^n \sigma_i^2 y_i^2 \\ s.t. \quad ||y||>0 \\ \quad \\ \Sigma 对角线元素由大到小排列,则满足 \\ \quad \\ y=[0,0,\dots,0,y_n]^T,y_n\ne 0 \\ \quad \\ 时,获得\Sigma y的最小二乘解 \\ \quad \\ V^Tx=y,x=Vy=y_nv_n \\ \quad \\ if \quad ||y||_2=1 \\ then \quad x=v_n \\ A=U[Σ0​]VTAx=U[Σ0​]VTx=0y=VTx,Σy=0也就是说,求Ax=0,转换为求Σy=0的最小二乘解yargmin​∣∣Σy∣∣22​=yargmin​yTΣTΣy=yargmin​i=1∑n​σi2​yi2​s.t.∣∣y∣∣>0Σ对角线元素由大到小排列,则满足y=[0,0,…,0,yn​]T,yn​​=0时,获得Σy的最小二乘解VTx=y,x=Vy=yn​vn​if∣∣y∣∣2​=1thenx=vn​
进一步,超定齐次线性方程组 A x = 0 Ax=0 Ax=0的最小二乘解还等于 A T A A^TA ATA的最小特征值对应的特征向量:

证明:
A = U [ Σ 0 ] V T A T A = V [ Σ 0 ] [ Σ 0 ] V T = V Σ 2 V T A T A x = V Σ 2 V T x = 0 y = V T x , Λ = Σ 2 , Λ y = 0 A=U\begin{bmatrix} \Sigma \\ 0 \end{bmatrix} V^T \\ \quad \\ A^TA = V \begin{bmatrix} \Sigma & 0 \end{bmatrix}\begin{bmatrix} \Sigma \\ 0 \end{bmatrix}V^T=V\Sigma^2V^T \\ \quad \\ A^TAx = V\Sigma^2V^Tx=0 \\ y=V^Tx,\Lambda=\Sigma^2,\Lambda y=0 \\ \quad \\ A=U[Σ0​]VTATA=V[Σ​0​][Σ0​]VT=VΣ2VTATAx=VΣ2VTx=0y=VTx,Λ=Σ2,Λy=0
后面的证明就与上面一模一样了。

补充2:欠定行满秩方程组的线性最小二乘解法

还需要补充的是欠定方程组的最小二乘解法。虽然用的少,但却实实在在的碰到了这个问题:对极几何中本质矩阵的求解。

首先需要确定,线性齐次欠定方程组必然存在无穷组解析解。

对于非齐次欠定方程组 A m × n x = b , m < n , r a n k ( A ) = r A_{m\times n}x=b,m<n,rank(A)=r Am×n​x=b,m<n,rank(A)=r,其最小二乘也是通过SVD求解:
A = [ U 1 m × r , U 2 m × ( m − r ) ] [ Σ r × r 0 0 0 ( m − r ) × ( n − r ) ] [ V 1 n × r , V 2 n × ( n − r ) ] T A x = U 1 Σ V 1 T x = b y = V 1 T x , U 1 Σ y = b 特 别 的 , 如 果 r a n k ( A ) = m , 有 U Σ y = b , y = Σ − 1 U T b , x = V Σ − 1 U T b A=[U_1^{m\times r},U_2^{m\times (m-r)}]\begin{bmatrix} \Sigma^{r\times r} & 0 \\ 0 & 0^{(m-r)\times (n-r)} \end{bmatrix} [V_1^{n\times r},V_2^{n\times (n-r)}]^T \\ \quad \\ Ax = U_1\Sigma V_1^Tx=b \\ y=V_1^Tx,U_1\Sigma y=b \\ \quad \\ 特别的,如果rank(A)=m,有 \\ \quad \\ U\Sigma y=b,y=\Sigma^{-1}U^Tb,x=V\Sigma^{-1}U^Tb A=[U1m×r​,U2m×(m−r)​][Σr×r0​00(m−r)×(n−r)​][V1n×r​,V2n×(n−r)​]TAx=U1​ΣV1T​x=by=V1T​x,U1​Σy=b特别的,如果rank(A)=m,有UΣy=b,y=Σ−1UTb,x=VΣ−1UTb

后记

本篇介绍了最小二乘的矩阵解法,包括列满秩超定方程组的Cholesky分解法和QR分解法,以及亏秩超定方程组的SVD解法。

后续将继续学习非线性方程组的最小二乘问题。

数值计算之 最小二乘法(3)最小二乘的矩阵解法相关推荐

  1. 数值计算之 最小二乘法(1)最小二乘计算与线性方程

    数值计算之 最小二乘法(1)最小二乘计算与矩阵 前言 最小二乘法与线性方程组 最小二乘解与矩阵计算 总结 前言 本篇开启一个非常重要的内容,最小二乘法.它在方程组求解.多视图几何计算.线性优化等方面具 ...

  2. 差分进化算法python 指派问题_一类指派问题的改进矩阵解法

    一 类 指 派 问 题 的 改 进 矩 阵 解 法 孙 静 (广州科技职业技术学院 电子信息系,广东 广州 510550) 摘 要 :本 文介绍 了求历 时最短的 指派 问题 ,给 出 了改 进矩阵解 ...

  3. SLAM--三角测量SVD分解法、最小二乘法及R t矩阵的判断

    目录 一.三角测量 方法一:SVD分解法的推导 方法二:最小二乘法求解 二.ORB_SLAM2 三角测量源码: 三.利用Eigen源码实现三角测量: 方法一:SVD分解法 方法二:最小二乘法求解(速度 ...

  4. 可行加权最小二乘法_最小二乘法和加权最小二乘法

    1 / 4 最小二乘法和加权最小二乘法 -50-40-30-20-1001020304050-0.100.10.20.30.40.50.6tRx1 x23. 3. 3 ( WLS ) 为了降低节点成本 ...

  5. 梯度下降 最小二乘法 matlab,最小二乘法和梯度下降法的理解

    最小二乘法 在线性回归中,听的最多的应该算是最小二乘法了.最小二乘法在具体实现过程中保留核心思想的同时,会在算法上进行不同程度的改进,因此,最小二乘法有很多演变体,例如:递推最小二乘法,加权最小二乘法 ...

  6. 七参数 布尔萨 最小二乘法_最小二乘法和最大似然法的联系

    目录 最小二乘法概念 最大似然法概念 两者的联系 总结 一.最小二乘法概念 最小二乘法(又称最小平方法)是一种数学优化技术.它通过最小化误差的平方和寻找数据的最佳函数匹配.利用最小二乘法可以简便地求得 ...

  7. 数值分析matlab最小二乘法,数值分析 最小二乘 matlab

    1. 已知函数在下列各点的值为 -1 -0.75 -0.5 0 0.25 0.5 0.75 1.00 0.8125 0.75 1.00 1.3125 1.75 2.3125 分别用一次.二次.三次最小 ...

  8. 线性方程组的矩阵解法——克莱姆法则

    设线性方程组为 { a 11 x 1 + a 11 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 . . . ...

  9. js超好懂的螺旋矩阵解法(用递归)

    原则就是每次最外边的四条边剥掉 分三种情况 m==n(方形)最简单,最后二维数组套一个字符 m>n(宽形)最后m为奇数可能会出现只剩一行的情况 m<n(窄形)最后n为奇数可能会出现只剩一列 ...

最新文章

  1. 16. Spring Boot使用Druid(编程注入)【从零开始学Spring Boot】
  2. mysql之mysqldump备份恢复
  3. jquery版本冲突问题
  4. 【转】VS2008制作打包程序将安装路径写入注册表
  5. 图片显示时加水印(不改变原图片)
  6. 使用imbalanced-learn处理数据不均衡问题
  7. androidstudio学习总结_Android 开发工程师自述:2年的开发,我总结了7条经验
  8. I/O多路转接之poll,epoll
  9. 大写汉字转阿拉伯数字c语言,阿拉伯数字转中文数字方法详解(C++实现)
  10. Android 系统(273)---分布式Redis主备复制
  11. Java开源CMS系统
  12. 一个普通人的震后十年
  13. 【Numpy入门实例:图像的手绘效果】
  14. Python 查找算法_众里寻他千百度,蓦然回首那人却在灯火阑珊处(线性、二分,分块、插值查找算法)
  15. 港科校友 | 香港科大EMBA刘礼华校友获评俄罗斯自然科学院院士
  16. matlab流场可视化后处理
  17. ORC科普3-创业小王子Turboden
  18. UploadFile图片上传案例
  19. vc++中如何实现类似fences软件中的栅栏桌面
  20. 微软软件测试报告,windows计算器软件测试报告.doc

热门文章

  1. STM32F407配置pca9685驱动
  2. cholesky 分解加速求解线性方程组
  3. jack编译突然无法编译的问题
  4. 机器学习入门的书单(数据挖…
  5. win10 + Ubuntu 20.04 LTS 双系统安装 (UEFI + GPT)(图文,多图预警)
  6. SQL语句(四)联表查询
  7. Spring Boot Shiro权限管理
  8. 利用Pandas拆分Excel的单元格为多行并保留其他行的数据
  9. paddle.fluid.io.xmap_readers
  10. 小米盒子刷arm linux,小米盒子刷成原生安卓系统操作步骤详解