最近学习PCA,在求最大化方差 σ2=1P−1∑k=1P(vT(xk−μ))2−λ(∥v∥2−1)\sigma^{2} = \frac{1}{P-1} \sum_{k=1}^{P}(v^{T}(x_{k}-\mu ))^{2}-\lambda(\left \| v \right \|^{2}-1)σ2=P−11​∑k=1P​(vT(xk​−μ))2−λ(∥v∥2−1) 时遇到了无偏估计的问题——为什么是P-1而不是P?整理了一些笔记写上来供参考,有错误的地方望批评指正。

简单理解

首先我们了解下无偏估计的定义:
估计量的数学期望等于被估计参数的真实值,则此估计量为被估计参数的无偏估计。

乍一看很绕口,我们从现实中的简单例子去解释会更好理解。
如果我们想知道一个城市人口的平均高度,我们可以通过采集该城市所有人的身高并计算平均值,这样得到的就是无偏的平均身高。
但实际情况是,出于成本考虑,我们不太可能去测量所有人的身高,于是我们通过采样来估计实际的平均身高。于是我们应用了随机采样等方法,而这些方法虽然没法准确地估计该城市的平均身高,但不同的采样方法均在真实平均身高附近波动,那么我们就可以说这个估计是无偏的。

类似的,我们用一下以下算法去估计总体方差:
s2=1n∑i=1n(xi−xˉ)2s^{2} = \frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}s2=n1​i=1∑n​(xi​−xˉ)2

以芯靶图为例,如果我们用n代入计算得到的预测值会偏离靶图中心;而用n计算,得到的值会在靶图中心。

数学证明及解析

将公式展开计算如下:
s2=∑i=1n(xi−xˉ)2n−1E(s2)=E(∑i=1n(xi−xˉ)2n−1)=1n−1E[∑i=1n(xi−xˉ)2]=1n−1E[∑i=1n[(xi−μ)−(xˉ−μ)]2]\begin{aligned} & s^{2} = \frac{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}{n-1}\\ & E(s^{2}) = E(\frac{\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}}{n-1})\\ &= \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}]\\ &= \frac{1}{n-1}E[\sum_{i=1}^{n}[(x_{i}-\mu) - (\bar{x}-\mu)]^{2}] \end{aligned}​s2=n−1∑i=1n​(xi​−xˉ)2​E(s2)=E(n−1∑i=1n​(xi​−xˉ)2​)=n−11​E[i=1∑n​(xi​−xˉ)2]=n−11​E[i=1∑n​[(xi​−μ)−(xˉ−μ)]2]​

E[∑i=1n[(xi−μ)−(xˉ−μ)]2]E[\sum_{i=1}^{n}[(x_{i}-\mu) - (\bar{x}-\mu)]^{2}]E[∑i=1n​[(xi​−μ)−(xˉ−μ)]2]由E[∑i=1n(xi−xˉ)2]E[\sum_{i=1}^{n}(x_{i}-\bar{x})^{2}]E[∑i=1n​(xi​−xˉ)2]加一个μ\muμ括号里面再减一个μ\muμ得到。展开得到:

=1n−1E[∑i=1n(xi−μ)2−2∑i=1n(xi−μ)(xˉ−μ)+∑i=1n(xˉ−μ)2]=1n−1E[∑i=1n(xi−μ)2−2(xˉ−μ)∑i=1n(xi−μ)+∑i=1n(xˉ−μ)2]=1n−1E[∑i=1n(xi−μ)2−n(xˉ−μ)2]=1n−1(∑i=1nE(xi−μ)2−nE[(xˉ−μ)2])=1n−1(∑i=1nσxi2−nσxˉ2)\begin{aligned} & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - 2\sum_{i=1}^{n}(x_{i}-\mu)(\bar{x}-\mu) + \sum_{i=1}^{n}(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - 2(\bar{x}-\mu)\sum_{i=1}^{n}(x_{i}-\mu) + \sum_{i=1}^{n}(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}E[\sum_{i=1}^{n}(x_{i}-\mu)^{2} - n(\bar{x}-\mu)^{2}]\\ & = \frac{1}{n-1}(\sum_{i=1}^{n}E(x_{i}-\mu)^{2} - nE[(\bar{x}-\mu)^{2}])\\ & = \frac{1}{n-1}(\sum_{i=1}^{n}\sigma_{x_{i}}^{2} - n\sigma_{\bar{x}}^{2})\\ \end{aligned}​=n−11​E[i=1∑n​(xi​−μ)2−2i=1∑n​(xi​−μ)(xˉ−μ)+i=1∑n​(xˉ−μ)2]=n−11​E[i=1∑n​(xi​−μ)2−2(xˉ−μ)i=1∑n​(xi​−μ)+i=1∑n​(xˉ−μ)2]=n−11​E[i=1∑n​(xi​−μ)2−n(xˉ−μ)2]=n−11​(i=1∑n​E(xi​−μ)2−nE[(xˉ−μ)2])=n−11​(i=1∑n​σxi​2​−nσxˉ2​)​

其中,xˉ−μ\bar{x}-\muxˉ−μ是个数所以能够被从求和符号内提出来。

又因为σxi2=σ2\sigma_{x_{i}}^{2}=\sigma^{2}σxi​2​=σ2,且σxˉ2=σ2n\sigma_{\bar x}^{2}=\frac{\sigma^{2}}{n}σxˉ2​=nσ2​,因此:

=1n−1(nσ2−σ2)=1n−1(n−1)σ2=σ2\begin{aligned} &=\frac{1}{n-1}(n\sigma^{2}-\sigma^{2})\\ &=\frac{1}{n-1}(n-1)\sigma^{2}\\ &=\sigma^{2} \end{aligned}​=n−11​(nσ2−σ2)=n−11​(n−1)σ2=σ2​

因此E(s2)E(s^{2})E(s2)是σ2\sigma^{2}σ2的无偏估计量。

Reference

https://www.zhihu.com/question/22983179
https://www.youtube.com/watch?v=wlcvRrYKkx8

无偏估计的数学证明和分析相关推荐

  1. 较真的来了!这篇【硬核论文】为何恺明新作MAE提供了一种理论解释和数学证明...

    关注公众号,发现CV技术之美 昨天,arXiv上出现了一篇非常硬核的论文"How to Understand Masked Autoencoder".该论文为何恺明的最新一作论文& ...

  2. 数学证明到底是什么?

    数学史家,穆伦堡学院名誉Truman Koehler数学教授威廉·邓纳姆在1994年出版The Mathematical Universe一书,用26个英文字母作为标题讲述数学史上重要的问题和人物.本 ...

  3. 最小二乘法,简明公式整理,数学证明,matlab程序(自写代码、lsqcurvefit函数、fminsearch函数)

    目录 批处理最小二乘方法 递推最小二乘方法 带有遗忘因子的递推最小二乘方法 Matlab案例分析 自写代码 matlab之lsqcurvefit函数 matlab之fminsearch函数 附录1:递 ...

  4. 4 种经典方法IB 数学证明题分享给大家

    学习数学时感觉最有意思的题目就是证明题了,证明题能练习一种能力: 你知道一件事情时对的,怎么说清楚它是对的:你认为一件事情时错的,怎么说清楚它是错的. 这和生活中的辩论有点像,要有理有据地说清楚原因. ...

  5. 尔雅 科学通史(吴国盛) 个人笔记及课后习题 2018 第六章 自然的数学化和分析化

    科学通史 第六章 自然的数学化和分析化 6.1自然的数学化和分析化 希腊背景和基督教背景是欧洲科技革命必不可缺的背景 欧洲数理传统学科 哥白尼革命 6.1自然的数学化和分析化(习题) 6.2天文学的发 ...

  6. 主成分分析原理的数学证明

    主成分分析原理的数学证明   主成分分析(Princle Componet Analysis, PCA)是一种经典的无监督方法,可以用来降低特征的维度,在稍微牺牲点性能的前提下减小运算量,提升计算效率 ...

  7. 二叉树相关性质以及数学证明

    性质一: 在二叉树中,设度为0的结点数为n0,度为2的结点数为n2,有n0=n2+1在二叉树中,设度为0的结点数为n_0,度为2的结点数为n_2,有n_0=n_2+1在二叉树中,设度为0的结点数为n0 ...

  8. 数学建模——层次分析法Python代码

    数学建模--层次分析法Python代码 import numpy as np class AHP: """ 相关信息的传入和准备 """ d ...

  9. 【LuoguP4275】萃香的请柬-数学证明

    测试地址:萃香的请柬 做法:本题需要用到找规律(划掉)数学证明. 首先我们要猜(划掉)观察出两个结论: 第一:若第一个字符串为L,第二个字符串为B,则以后任意字符串都是前一个字符串后面接上前一个字符串 ...

  10. 从数学计算上分析人脑与电脑差异

    从数学计算上分析人脑与电脑差异 我们举一个简单的例子:如何实现1+2+3+--+100? 也许你会轻松的回答: 1+100=101 2+99 = 101 3+98 = 101 -- 50+51=101 ...

最新文章

  1. [转] Putty - 文件夹显示的蓝色太暗
  2. 每日一皮:当我看到Bug背后的一切...我退缩了...
  3. MySQL执行原理,逻辑分层、更改数据库处理引擎
  4. python制作圆形按钮_C#圆形按钮,非常漂亮动态
  5. html 纵向选项卡,竖直选项卡式面板的实现_html/css_WEB-ITnose
  6. consul的安装配置 一centos7环境
  7. html基础技术笔记
  8. Android对弹出输入法界面影响app界面布局
  9. mysql5.7 timestemp default value error
  10. 如何查看 Linux 服务器性能参数指标?
  11. C语言打印出心形表白,初学C语言也能看懂!!
  12. 固态硬盘启动计算机时间,固态硬盘如何做到10秒快速开机
  13. 60.(leaflet之家)leaflet虚线
  14. Manjaro-architect 安装指南
  15. 磁流体和两相磁流体的无条件能量稳定解耦算法
  16. 计算机管理用户组不见了,win7系统计算机管理本地用户和组不见了的解决方法...
  17. 软件测试字节跳动头条项目面试,字节跳动|今日头条面试经验分享
  18. python计算营业额代码_python计算营业额的代码_python 统计代码行数简单实例
  19. 有意思,原来SQL中的NULL是这么回事儿
  20. MySQL的循环语句使用总结

热门文章

  1. mybatis根据日期范围查询,多参数查询
  2. 解决 ”To prevent a memory leak, the JDBC Driver has been forcibly unregistered“
  3. PS绘制的路径不见了
  4. 关于MUI一个很实用的前端框架
  5. ps怎么把图片透明化
  6. 深度学习的黑魔法防御术:恶意样本(Adversarial Example) 的防御策略综述
  7. 什么是前端工程师?前端工程师需要掌握什么技能?
  8. 联想G480 i3 2348M扩展内存
  9. 小程序切出去重新进入
  10. dnsdhcp服务器实验原理,DHCP服务器配置实验报告.doc