为什么样本方差的分母是 n-1

按照方差的定义,直观上我们可能会这样子计算方差:

但是,在所有的书中,都将方差的计算公式定义为:

为什么是除以n-1而不是n呢?这就是这里要讨论的问题。

1、除n-1会带来什么问题

或许答案你已经知道了:为了保证方差估计的无偏性,我们通常要除以n-1,而不是n.如果是除以n,会使得估计的方差比实际方差要小。这是为什么呢?我们下面就来讨论讨论

1.1 现实生活中面临的问题

加入我们要调查全国人民的收入水平,并且已经知道了全国人民的平均收入水平问(别问我为什么知道的,上帝告诉我的)。这时我们对总体进行抽样,记每个样本问,根据的定义,我们可以得到全国人民收入水平的方差为:


但问题是,现实生活中,是无法确定的(你不可能调查到所有人的收入水平)。这时候,我们就会用样本的均值去代替。但是!

如果直接使用作为方差的估计,那么计算出来的结果会低于实际的方差!

这是因为:


换言之,除非正好,否则我们一定有


而不等式右边的那位才是的对方差的“正确”估计! 这个不等式说明了,为什么直接使用会导致对方差的低估。

我们通过一个gif来看一下,的实际偏差越大,对估计的影响就越大!

1.2 如何解决这个问题

那么,在不知道随机变量真实数学期望的前提下,如何“正确”的估计方差呢?答案是把上式中的分母,通过这种方法把原来的偏小的估计“放大”一点点,我们就能获得对方差的正确估计了:


至于为什么分母是n-1而不是n-2或者别的什么数呢?这就是我们接下来要证明的事情。

2、调整分母 得到无偏估计

为我们估计的方差,则


其中:


所以我们接着算下去:


其中(证明见:这里):


所以:


也就是说,低估了 ,进行一下调整:


因此使用下面这个式子进行估计,得到的就是无偏估计:


转载于:https://juejin.im/post/5b9a0313e51d453eb93d3511

为什么样本方差的分母是 n-1相关推荐

  1. python计算标准差为什么分母要-1_为什么样本方差的分母是除以n-1

    样本方差的分母 随机变量的方差描述的是变量的离散程度,$$\text{Var}(X)=E[(X-\mu)^2]=E[{1\over n}\sum_{i=1}^n (X_i-\mu)2]=\sigma2 ...

  2. 样本方差公式推导--为什么样本方差的分母是n-1

    概要 因为使用n作为分母会导致方差被低估,将分母替换为n-1可以保证样本方差是一种无偏估计 理想情况 首先,我们假定随机变量 X X X的数学期望 μ \mu μ是已知的,然而方差 σ 2 {{\si ...

  3. 总体方差与样本方差分母的小小区别,n还是n-1?

    总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...

  4. 自由度(为什么样本方差自由度是n-1)

    一 概念.条件及目的 概念 要理解样本方差的自由度为什么是n-1,得先理解自由度的概念: 自由度,是指附加给独立的观测值的约束或限制的个数,即一组数据中可以自由取值的个数. 成立条件 所谓自由取值,是 ...

  5. 统计学基础之样本方差和总体方差

    统计学基础之样本方差与总体方差 文章目录 统计学基础之样本方差与总体方差 1. 方差(variance)的定义 2. 样本方差 3. 总体方差公式的有偏性证明 4. 样本方差公式分母为n-1的推导 参 ...

  6. 【机器学习】主元分析(PCA)以及与SVD的区别联系

    参考文章:如何理解主元分析(PCA)? 主元分析的目的是降低数据的维度.主元分析也就是PCA,主要用于数据降维. 1 什么是降维? 比如说有如下的房价数据: 这种一维数据可以直接放在实数轴上: 不过数 ...

  7. matlab var std,Matlab var std cov 函数解析

    在Matlab中使用var求样本方差,使用std求标准差! 首先来了解一下方差公式: p = [-0.92 0.73 -0.47 0.74 0.29; -0.08 0.86 -0.67 -0.52 0 ...

  8. 数学基础(二)——参数估计与矩阵运算基础

    参数估计与矩阵运算基础 ps: 个人笔记 根据视频和PDF学习 1 期望 离散型: 连续型: 即:概率加权下的"平均值" 期望的性质 无条件成立 若X和Y相互独立 反之不成立.事实 ...

  9. matlab求样本相关系数,matlab中样本相关系数的计算与测试

    1. 何谓相关系数? 此处只列出相关系数的公式: r=Cov(X,Y)σxσy=E(X−μx)(Y−μy)σxσy 更多内容请百度或者看概率论与数理统计方面的书. 文章的目的是测试一下如何使用这个公式 ...

最新文章

  1. 利用三层交换机实现VLAN的通信实验报告
  2. CountDownLatch 的使用小例
  3. bootstranp选项卡怎么把每个选项卡里面的表单分开提交_EXCEL 宏应用基础知识,利用已实现的宏,制作自己的功能选项卡...
  4. VC中使用Unicode的一些列问题
  5. cf552 G Minimum Possible LCMn个数,求最小得一对lcm
  6. 数字图像处理:第一章 概述
  7. 台式电脑不拉网线上网_在家里想不拉宽带用无线上网,试试这几招?
  8. 速卖通新手入驻必须了解的“9大知识点”
  9. java jxl之Excel的创建
  10. 美赛整理之理想直流伺服电机的simulink仿真优化
  11. Linux从入门到精通——数据库
  12. 23 android多线程
  13. Java之String,StringBuffer,StringBuilder比较
  14. Visual Studio 2013无法打开IIS Express Web的解决办法
  15. 带音效的计算机软件,普通电脑WIN7上安装杜比音效增强软件Dolby Home TheaterV4教程...
  16. 黑苹果英特尔板载网卡驱动 IntelMausiEthernet.kext 2.5.0
  17. 取手机号码php正则表达式,PHP获取手机号码的正则表达式写法
  18. 单片机通信接口:UART、I2C、SPI、TTL、RS232、RS422、RS485、CAN、USB
  19. 卡尔曼滤波-卡尔曼滤波全篇讲解
  20. 苹果手机设置导入喜欢的音乐作为铃声

热门文章

  1. seo专用推送神器免费使用
  2. MAC下SecureCRT 8.0.4破解版远程连接工具的安装与配置
  3. Windows 10 RTM版已正式结束官方支持
  4. GDB调试CoreDump文件
  5. java写键盘鼠标录制器,易语言仿按键精灵录制键盘鼠标操作的代码
  6. 从光耦到数字隔离器的“国产替代”之路
  7. VLCMediaPlayer
  8. STM32CubeMX安装及使用教程(一)
  9. 块匹配算法--全搜索
  10. Android使用讯飞SDK开发语音识别及合成小Demo