首先我们来看看方差的计算公式:S2=1n−1∑ni=1(Xi−X¯¯¯¯)2S2=1n−1∑i=1n(Xi−X¯)2S^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2
其中:X¯¯¯¯=1n∑ni=1XiX¯=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum_{i=1}^{n}X_i 为均值
由均值的计算公式知,一旦计算了平均值,n个变量就是不再独立了,都与均值产生了联系,也就是说在n个随机变量XiXiX_i 中只要知道了其中的任意n-1个及均值X¯¯¯¯X¯\overline{X} 就能求出另外一个,故能自由地取值的随机变量只有n-1个。所以在用均值计算方差时,能自由变化的随机变量只有n-1个,所以方差要除是n-1。
举个例子,X1=2,X2=4,X3=6X1=2,X2=4,X3=6X_1=2,X_2=4,X_3=6 ,均值X¯¯¯¯=4X¯=4\overline{X}=4,只要知道了X¯¯¯¯X¯\overline{X}和X1,X2X1,X2X_1,X_2,X3=3×X¯¯¯¯−X1−X2X3=3×X¯−X1−X2X_3=3\times\overline{X}-X_1-X_2 ,就能计算出来,也就是说X3X3X_3不能自由地取值了。


我们希望样本方差的期望是总体的方差(σ2σ2\sigma^2),如果把自由度设为n会有什么后果?证明一下。

E(S2)=E(1n∑ni=1(Xi−X¯¯¯¯)2))=E(1n∑ni=1((Xi−μ)−(X¯¯¯¯−μ))2)=E(1n∑ni=1((Xi−μ)2−2(Xi−μ)(X¯¯¯¯−μ)+(X¯¯¯¯−μ)2))=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)∑ni=1(Xi−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×(∑ni=1Xi−nμ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×n×(1n∑ni=1Xi−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×n×(X¯¯¯¯−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2))−E((X¯¯¯¯−μ)2))=σ2−E((1n(∑ni=1Xi−nμ))2)=σ2−E((1n(∑ni=1Xi−nμ))2)=σ2−E((1n(∑ni=1(Xi−μ))2)=σ2−1nE(1n(∑ni=1(Xi−μ))2)=σ2−1nσ2=(1−1n)σ2=(n−1n)σ2<σ2E(S2)=E(1n∑i=1n(Xi−X¯)2))=E(1n∑i=1n((Xi−μ)−(X¯−μ))2)=E(1n∑i=1n((Xi−μ)2−2(Xi−μ)(X¯−μ)+(X¯−μ)2))=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)∑i=1n(Xi−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×(∑i=1nXi−nμ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×n×(1n∑i=1nXi−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×n×(X¯−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2))−E((X¯−μ)2))=σ2−E((1n(∑i=1nXi−nμ))2)=σ2−E((1n(∑i=1nXi−nμ))2)=σ2−E((1n(∑i=1n(Xi−μ))2)=σ2−1nE(1n(∑i=1n(Xi−μ))2)=σ2−1nσ2=(1−1n)σ2=(n−1n)σ2<σ2

\begin{array}{ll} E(S^2)&=E(\dfrac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2))\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)-( \overline{X}- \mu))^2)\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)^2-2(X_i-\mu)( \overline{X}- \mu)+(\overline{X}-\mu)^2))\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times(\sum_{i=1}^n X_i-n\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\dfrac{1}{n}\sum_{i=1}^n X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\overline{X} -\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2))-E((\overline{X}-\mu)^2))\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}E(\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}\sigma^2=(1-\dfrac{1}{n})\sigma^2=(\dfrac{n-1}{n})\sigma^2 \lt \sigma^2 \end{array}

以上推导说明如果除的是n那么得到的方差总比总体的方差小那么一点点。


下面我们作一点点修正:

E(S2)=(n−1n)σ2E(S2)=(n−1n)σ2

\begin{array}{ll}E(S^2)&=(\dfrac{n-1}{n})\sigma^2\end{array}
在式子的两边乘上 nn−1nn−1\dfrac{n}{n-1} 得:

nn−1E(S2)=nn−1(n−1n)σ2=σ2nn−1E(S2)=nn−1(n−1n)σ2=σ2

\dfrac{n}{n-1}E(S^2)=\dfrac{n}{n-1}(\dfrac{n-1}{n})\sigma^2=\sigma^2
即:

nn−1E(S2)=σ2E(nn−1S2)=σ2E(nn−11n∑i=1n(Xi−X¯¯¯¯))=σ2E(1n−1∑i=1n(Xi−X¯¯¯¯))=σ2nn−1E(S2)=σ2E(nn−1S2)=σ2E(nn−11n∑i=1n(Xi−X¯))=σ2E(1n−1∑i=1n(Xi−X¯))=σ2

\dfrac{n}{n-1}E(S^2)=\sigma^2\\E(\dfrac{n}{n-1}S^2)=\sigma^2\\E(\dfrac{n}{n-1}\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\E(\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\

所以1n−1∑ni=1(Xi−X¯¯¯¯)1n−1∑i=1n(Xi−X¯)\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}) 是总体方差的无偏估计量,而不能使用1n∑ni=1(Xi−X¯¯¯¯)1n∑i=1n(Xi−X¯)\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X})。

样本方差为什么要除n-1,而不是n相关推荐

  1. 为什么样本方差公式中要除以n-1而不是n

    定义 在学习概率与数理统计时,期望和方差是两个比较重要的概念,教材上给出的期望与方差的定义一般为: 期望: (1)离散型随机变量的数学期望: 设离散型随机变量X的分布律为:               ...

  2. 为什么样本方差里面要除以(n-1)而不是n?

    前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...

  3. 总体方差与样本方差分母的小小区别,n还是n-1?

    总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...

  4. 统计学---之样本方差与总体方差的区别

    前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...

  5. 为什么对高斯分布的方差的极大似然估计是有偏的?

    本文要证明为什么对高斯分布的方差的极大似然估计是有偏的.同时,也说明为什么求样本方差时,分母是N-1而不是N. 首先,明白两点,(1)极大似然法得到的高斯方差是什么形式(2)什么是有偏. (1)先说第 ...

  6. 3.1 参数估计:矩估计方法

    3.1 矩估计方法 假设我们知道某个随机变量满足高斯分布,但不知道高斯分布的两个参数 μ,σ2\mu,\sigma^2μ,σ2 ,怎么估计这些参数呢,这就是参数估计要解决的问题.实践中经常遇到这种问题 ...

  7. 样本方差为何除以n-1而不是n?

    很多人可能都会有疑问,为什么要除以n-1,而不是n. 如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1. 那么问题来了,为什么不是除以n-2.n-3 ...

  8. 样本方差除以n-1而不是n的原因

    https://www.zybang.com/question/8c665fa06a6e40990e9f5f59421ebec9.html

  9. 【数学基础】无偏估计——为何样本方差需要除以(n-1)?

    [fishing-pan:https://blog.csdn.net/u013921430 转载请注明出处]       相信在学习数理统计过程中,肯定很多人会下面这样的疑问 为什么样本方差是除以(n ...

最新文章

  1. RabbitMQ 入门系列(3)— 生产者消费者 Python 代码实现
  2. Face Recognition for the Happy House-v3
  3. numpy 深复制 切片创建视图
  4. 在Windows下安装labelImg
  5. 多台Linux服务器SSH相互访问无需密码--转
  6. ITK:计算PCA形状模型
  7. SAP CRM Interactive Report(交互式报表)里和服务订单相关的一些字段
  8. .NET Core实战项目之CMS 第三章 入门篇-源码解析配置文件及依赖注入
  9. centos8安装中文(zh_CN)语言包
  10. 使用数据库镜像保障高可用的数据库应用(下)
  11. python编程入门书籍-编程小白的第一本 Python 入门书
  12. @SuppressLint(HandlerLeak),或Handler使用有警告;
  13. 【相机标定系列】相机成像的理想模型原理,相机矩阵分解
  14. 记Thinkpad的一次扩容升级经历
  15. 数据库数据迁移的3种方案学习
  16. 计算机的运行英文表示,电脑一些英文表示什么格式
  17. 选择合适的垃圾收集器
  18. 轻松解决 f2pool鱼池ethermine连接失败antpool矿池连接不上的问题E池连接超时
  19. HTML的基本结构及基本标签
  20. DBSCAN原理及matlab仿真代码

热门文章

  1. 我的世界我服务器注册密码大全,我的世界国际版账号密码大全2021
  2. Moviepy模块之视频添加图片水印
  3. python轰炸敌机小游戏_python实现飞机大战微信小游戏
  4. C# 中的委托和事件[转自张子扬]
  5. x86架构鼻祖-i8086
  6. swift 中构建3DTouch 及 widget
  7. 信通院 移动安全蓝皮书 数据安全管理案例 学习笔记
  8. 为什么使用 Kafka?
  9. 《一网打尽:贝佐斯与亚马逊时代》的推荐及推荐书单
  10. python安装gensim_python gensim