问题引入:

很多同学会很奇怪一个问题,那就是为什么样本的二阶中心矩m2=1n∑i=1n(Xi−X‾)2m_2=\frac{1}{n} \sum_{i = 1}^{n}(X_i - \overline{X})^2m2​=n1​∑i=1n​(Xi​−X)2和样本的方差S2=1n−1∑i=1n(Xi−X‾)2S^2 = \frac{1}{n-1} \sum_{i=1}^{n}(X_i - \overline{X})^2S2=n−11​∑i=1n​(Xi​−X)2相差一个常数因子n−1n\frac{n-1}{n}nn−1​,即
m2=n−1nS2m_2 = \frac{n-1}{n}S^2 m2​=nn−1​S2
这就涉及到估计量的无偏性问题。


1.发现问题

首先我们假设总体分布的期望和方差分别为μ\muμ和σ2\sigma^2σ2
下面我们来看看问题所在。
首先我们假设S2S^2S2和m2m_2m2​一样为1n∑i=1n(Xi−X‾)2\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2n1​∑i=1n​(Xi​−X)2,那么有如下推导:
S2=1n∑i=1n(Xi−X‾)2=1n∑i=1n(Xi−μ+μ−X‾)2=1n∑i=1n[(Xi−μ)2+2(Xi−μ)(μ−X‾)+(μ−X‾)2]=1n∑i=1n(Xi−μ)2+2n∑i=1n(Xi−μ)(μ−X‾)+1n∑i=1n(μ−X‾)2=1n∑i=1n(Xi−μ)2+2n(μ−X‾)∑i=1n(Xi−μ)+1n∑i=1n(μ−X‾)2S^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i - \overline{X})^2 = \frac{1}{n} \sum_{i=1}^{n}(X_i - \mu + \mu - \overline{X})^2 \\ =\frac{1}{n} \sum_{i = 1}^{n}[(X_i - \mu)^2 + 2(X_i-\mu)(\mu-\overline{X}) + (\mu - \overline{X})^2] \\=\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}\sum_{i=1}^{n}(X_i-\mu)(\mu-\overline{X})+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\=\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}(\mu-\overline{X})\sum_{i=1}^{n}(X_i-\mu)+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2 S2=n1​i=1∑n​(Xi​−X)2=n1​i=1∑n​(Xi​−μ+μ−X)2=n1​i=1∑n​[(Xi​−μ)2+2(Xi​−μ)(μ−X)+(μ−X)2]=n1​i=1∑n​(Xi​−μ)2+n2​i=1∑n​(Xi​−μ)(μ−X)+n1​i=1∑n​(μ−X)2=n1​i=1∑n​(Xi​−μ)2+n2​(μ−X)i=1∑n​(Xi​−μ)+n1​i=1∑n​(μ−X)2
注意此时 ∵∑i=1nXi=∑i=1nX‾\because \sum_{i=1}^{n}X_i=\sum_{i=1}^{n}\overline{X}∵∑i=1n​Xi​=∑i=1n​X,∴\therefore∴ 继续推导有:
S2=1n∑i=1n(Xi−μ)2+2n(μ−X‾)∑i=1n(X‾−μ)+1n∑i=1n(μ−X‾)2=1n∑i=1n(Xi−μ)2−2n∑i=1n(μ−X‾)2+1n∑i=1n(μ−X‾)2=1n∑i=1n(Xi−μ)2−1n∑i=1n(μ−X‾)2=Var(Xi)−Var(X‾)=σ2−Var(X‾)S^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 + \frac{2}{n}(\mu-\overline{X})\sum_{i=1}^{n}(\overline{X}-\mu)+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2 \\ =\frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 - \frac{2}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2+\frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\ = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mu)^2 - \frac{1}{n}\sum_{i=1}^{n}(\mu-\overline{X})^2\\=Var(X_i)-Var(\overline{X})=\sigma^2 - Var(\overline{X}) S2=n1​i=1∑n​(Xi​−μ)2+n2​(μ−X)i=1∑n​(X−μ)+n1​i=1∑n​(μ−X)2=n1​i=1∑n​(Xi​−μ)2−n2​i=1∑n​(μ−X)2+n1​i=1∑n​(μ−X)2=n1​i=1∑n​(Xi​−μ)2−n1​i=1∑n​(μ−X)2=Var(Xi​)−Var(X)=σ2−Var(X)
再次打断,∵\because∵方差有如下性质:
1.若ccc常数,则Var(cX)=c2Var(X)Var(cX)=c^2Var(X)Var(cX)=c2Var(X)[推导很简单,不解释了]
2.Var(X1+X2+...+Xn)=Var(X1)+Var(X2)+...+Var(Xn)Var(X_1+X_2+...+X_n) = Var(X_1) + Var(X_2) +...+Var(X_n)Var(X1​+X2​+...+Xn​)=Var(X1​)+Var(X2​)+...+Var(Xn​)
且每个样本XiX_iXi​都可视为一个随机变量,其分布同于总体分布,因此其方差也同于总体方差
∴Var(X‾)=Var(1n∑i=1nXi)=1n2Var(∑i=1nXi)=1n2∑i=1nVar(Xi)=1n2⋅n⋅Var(Xi)=1nσ2\therefore Var(\overline{X})=Var(\frac{1}{n}\sum_{i=1}^{n}X_i)=\frac{1}{n^2}Var(\sum_{i=1}^{n}X_i)\\=\frac{1}{n^2}\sum_{i=1}^{n}Var(X_i)=\frac{1}{n^2}\cdot n\cdot Var(X_i) = \frac{1}{n}\sigma^2 ∴Var(X)=Var(n1​i=1∑n​Xi​)=n21​Var(i=1∑n​Xi​)=n21​i=1∑n​Var(Xi​)=n21​⋅n⋅Var(Xi​)=n1​σ2
∴\therefore∴ 继续推导有:
S2=σ2−Var(X‾)=σ2−1nσ2=n−1nσ2S^2=\sigma^2 - Var(\overline{X})=\sigma^2 - \frac{1}{n}\sigma^2=\frac{n-1}{n}\sigma^2 S2=σ2−Var(X)=σ2−n1​σ2=nn−1​σ2
至此就会发现用m2m_2m2​来估计σ2\sigma^2σ2是不准确的。


2.证明问题

okay,那么接下来我们需要证明样本方差S2=1n−1∑i=1n(Xi−X‾)2S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2S2=n−11​∑i=1n​(Xi​−X)2是总体分布方差σ2\sigma^2σ2的 无偏估计
∑i=1n(Xi−X‾)2=∑i=1n[(Xi−μ)−(X‾−μ)]2=∑i=1n(Xi−μ)2−2(X‾−μ)∑i=1n(Xi−μ)+∑i=1n(X‾−μ)2=∑i=1n(Xi−μ)2−2(X‾−μ)∑i=1n(Xi−μ)+n(X‾−μ)2\sum_{i=1}^{n}(X_i-\overline{X})^2=\sum_{i=1}^{n}[(X_i-\mu)-(\overline{X}-\mu)]^2\\=\sum_{i=1}^{n}(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^{n}(X_i - \mu)+\sum_{i=1}^{n}(\overline{X}-\mu)^2 \\=\sum_{i=1}^{n}(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^{n}(X_i - \mu)+n(\overline{X}-\mu)^2 i=1∑n​(Xi​−X)2=i=1∑n​[(Xi​−μ)−(X−μ)]2=i=1∑n​(Xi​−μ)2−2(X−μ)i=1∑n​(Xi​−μ)+i=1∑n​(X−μ)2=i=1∑n​(Xi​−μ)2−2(X−μ)i=1∑n​(Xi​−μ)+n(X−μ)2
注意此时 ∵∑i=1n(Xi−μ)=n(X‾−μ)\because \sum_{i=1}^{n}(X_i-\mu)=n(\overline{X}-\mu)∵∑i=1n​(Xi​−μ)=n(X−μ),∴\therefore∴继续有:
∑i=1n(Xi−X‾)2=∑i=1n(Xi−μ)2−2n(X‾−μ)2+n(X‾−μ)2=∑i=1n(Xi−μ)2−n(X‾−μ)2\sum_{i=1}^{n}(X_i-\overline{X})^2=\sum_{i=1}^{n}(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\\=\sum_{i=1}^{n}(X_i-\mu)^2-n(\overline{X}-\mu)^2 i=1∑n​(Xi​−X)2=i=1∑n​(Xi​−μ)2−2n(X−μ)2+n(X−μ)2=i=1∑n​(Xi​−μ)2−n(X−μ)2
∵\because∵ 样本均值是总体分布均值的无偏估计
∴E(Xi)=E(X‾)=μ\therefore E(X_i)=E(\overline{X})=\mu∴E(Xi​)=E(X)=μ

∴\therefore∴有:
E[∑i=1n(Xi−μ)2]=∑i=1nE(Xi−μ)2=∑i=1nVar(Xi)=nσ2E[n(X‾−μ)2]=nE(X‾−μ)2=nVar(X‾)=n⋅1n2∑i=1nVar(Xi)=n⋅nn2⋅σ2=σ2E[\sum_{i=1}^{n}(X_i-\mu)^2]=\sum_{i=1}^nE(X_i-\mu)^2=\sum_{i=1}^{n}Var(X_i)=n\sigma^2\\ E[n(\overline{X}-\mu)^2]=nE(\overline{X}-\mu)^2=nVar(\overline{X})=n\cdot \frac{1}{n^2}\sum_{i=1}^{n}Var(X_i)=n\cdot \frac{n}{n^2}\cdot \sigma^2\\=\sigma^2 E[i=1∑n​(Xi​−μ)2]=i=1∑n​E(Xi​−μ)2=i=1∑n​Var(Xi​)=nσ2E[n(X−μ)2]=nE(X−μ)2=nVar(X)=n⋅n21​i=1∑n​Var(Xi​)=n⋅n2n​⋅σ2=σ2
因此最终有:
E(S2)=1n−1E(∑i=1n(Xi−X‾)2)=1n−1E(∑i=1n(Xi−μ)2−n(X‾−μ)2)=1n−1(nσ2−σ2)=σ2E(S^2)=\frac{1}{n-1}E(\sum_{i=1}^{n}(X_i-\overline{X})^2)=\frac{1}{n-1}E(\sum_{i=1}^{n}(X_i-\mu)^2-n(\overline{X}-\mu)^2)\\=\frac{1}{n-1}(n\sigma^2-\sigma^2)=\sigma^2 E(S2)=n−11​E(i=1∑n​(Xi​−X)2)=n−11​E(i=1∑n​(Xi​−μ)2−n(X−μ)2)=n−11​(nσ2−σ2)=σ2
至此说明了样本方差S2=1n−1∑i=1n(Xi−X‾)2S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2S2=n−11​∑i=1n​(Xi​−X)2是总体分布方差σ2\sigma^2σ2的 无偏估计

为什么样本的方差和样本的二阶中心矩并不一样相关推荐

  1. python计算样本方差_Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算...

    使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算. variance: 方差 方差(Variance)是概率论中最基础的概念之一, ...

  2. python方差的计算公式_Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算...

    使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算. variance: 方差 方差(Variance)是概率论中最基础的概念之一, ...

  3. matlab求样本相关系数,matlab中样本相关系数的计算与测试

    1. 何谓相关系数? 此处只列出相关系数的公式: r=Cov(X,Y)σxσy=E(X−μx)(Y−μy)σxσy 更多内容请百度或者看概率论与数理统计方面的书. 文章的目的是测试一下如何使用这个公式 ...

  4. 目标检测中如何定义正负样本,和正负样本在学习过程中loss计算起的作用

    如何定义正负样本,和正负样本在学习过程中loss计算起的作用 正负样本定义 分类和回归head如何学习和利用划分后的正负样本(loss如何计算) 正负样本在分类中loss计算的处理 正样本在bbox ...

  5. Jupyter Notebook对数据集进行数据分析 数据统计(含:样本数量/样本长度/样本长度分布图/示例样本打印)

    以下内容可直接以写入.ipynb文件的形式,放入服务器上任意已准备好数据集的文件夹下: 导入模块 import os import json import re from collections im ...

  6. 如何在 R 中执行一个样本和两个样本 Z 检验

    您可以使用BSDA包中的z.test()函数在 R 中执行一个样本和两个样本 z 测试. 此函数使用以下基本语法: z.test(x, y, alternative=' two.sided ', mu ...

  7. 中心矩和原点矩_二阶原点矩与二阶中心矩。

    E表示求期望,5261X表示样本数据,则二4102阶原点矩就1653是E(X^2),二阶中专心距就是E((X-EX)^2). 均方属差是不是二阶原点矩,均方差也称标准差,二阶原点矩应该是方差才对,也就 ...

  8. python方差选择样本_两个样本方差比的分布(来自Python的实验)

    模拟结果图 按照两个样本方差比分布的理论推导可以得到 这里 为样本方差, 为总体方差. 这里将对这一结论进行基于Python的计算机模拟.代码如下. 1 生成两个总体,总体1服从正态分布 ,总体2服从 ...

  9. 样本总体方差有偏估计和无偏估计的理解

    学习概统的时候大家应该都知道有偏估计是 如果把x的均值换成确定的值u那么就是无偏的,原因后面说明 无偏估计是 是关于方差的无偏估计,那么为什么一个是/(n-1),为什么一个是/n呢 首先我们清楚几个公 ...

最新文章

  1. iOS开发-项目的完整重命名方法,图文教程。
  2. 探索.NET平台中的SIMD内在函数Vector
  3. react学习(39)----react中的Hello World
  4. SharePoint咨询师之路:设计之前的那些事四:负载均衡 - web服务器
  5. 《SQL高级应用和数据仓库基础(MySQL版)》学习笔记 ·011【视图和索引】
  6. Not enough space in file systems for the current software selection. An additional XXXX MiB is neede
  7. 怎样理解电脑评分_电脑可以理解我们的情绪吗?
  8. matlab 程序改写为 python 程序的方法
  9. d3开发Svg编辑器
  10. 控制台上跳极乐净土(完善动画版)
  11. 企业使用防伪税控开票子系统出现问题常见问题
  12. 家政维修小程序+上门预约小程序+VUE前后端分离+uniapp(附近师傅+门店入驻+在线抢单服务APP、小程序、公众号、H5)
  13. Linux多个小压缩文件合并一个压缩文件命令
  14. 为什么有网络微信却显示未连接服务器,设备公众号显示未连接,为什么公众号设备显示未连接?...
  15. java 多线程重温
  16. APDL电磁仿真学习中可能会遇到的问题1
  17. 2019年秋季校招前端面经
  18. 文件操作,函数练习及答案
  19. 引用类型属性自动注入-byName,byType,多个配置文件
  20. IDEA报错lombok.extern.slf4j is not exist不存在解决方案

热门文章

  1. [RK3288][Android5.1] 移植笔记 --- gsl3673 触控驱动
  2. html标签可以分为什么标签和什么标签,什么是HTML标签?HTML标签有什么作用?
  3. 百度聚合时,label文字隐藏问题
  4. #边学边记 必修4 高项:对事的管理 第5章 项目成本管理 之 项目成本预算
  5. Firefox的about:config设置详解
  6. 液晶电视怎么选才不花冤枉钱?整理液晶电视常用参数及选购技巧
  7. linux网络电视盒安装,网络电视盒怎么安装 网络电视盒安装步骤【详细介绍】...
  8. Advanced Installer 制作带升级功能的安装包
  9. 【SSH框架/国际物流商综平台】-01-分三期(仓储管理,货运全流程管理,决策分析)- 项目背景 界面原型 用例图 企业组织结构 功能模块图 系统框架 项目表单收集
  10. 基于android的远程视频监控系统