样本方差为什么要除n-1,而不是n
首先我们来看看方差的计算公式:S2=1n−1∑ni=1(Xi−X¯¯¯¯)2S2=1n−1∑i=1n(Xi−X¯)2S^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2
其中:X¯¯¯¯=1n∑ni=1XiX¯=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum_{i=1}^{n}X_i 为均值
由均值的计算公式知,一旦计算了平均值,n个变量就是不再独立了,都与均值产生了联系,也就是说在n个随机变量XiXiX_i 中只要知道了其中的任意n-1个及均值X¯¯¯¯X¯\overline{X} 就能求出另外一个,故能自由地取值的随机变量只有n-1个。所以在用均值计算方差时,能自由变化的随机变量只有n-1个,所以方差要除是n-1。
举个例子,X1=2,X2=4,X3=6X1=2,X2=4,X3=6X_1=2,X_2=4,X_3=6 ,均值X¯¯¯¯=4X¯=4\overline{X}=4,只要知道了X¯¯¯¯X¯\overline{X}和X1,X2X1,X2X_1,X_2,X3=3×X¯¯¯¯−X1−X2X3=3×X¯−X1−X2X_3=3\times\overline{X}-X_1-X_2 ,就能计算出来,也就是说X3X3X_3不能自由地取值了。
我们希望样本方差的期望是总体的方差(σ2σ2\sigma^2),如果把自由度设为n会有什么后果?证明一下。
\begin{array}{ll} E(S^2)&=E(\dfrac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2))\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)-( \overline{X}- \mu))^2)\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)^2-2(X_i-\mu)( \overline{X}- \mu)+(\overline{X}-\mu)^2))\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times(\sum_{i=1}^n X_i-n\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\dfrac{1}{n}\sum_{i=1}^n X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\overline{X} -\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2))-E((\overline{X}-\mu)^2))\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}E(\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}\sigma^2=(1-\dfrac{1}{n})\sigma^2=(\dfrac{n-1}{n})\sigma^2 \lt \sigma^2 \end{array}
以上推导说明如果除的是n那么得到的方差总比总体的方差小那么一点点。
下面我们作一点点修正:
\begin{array}{ll}E(S^2)&=(\dfrac{n-1}{n})\sigma^2\end{array}
在式子的两边乘上 nn−1nn−1\dfrac{n}{n-1} 得:
\dfrac{n}{n-1}E(S^2)=\dfrac{n}{n-1}(\dfrac{n-1}{n})\sigma^2=\sigma^2
即:
\dfrac{n}{n-1}E(S^2)=\sigma^2\\E(\dfrac{n}{n-1}S^2)=\sigma^2\\E(\dfrac{n}{n-1}\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\E(\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\
所以1n−1∑ni=1(Xi−X¯¯¯¯)1n−1∑i=1n(Xi−X¯)\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}) 是总体方差的无偏估计量,而不能使用1n∑ni=1(Xi−X¯¯¯¯)1n∑i=1n(Xi−X¯)\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X})。
样本方差为什么要除n-1,而不是n相关推荐
- 为什么样本方差公式中要除以n-1而不是n
定义 在学习概率与数理统计时,期望和方差是两个比较重要的概念,教材上给出的期望与方差的定义一般为: 期望: (1)离散型随机变量的数学期望: 设离散型随机变量X的分布律为: ...
- 为什么样本方差里面要除以(n-1)而不是n?
前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...
- 总体方差与样本方差分母的小小区别,n还是n-1?
总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...
- 统计学---之样本方差与总体方差的区别
前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...
- 为什么对高斯分布的方差的极大似然估计是有偏的?
本文要证明为什么对高斯分布的方差的极大似然估计是有偏的.同时,也说明为什么求样本方差时,分母是N-1而不是N. 首先,明白两点,(1)极大似然法得到的高斯方差是什么形式(2)什么是有偏. (1)先说第 ...
- 3.1 参数估计:矩估计方法
3.1 矩估计方法 假设我们知道某个随机变量满足高斯分布,但不知道高斯分布的两个参数 μ,σ2\mu,\sigma^2μ,σ2 ,怎么估计这些参数呢,这就是参数估计要解决的问题.实践中经常遇到这种问题 ...
- 样本方差为何除以n-1而不是n?
很多人可能都会有疑问,为什么要除以n-1,而不是n. 如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1. 那么问题来了,为什么不是除以n-2.n-3 ...
- 样本方差除以n-1而不是n的原因
https://www.zybang.com/question/8c665fa06a6e40990e9f5f59421ebec9.html
- 【数学基础】无偏估计——为何样本方差需要除以(n-1)?
[fishing-pan:https://blog.csdn.net/u013921430 转载请注明出处] 相信在学习数理统计过程中,肯定很多人会下面这样的疑问 为什么样本方差是除以(n ...
最新文章
- RabbitMQ 入门系列(3)— 生产者消费者 Python 代码实现
- Face Recognition for the Happy House-v3
- numpy 深复制 切片创建视图
- 在Windows下安装labelImg
- 多台Linux服务器SSH相互访问无需密码--转
- ITK:计算PCA形状模型
- SAP CRM Interactive Report(交互式报表)里和服务订单相关的一些字段
- .NET Core实战项目之CMS 第三章 入门篇-源码解析配置文件及依赖注入
- centos8安装中文(zh_CN)语言包
- 使用数据库镜像保障高可用的数据库应用(下)
- python编程入门书籍-编程小白的第一本 Python 入门书
- @SuppressLint(HandlerLeak),或Handler使用有警告;
- 【相机标定系列】相机成像的理想模型原理,相机矩阵分解
- 记Thinkpad的一次扩容升级经历
- 数据库数据迁移的3种方案学习
- 计算机的运行英文表示,电脑一些英文表示什么格式
- 选择合适的垃圾收集器
- 轻松解决 f2pool鱼池ethermine连接失败antpool矿池连接不上的问题E池连接超时
- HTML的基本结构及基本标签
- DBSCAN原理及matlab仿真代码