样本方差为什么要除n-1，而不是n

首先我们来看看方差的计算公式：S2=1n−1∑ni=1(Xi−X¯¯¯¯)2S2=1n−1∑i=1n(Xi−X¯)2S^2=\dfrac{1}{n-1}\sum_{i=1}^{n}(X_i-\overline{X})^2
其中：X¯¯¯¯=1n∑ni=1XiX¯=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum_{i=1}^{n}X_i 为均值
由均值的计算公式知，一旦计算了平均值，n个变量就是不再独立了，都与均值产生了联系，也就是说在n个随机变量XiXiX_i 中只要知道了其中的任意n-1个及均值X¯¯¯¯X¯\overline{X} 就能求出另外一个，故能自由地取值的随机变量只有n-1个。所以在用均值计算方差时，能自由变化的随机变量只有n-1个，所以方差要除是n-1。
举个例子，X1=2，X2=4，X3=6X1=2，X2=4，X3=6X_1=2，X_2=4，X_3=6 ，均值X¯¯¯¯=4X¯=4\overline{X}=4，只要知道了X¯¯¯¯X¯\overline{X}和X1,X2X1,X2X_1,X_2，X3=3×X¯¯¯¯−X1−X2X3=3×X¯−X1−X2X_3=3\times\overline{X}-X_1-X_2 ，就能计算出来，也就是说X3X3X_3不能自由地取值了。

我们希望样本方差的期望是总体的方差(σ2σ2\sigma^2)，如果把自由度设为n会有什么后果？证明一下。

E(S2)=E(1n∑ni=1(Xi−X¯¯¯¯)2))=E(1n∑ni=1((Xi−μ)−(X¯¯¯¯−μ))2)=E(1n∑ni=1((Xi−μ)2−2(Xi−μ)(X¯¯¯¯−μ)+(X¯¯¯¯−μ)2))=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)∑ni=1(Xi−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×(∑ni=1Xi−nμ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×n×(1n∑ni=1Xi−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−2n(X¯¯¯¯−μ)×n×(X¯¯¯¯−μ)+(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2)−(X¯¯¯¯−μ)2)=E((1n∑ni=1(Xi−μ)2))−E((X¯¯¯¯−μ)2))=σ2−E((1n(∑ni=1Xi−nμ))2)=σ2−E((1n(∑ni=1Xi−nμ))2)=σ2−E((1n(∑ni=1(Xi−μ))2)=σ2−1nE(1n(∑ni=1(Xi−μ))2)=σ2−1nσ2=(1−1n)σ2=(n−1n)σ2<σ2E(S2)=E(1n∑i=1n(Xi−X¯)2))=E(1n∑i=1n((Xi−μ)−(X¯−μ))2)=E(1n∑i=1n((Xi−μ)2−2(Xi−μ)(X¯−μ)+(X¯−μ)2))=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)∑i=1n(Xi−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×(∑i=1nXi−nμ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×n×(1n∑i=1nXi−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−2n(X¯−μ)×n×(X¯−μ)+(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2)−(X¯−μ)2)=E((1n∑i=1n(Xi−μ)2))−E((X¯−μ)2))=σ2−E((1n(∑i=1nXi−nμ))2)=σ2−E((1n(∑i=1nXi−nμ))2)=σ2−E((1n(∑i=1n(Xi−μ))2)=σ2−1nE(1n(∑i=1n(Xi−μ))2)=σ2−1nσ2=(1−1n)σ2=(n−1n)σ2<σ2

\begin{array}{ll} E(S^2)&=E(\dfrac{1}{n}\sum_{i=1}^{n}(X_i-\overline{X})^2))\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)-( \overline{X}- \mu))^2)\\&=E(\dfrac{1}{n}\sum_{i=1}^{n}((X_i-\mu)^2-2(X_i-\mu)( \overline{X}- \mu)+(\overline{X}-\mu)^2))\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times(\sum_{i=1}^n X_i-n\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\dfrac{1}{n}\sum_{i=1}^n X_i-\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-\dfrac{2}{n}(\overline{X}-\mu)\times n \times (\overline{X} -\mu)+(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2)-(\overline{X}-\mu)^2)\\&=E((\dfrac{1}{n}\sum_{i=1}^n(X_i-\mu)^2))-E((\overline{X}-\mu)^2))\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n X_i-n\mu))^2)\\&=\sigma^2-E((\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}E(\dfrac{1}{n}(\sum_{i=1}^n (X_i-\mu))^2)\\&=\sigma^2-\dfrac{1}{n}\sigma^2=(1-\dfrac{1}{n})\sigma^2=(\dfrac{n-1}{n})\sigma^2 \lt \sigma^2 \end{array}

以上推导说明如果除的是n那么得到的方差总比总体的方差小那么一点点。

下面我们作一点点修正：

E(S2)=(n−1n)σ2E(S2)=(n−1n)σ2

\begin{array}{ll}E(S^2)&=(\dfrac{n-1}{n})\sigma^2\end{array}
在式子的两边乘上 nn−1nn−1\dfrac{n}{n-1} 得：

nn−1E(S2)=nn−1(n−1n)σ2=σ2nn−1E(S2)=nn−1(n−1n)σ2=σ2

\dfrac{n}{n-1}E(S^2)=\dfrac{n}{n-1}(\dfrac{n-1}{n})\sigma^2=\sigma^2
即：

nn−1E(S2)=σ2E(nn−1S2)=σ2E(nn−11n∑i=1n(Xi−X¯¯¯¯))=σ2E(1n−1∑i=1n(Xi−X¯¯¯¯))=σ2nn−1E(S2)=σ2E(nn−1S2)=σ2E(nn−11n∑i=1n(Xi−X¯))=σ2E(1n−1∑i=1n(Xi−X¯))=σ2

\dfrac{n}{n-1}E(S^2)=\sigma^2\\E(\dfrac{n}{n-1}S^2)=\sigma^2\\E(\dfrac{n}{n-1}\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\E(\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}))=\sigma^2\\

所以1n−1∑ni=1(Xi−X¯¯¯¯)1n−1∑i=1n(Xi−X¯)\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X}) 是总体方差的无偏估计量，而不能使用1n∑ni=1(Xi−X¯¯¯¯)1n∑i=1n(Xi−X¯)\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline{X})。

样本方差为什么要除n-1，而不是n相关推荐

为什么样本方差公式中要除以n-1而不是n
定义在学习概率与数理统计时,期望和方差是两个比较重要的概念,教材上给出的期望与方差的定义一般为: 期望: (1)离散型随机变量的数学期望: 设离散型随机变量X的分布律为: ...
为什么样本方差里面要除以（n-1）而不是n？
前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...
总体方差与样本方差分母的小小区别，n还是n-1？
总体方差与样本方差分母的小小区别,n还是n-1? 引入方差概念方差计算无偏估计样本方差公式相关参考链接样本方差的自由度是n-1 引入方差概念方差是在概率论和统计方差衡量随机变量或一组数 ...
统计学---之样本方差与总体方差的区别
前段日子重新整理了一下这个问题的解答,跟大家分享一下,如果有什么错误的话希望大家能够提出来,我会及时改正的,话不多说进入正题: 首先,我们来看一下样本方差的计算公式: 刚开始接触这个公式的话可能会有一 ...
为什么对高斯分布的方差的极大似然估计是有偏的？
本文要证明为什么对高斯分布的方差的极大似然估计是有偏的.同时,也说明为什么求样本方差时,分母是N-1而不是N. 首先,明白两点,(1)极大似然法得到的高斯方差是什么形式(2)什么是有偏. (1)先说第 ...
3.1 参数估计：矩估计方法
3.1 矩估计方法假设我们知道某个随机变量满足高斯分布,但不知道高斯分布的两个参数 μ,σ2\mu,\sigma^2μ,σ2 ,怎么估计这些参数呢,这就是参数估计要解决的问题.实践中经常遇到这种问题 ...
样本方差为何除以n-1而不是n？
很多人可能都会有疑问,为什么要除以n-1,而不是n. 如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1. 那么问题来了,为什么不是除以n-2.n-3 ...
样本方差除以n-1而不是n的原因
https://www.zybang.com/question/8c665fa06a6e40990e9f5f59421ebec9.html
【数学基础】无偏估计——为何样本方差需要除以（n-1）？
[fishing-pan:https://blog.csdn.net/u013921430 转载请注明出处] 相信在学习数理统计过程中,肯定很多人会下面这样的疑问为什么样本方差是除以(n ...

样本方差为什么要除n-1，而不是n

样本方差为什么要除n-1，而不是n相关推荐

最新文章

热门文章