为什么样本方差的分母是 n-1
为什么样本方差的分母是 n-1
按照方差的定义,直观上我们可能会这样子计算方差:
但是,在所有的书中,都将方差的计算公式定义为:
为什么是除以n-1
而不是n
呢?这就是这里要讨论的问题。
1、除n-1会带来什么问题
或许答案你已经知道了:为了保证方差估计的无偏性,我们通常要除以
n-1
,而不是n
.如果是除以n
,会使得估计的方差比实际方差要小。这是为什么呢?我们下面就来讨论讨论
1.1 现实生活中面临的问题
加入我们要调查全国人民的收入水平,并且已经知道了全国人民的平均收入水平问(别问我为什么知道的,上帝告诉我的)。这时我们对总体进行抽样,记每个样本问,根据的定义,我们可以得到全国人民收入水平的方差为:
但问题是,现实生活中,是无法确定的(你不可能调查到所有人的收入水平)。这时候,我们就会用样本的均值去代替。但是!
如果直接使用作为方差的估计,那么计算出来的结果会低于实际的方差!
这是因为:
换言之,除非正好,否则我们一定有
而不等式右边的那位才是的对方差的“正确”估计! 这个不等式说明了,为什么直接使用会导致对方差的低估。
我们通过一个gif来看一下,和的实际偏差越大,对估计的影响就越大!
1.2 如何解决这个问题
那么,在不知道随机变量真实数学期望的前提下,如何“正确”的估计方差呢?答案是把上式中的分母,通过这种方法把原来的偏小的估计“放大”一点点,我们就能获得对方差的正确估计了:
至于为什么分母是n-1
而不是n-2
或者别的什么数呢?这就是我们接下来要证明的事情。
2、调整分母 得到无偏估计
设为我们估计的方差,则
其中:
所以我们接着算下去:
其中(证明见:这里):
所以:
也就是说,低估了 ,进行一下调整:
因此使用下面这个式子进行估计,得到的就是无偏估计:
转载于:https://juejin.im/post/5b9a0313e51d453eb93d3511
为什么样本方差的分母是 n-1相关推荐
- python计算标准差为什么分母要-1_为什么样本方差的分母是除以n-1
样本方差的分母 随机变量的方差描述的是变量的离散程度,$$\text{Var}(X)=E[(X-\mu)^2]=E[{1\over n}\sum_{i=1}^n (X_i-\mu)2]=\sigma2 ...
- 样本方差公式推导--为什么样本方差的分母是n-1
概要 因为使用n作为分母会导致方差被低估,将分母替换为n-1可以保证样本方差是一种无偏估计 理想情况 首先,我们假定随机变量 X X X的数学期望 μ \mu μ是已知的,然而方差 σ 2 {{\si ...
- 总体方差与样本方差分母的小小区别,n还是n-1?
总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...
- 自由度(为什么样本方差自由度是n-1)
一 概念.条件及目的 概念 要理解样本方差的自由度为什么是n-1,得先理解自由度的概念: 自由度,是指附加给独立的观测值的约束或限制的个数,即一组数据中可以自由取值的个数. 成立条件 所谓自由取值,是 ...
- 统计学基础之样本方差和总体方差
统计学基础之样本方差与总体方差 文章目录 统计学基础之样本方差与总体方差 1. 方差(variance)的定义 2. 样本方差 3. 总体方差公式的有偏性证明 4. 样本方差公式分母为n-1的推导 参 ...
- 【机器学习】主元分析(PCA)以及与SVD的区别联系
参考文章:如何理解主元分析(PCA)? 主元分析的目的是降低数据的维度.主元分析也就是PCA,主要用于数据降维. 1 什么是降维? 比如说有如下的房价数据: 这种一维数据可以直接放在实数轴上: 不过数 ...
- matlab var std,Matlab var std cov 函数解析
在Matlab中使用var求样本方差,使用std求标准差! 首先来了解一下方差公式: p = [-0.92 0.73 -0.47 0.74 0.29; -0.08 0.86 -0.67 -0.52 0 ...
- 数学基础(二)——参数估计与矩阵运算基础
参数估计与矩阵运算基础 ps: 个人笔记 根据视频和PDF学习 1 期望 离散型: 连续型: 即:概率加权下的"平均值" 期望的性质 无条件成立 若X和Y相互独立 反之不成立.事实 ...
- matlab求样本相关系数,matlab中样本相关系数的计算与测试
1. 何谓相关系数? 此处只列出相关系数的公式: r=Cov(X,Y)σxσy=E(X−μx)(Y−μy)σxσy 更多内容请百度或者看概率论与数理统计方面的书. 文章的目的是测试一下如何使用这个公式 ...
最新文章
- 利用三层交换机实现VLAN的通信实验报告
- CountDownLatch 的使用小例
- bootstranp选项卡怎么把每个选项卡里面的表单分开提交_EXCEL 宏应用基础知识,利用已实现的宏,制作自己的功能选项卡...
- VC中使用Unicode的一些列问题
- cf552 G Minimum Possible LCMn个数,求最小得一对lcm
- 数字图像处理:第一章 概述
- 台式电脑不拉网线上网_在家里想不拉宽带用无线上网,试试这几招?
- 速卖通新手入驻必须了解的“9大知识点”
- java jxl之Excel的创建
- 美赛整理之理想直流伺服电机的simulink仿真优化
- Linux从入门到精通——数据库
- 23 android多线程
- Java之String,StringBuffer,StringBuilder比较
- Visual Studio 2013无法打开IIS Express Web的解决办法
- 带音效的计算机软件,普通电脑WIN7上安装杜比音效增强软件Dolby Home TheaterV4教程...
- 黑苹果英特尔板载网卡驱动 IntelMausiEthernet.kext 2.5.0
- 取手机号码php正则表达式,PHP获取手机号码的正则表达式写法
- 单片机通信接口:UART、I2C、SPI、TTL、RS232、RS422、RS485、CAN、USB
- 卡尔曼滤波-卡尔曼滤波全篇讲解
- 苹果手机设置导入喜欢的音乐作为铃声