彻底理解样本方差为何除以n-1
设样本均值为,样本方差为
,总体均值为
,总体方差为
,那么样本方差
有如下公式:
很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。
无偏估计
以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为。如果你只是把
作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:
然后在把这些平均值,再做平均,记为:
,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值
,如果满足
,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,
就是
的一个取值。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。
介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:
那么,我们根据无偏估计的定义可得:
由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:
到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。
如果让我们假设的样本方差乘以
,即修正成如下形式,是不是可以得到样本方差是总体方差
的无偏估计呢?
则:
因此修正之后的样本方差的期望是总体方差的一个无偏估计,这就是为什么分母为何要除以n-1。
彻底理解样本方差为何除以n-1相关推荐
- 笔记-彻底理解样本方差为何除以n-1
对,https://blog.csdn.net/Hearthougan/article/details/77859173,的划重点,以及解读: 原文非常优秀,以下内容是我的重新理解,包含大量原文直接摘 ...
- 【数学基础】无偏估计——为何样本方差需要除以(n-1)?
[fishing-pan:https://blog.csdn.net/u013921430 转载请注明出处] 相信在学习数理统计过程中,肯定很多人会下面这样的疑问 为什么样本方差是除以(n ...
- 总体样本方差的无偏估计样本方差为什么除以n-1
1)基本概念 我们先从最基本的一些概念入手. 如下图,脑子里要浮现出总体样本,还有一系列随机选取的样本.只要是样本,脑子里就要浮现出它的集合属性,它不是单个个体,而是一堆随机个体集合.样本是总体样本中 ...
- 样本方差为何除以n-1而不是n?
很多人可能都会有疑问,为什么要除以n-1,而不是n. 如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1. 那么问题来了,为什么不是除以n-2.n-3 ...
- 样本方差为何除以n-1
设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式: 很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估 ...
- 样本方差公式为什么除以的是n-1
本文是依照<彻底理解样本方差为何除以n-1>一文进行学习而做的学习笔记,是在学习前面一文的基础上,对某些步骤添加了一些自己的理解,如果有什么不对的地方还请各位道友多多指正哈!当然以后要是突 ...
- 样本方差分母为什么是n-1?——无偏估计
文章目录 1 总体方差和样本方差 2 方差的无偏估计 3 从自由度角度理解样本方差为什么除以n−1n-1n−1? 1 总体方差和样本方差 首先要分清总体和样本: 总体:研究对象的整个群体 比如总共10 ...
- 总体方差与样本方差分母的小小区别,n还是n-1?
总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...
- python sklearn.decomposition.PCA 主成分分析, 原理详解
引用文章1: 主成分分析(PCA)原理详解 https://blog.csdn.net/program_developer/article/details/80632779 引用文章2: 彻底理解样本 ...
- Excel 2010 SQL应用096 聚合函数之标准偏差及标准差
目录 源数据表 解决方案 STDEV函数及STDEVP函数的使用 彻底理解样本方差为何除以n-1 源数据表 货品 发货点 送货目的地 货运运费 汽车配件 广州 上海 300 葡萄酒 广 ...
最新文章
- Leetcode python《热题 HOT 100》1. 两数之和
- when is SAP UI5 url hash changed in browser
- QC安装与运行中的问题汇集
- Day12-date time
- 使用yum安装CDH Hadoop集群
- itchat python_itchat-python搭建微信机器人(附示例)
- 拓端tecdat|Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析
- IE8 SVG Viewer下一些对象属性和方法
- 计算机boot指令,计算机基本知识(8001)---MBR(master boot record)主引导记录
- 大厂P5、P6、P7级程序员的简历长什么样?
- ipa包脱壳、解析、info.plist文件基本信息介绍
- 大数据时代下的小公益
- 从SUMSUNG闪存芯片编号识容量
- Unity EasyAR Coloring3D AR绘图原理
- 一文彻底搞懂执行上下文、VO、AO、Scope、[[scope]]、作用域链、闭包
- easyExcel 实现不同对象写入到同一个sheet中
- Google play ASO 关键字指南
- win7安装Edge提示“无法连接到Internet。如果使用防火墙,请将MicrosoftEdgeUpdate.exe加入允许列表中“
- 公路养护管理:高速公路养护施工安全管理探析
- Android实现收款成功金额的语音播报功能(Nice tone)
热门文章
- Nginx编译安装云锁
- php网站微博帐号登录代码,redis+php实现微博(一)注册与登录功能详解
- 腾讯云PCDN:从P2P到万物互联服务框架
- oracle数据库的使用
- 如何破解XP开机密码
- python中stop_thread_Python threading.Thread只能用私有方法self来停止.__ Thread_stop()
- 0527基于51单片机的防酒驾检测系统设计Proteus仿真
- 只有程序员能看懂的西游记
- DFD数据流图的基本要素及易错点详细介绍
- UBUNTU快速回到桌面