设样本均值为,样本方差为,总体均值为,总体方差为,那么样本方差有如下公式:、

很多人可能都会有疑问,为什么要除以n-1,而不是n,但是翻阅资料,发现很多都是交代到,如果除以n,对样本方差的估计不是无偏估计,比总体方差要小,要想是无偏估计就要调小分母,所以除以n-1,那么问题来了,为什么不是除以n-2、n-3等等。所以在这里彻底总结一下,首先交代一下无偏估计。

无偏估计

以例子来说明,假如你想知道一所大学里学生的平均身高是多少,一个大学好几万人,全部统计有点不现实,但是你可以先随机挑选100个人,统计他们的身高,然后计算出他们的平均值,记为。如果你只是把作为整体的身高平均值,误差肯定很大,因为你再随机挑选出100个人,身高平均值很可能就跟刚才计算的不同,为了使得统计结果更加精确,你需要多抽取几次,然后分别计算出他们的平均值,分别记为:然后在把这些平均值,再做平均,记为:,这样的结果肯定比只计算一次更加精确,随着重复抽取的次数增多,这个期望值会越来越接近总体均值,如果满足,这就是一个无偏估计,其中统计的样本均值也是一个随机变量,就是的一个取值。无偏估计的意义是:在多次重复下,它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是,我们计算的样本方差,希望它是总体方差的一个无偏估计,那么假如我们的样本方差是如下形式:

那么,我们根据无偏估计的定义可得:

由上式可以看出如果除以n,那么样本方差比总体方差的值偏小,那么该怎么修正,使得样本方差式总体方差的无偏估计呢?我们接着上式继续化简:

到这里得到如下式子,看到了什么?该怎修正似乎有点眉目。

如果让我们假设的样本方差乘以,即修正成如下形式,是不是可以得到样本方差是总体方差的无偏估计呢?

则:

因此修正之后的样本方差的期望是总体方差的一个无偏估计,这就是为什么分母为何要除以n-1。


https://blog.csdn.net/hearthougan/article/details/77859173

转载于:https://www.cnblogs.com/huiAlex/p/8960778.html

无偏方差为什么除以n-1相关推荐

  1. 样本方差与总体方差的区别

    为什么80%的码农都做不了架构师?>>>    之前一直对于样本方差与总体方差的概念区分不清,对于前者不仅多了"样本"两个字,而且公式中除数是N-1,而不是N.现 ...

  2. pandas金融数据处理

    51.使用绝对路径读取本地Excel数据 import numpy as np import pandas as pddata = pd.read_excel('/Users/baji/Desktop ...

  3. Batch Normalization详细解读

    这篇文章是论文 Batch Normalization Accelerating Deep Network Training by Reducing Internal Covariate Shift ...

  4. 总体方差与样本方差分母的小小区别,n还是n-1?

    总体方差与样本方差分母的小小区别,n还是n-1? 引入 方差概念 方差计算 无偏估计 样本方差公式 相关参考链接 样本方差的自由度是n-1 引入 方差概念 方差是在概率论和统计方差衡量随机变量或一组数 ...

  5. 【推荐收藏】3.5万字图解Pandas

    文章目录 第一部分:Pandas 展示 技术提升 1. 排序 2.按多列排序 3. 添加一列 4. 快速元素搜索 5. 按列连接(join) 6.按列分组 7. 数据透视表 8.Pandas速度 第二 ...

  6. “方差”和梯度下降算法

    目录 一 平方差(difference of two squares) 二 方差(variance/deviation Var) 三 标准差(Standard Deviation) 四 均方误差(MS ...

  7. 笔记本 - 数据分析百宝箱

    Numpy 一.基本操作: 属性: improt numpy as np 生成数组: array=np.array([[1,2,3],[2,3,4]],dtype=np.int/float) arra ...

  8. 论文阅读Batch Normalization: Accelerating Deep Network Training byReducing Internal Covariate Shift

    论文阅读Batch Normalization: Accelerating Deep Network Training byReducing Internal Covariate Shift 全文翻译 ...

  9. 『统计学』第二部分:中心极限定理及其应用

    『中心极限定理』 首先,我们来探讨下什么是中心极限定理? 有时候统计概率就像魔术一样,能够从少量数据中得出不可思议的强大结论.我们只需要对1000个美国人进行电话调查,就能去预测美国总统大选的得票数. ...

最新文章

  1. AI一分钟 | 吴恩达和中联重科合作,进军智慧农业;百度Q2营收260亿元,净利润64亿...
  2. 中文速读微生物组(宏基因组)前沿文献——这个可以有
  3. Mac OS 如何连接windows 文件共享
  4. 【SQL】表A多个字段,关联表B一个字段说明
  5. JMS学习(1):MS基本概念
  6. 计算机应用技术编译原理考试题,《编译原理》练习题库含答案(大学期末复习资料).doc...
  7. android 代码添加图片不显示,Android开发 从代码里设置Drawable图片不显示的问题
  8. 数据太少怎么办?试试自监督学习,CV训练新利器,fast.ai新教程,LeCun点评
  9. JavaScript学习(四十四)—in关键字的使用和for in循环遍历对象的属性
  10. 普通函数被类引用为友元函数
  11. Python 的类的下划线命名有什么不同?
  12. 汽车汽配行业DMS渠道商系统精准掌握渠道库存,提升市场响应能力
  13. java jsp实验设计心得_jsp课程设计心得_课程设计总结心得
  14. tf卡量产工具万能版_「新物」1TB TF卡正式开卖!容量大得惊人,售价也同样不菲...
  15. 企业微信给微信好友定时发送图文并茂的消息
  16. 大三学生HTML期末作业,网页制作作业——HTML+CSS+JavaScript饮品饮料茶(7页)
  17. C语言多文件编程详解
  18. 数字化模型是工业PaaS平台的核心
  19. WinServer 2019 组策略开启远程桌面(增改)
  20. python怎么打印字典_Python中的字典

热门文章

  1. Overload Overwrite Override
  2. 零基础Java学习之构造器
  3. Python_note2 基本图形绘制+turtle库使用
  4. IBM 2019-2020数据科学校招
  5. IIS部署ASP.Net Core 502.5错误和解决
  6. dubbo+zookeeper坑坑坑
  7. Base64编码问题( Convert.ToBase64String)问题
  8. 【c++】【转】如何只在heap上创建对象,如何只在stack上建立对象?
  9. 优秀学生是如何高效利用时间的?
  10. 实例讲解如何把表格变量传递到存储过程中