很多人其实忘记了样本标准差的目的是干什么用的,我对复杂的数学公式证明不感兴趣(反正书上有),下面我聊下这背后的原因。

首先,方差的开方是标准差,我更喜欢经常用标准差,原因见这里:猴子:有了方差为什么需要标准差?

1.样本标准差为什么除以n-1

当你选择一个样本后,相比总体,你拥有数据的数量是变少了,因此,与总体中的数值偏离平均值的程度相比,样本中很有可能把较为极端的数值排除在外,这样使得数值更有可能以更紧密的方式聚集在均值周围。

也就是说,样本的标准差要小于总体标准差。

所以,为了更好的用样本估计总体的标准差,统计学家就将标准差的公式做了改造:即原来的标准差公式是除以n,为了用样本估计总体标准差,现在是除以n-1。这样就使得标准差略大。弥补了样本的标准差小于总体标准差的不足。

所以很多书上会直接把除以n-1的标准差叫做样本标准,其实这个样本标准差的目的是用于估计总体标准差。

2.你可能会疑惑,那我什么时候标准差除以n还是n-1呢?

其实,这个问题我的一个社群会员@胡小白 也问过这个问题:

只要你记住使用标准差的目的是什么,就不会搞错了。

如果你只是想计算一个数据集的标准差,那么就除以n。例如你有100个毕业与清华人的收入,只是想了解这100个人构成的数据集的波动大小,那你就用除以n的标准差公式。

如果你想用样本来估计总体的标准差,那就用除以n-1的标准差公式。例如你想把刚才例子中这100个人当成一个样本,用这个样本来估计出总体(所有毕业与清华人的收入)的标准差,那么就除以n-1的标准差公式。

3. @问儿 留言提出一个很好的问题:

python计算标准差为什么分母要-1_为什么样本方差(sample variance)的分母是 n-1?...相关推荐

  1. python计算标准差为什么分母要-1_为什么样本方差的分母是除以n-1

    样本方差的分母 随机变量的方差描述的是变量的离散程度,$$\text{Var}(X)=E[(X-\mu)^2]=E[{1\over n}\sum_{i=1}^n (X_i-\mu)2]=\sigma2 ...

  2. Python计算标准差和方差

    例题:计算下面数据的标准差和方差 86,87,88,86,87,85,86 import numpy as np a=[86,87,88,86,87,85,86] std=np.std(a)#标准差 ...

  3. python计算标准差函数_Python pandas,pandas常用统计方法,求和sum,均值mean,最大值max,中位数median,标准差std...

    mean()平均值   median()中位数   max()最大值   min()最小值   sum()求和   std()标准差 Series类型独有的方法: argmax()最大值的位置   a ...

  4. python 计算标准差和平均值

    直接上代码,要用就拿去 最近问这种平均值和标准差怎么算的人好多啊,我打算直接把代码放在这里了. 记得改个变量名称,不然被发现就完了. from math import sqrt def getnum( ...

  5. 计算标准差分母是n还是n-1?

    概述 提问:在我们计算某些数据标准差(或者方差)的时候,会发现有些公式分母是n,而有些公式的分母却是(n-1),那么到底哪个公式才是正确的呢? 答案: 如果是算总体的标准偏差,分母就用n,这就是真实的 ...

  6. python计算excel平均值_python计算excel平均值和标准差

    ############################################## ######## python计算excel平均值和标准差 ####### ############### ...

  7. 怎么用python编写程序计算标准差_自学生信Python(第五天)|如何计算标准差?...

    如何计算标准差? 本人是一枚生物学的学生,由于对生物信息学特别感兴趣,于是想自学生物信息学(新手莫怪).了解到生物信息学要有编程基础,尤其是要会一门编程语言,例如:R语言.Python.Perl等,还 ...

  8. python计算excel数据_python计算excel平均值和标准差

    ############################################## ######## python计算excel平均值和标准差 ####### ############### ...

  9. python 计算平均值、中位数、标准差

    python计算平均值.中位数.标准差(通过导入原有txt文件中的数组) 运行截图: 代码: def getdata(filename): #导入原有txt文件中的数组with open(filena ...

  10. python计算平均数、中位数及标准差

    哈喽,大家好呀,下面是我整理的python计算平均数.中位数和标准差的方法,咱们一起学习,共同进步! 1.计算平均数 方法① lst=[1,2,3,4,5]                 #首先定义 ...

最新文章

  1. System.Web.Caching.Cache类 缓存 各种缓存依赖
  2. 07.GitHub实战系列~7.Git之VS2013团队开发(如果不想了解git命令直接学这篇即可)...
  3. 大学计算机专业选哪个,这么多大学都有计算机专业 究竟选哪个好呢?
  4. Linux centos 集群下ssh无密码
  5. linux ntp时间立即同步命令_记一次生产环境部署NTP服务及配置时间同步
  6. db2 存储过程异常处理
  7. django url 中的namespace详解
  8. L1、L2正则化区别和数学原理,以及什么是Elastic Net(弹性网络)正则项
  9. ES6 let 与 const 与 var 的区别与使用
  10. 数据库学生管理系统课程设计
  11. 苹果电脑装双系统利弊有哪些
  12. word中插入常用几种公式编辑器
  13. selector wakeup
  14. BFS——骑士的拯救行动
  15. Pyhton零基础投喂(综合练习:2:论⽂作者统计)
  16. 点我—— ASP.NETCORE 安装CentOS
  17. 【JS提升】六边形的两种画法
  18. web服务器是什么?web服务器有哪些
  19. 数据运营与数据分析闲谈
  20. 【C语言】判断二维空间中的点,是否在圆内(输出:该点在圆内、该点在圆上、该点在圆外)。 允许的误差为1e-6.

热门文章

  1. 牛客SQL题解 - 查找employees表
  2. Mysql 导入Incorrect string value: ‘\xCF\xF2\xB7\xBD\xB9\xFA‘ for column
  3. java程序员集合框架面试题_常见的Java集合框架面试题目及回答
  4. ssh日志审计_linux查看ssh用户登录日志与操作日志
  5. 图片文字提取之路-01预处理
  6. 深度报告 | 4G应用启示录与5G应用展望
  7. linux版小米随身WIFI驱动,在官网中您就可以下载小米随身wifi的驱动程序了
  8. 电脑各配件故障速排方法
  9. 亲测可用sqlyog激活注册码
  10. canvas实现背景图和二维码合并-生成海报