我们之前学的标准差,指的是总体标准差,但是在现实中,由于样本数量很大,且都具有随机性,我们不可能得到全部的样本,所以要计算出总体标准差是不现实的。
通常情况下,我们只能从某个事物中进行抽样,然后从抽样样本中估计总体标准差。

总体标准差

公式:

x 为某个样本, 为总体样本的均值,n 为总体样本的数量。

样本标准差

公式:

x 为某个抽样样本, 为抽样样本的均值,n 为抽样样本的数量。
可以看出,总体标准差和样本标准差的区别是,一个分母是 n,一个分母是 (n - 1)。
为什么样本标准差的分母是 (n - 1) ?
维基百科的说法是:在统计学中样本的均差多是除以自由度 (n - 1),意思是样本能够自由选择的程度。当选到只剩一个时,它就不可能再有自由了,所以自由度是 (n - 1)。
意思是在抽样完成后,平均值 就已经确定了,在从 n 个样本逐个选取过程中,如果已经选取了 (n - 1) 个样本,那么最后剩下的一个就是能够确定平均值 的样本。也就是如果剩下的样本数大于 1 时,就还有可以挑选的自由,当只剩下一个时,就别无选择了。所以说,n 个样本中,只有 (n - 1) 个样本可以自由变化。
现实中,我们很难获取到全部的样本,因此,要从抽样样本来预估总体样本,也就是要把抽样样本当作总体样本来看待,这时抽样样本的数量就不能是 n ,这里的 n 代表是总体样本数量,这是不能确定的数,而 n 个样本中,可以自由选择的是 (n - 1) 个样本,所以分母是 (n - 1) 。
在机器学习中,分母通常是 n,其实无论分母是 n 还是 (n - 1),对模型的训练并无影响。

标准误差

标准误差指的是样本均值的标准差,衡量的是样本均值的离散程度。
因为每一次抽样得到的平均值都是不一样的,需要进行多次抽样后,再用多个样本均值来估计总体均值,那么样本均值的离散程度越大,抽样误差就越大。
所以用标准误差来衡量抽样误差的大小。

总体标准差、样本标准差、标准误差相关推荐

  1. 总体标准差-样本标准差

    总体标准差和样本标准差公式: 解释: 1,求一组数据的标准差,该组数据就是总体,此时是求总体标准差,公式中分母为n: 2,总体太大或未知,只能每次抽取样本,此时是求样本标准差,分母为n-1. 图片来源 ...

  2. 【Python】统计数据标准差(总体标准差,样本标准差)

    前言 最近做实验需要统计实验结果的均值,标准差,mark一下,方便查阅! 总体标准差 样本标准差 有的也叫无偏样本标准差,就是自由度为 n-1 代码 imimport numpy as np each ...

  3. C语言实现总体方差,总体标准差,样本方差,样本标准差

    /**方差计算 *****注意数据类型 *参数 data[] 数据 *使用注意 需要重定义数据类型 typedef unsigned char uint8; typedef unsigned int ...

  4. 环境变量path的作用、时间序列的学习、标准差与标准误差

    118.环境变量path的作用 实际上,对Windows操作系统环境变量path的编辑,只是为了在命令行下可以无需带路径,直接执行一些程序,而不会出现程序文件无法找到的错误. 119.对于时间序列的学 ...

  5. 假设检验 - 区间估计(总体标准差未知)

    背景知识: u分布:指标准正态分布,是以0为平均值,以1为标准差的正态分布 z分布:泛指正态分布,是以u为平均值,以西格玛为标准差的正态分布.对于z分布中的所有变量X,转换为(X-U)/西格玛时,其服 ...

  6. pandas中计算总体标准差

    标准差(或方差),分为 总体标准差(方差)和 样本标准差(方差). 前者分母为n,后者为n-1.后者是无偏的. pandas里的 .std() 和 .var() 都是算的无偏的. 而numpy是有偏的 ...

  7. 假设检验 - 区间估计 (总体标准差σ已知)

    标准正态分布表(带x) 1.所谓的正态分布表都是标准正态分布表(n(0,1) [标准差=1,平均值=0],通过查找实数x的位置,从而得到p(z<=x). 2.表的纵向代表x的整数部分和小数点后第 ...

  8. 总体标准差和标准差的区别

    总体标准差和标准差都是用来衡量数据集合中数据值的离散程度.但是它们在计算上有所不同. 标准差(sample standard deviation)是在一个样本中计算,用来反映样本数据值分布程度.公式为 ...

  9. R计算已知 总体标准差 ,均值 , N 求 置信区间

    葡萄酒进口商需要报告某国葡萄酒瓶中酒的平均度数.根据以往葡萄酒的经验,进口商认为酒的度数呈正态分布,总体标准差为12%.进口商随机抽取了60瓶新酒,得出样本均值X=93%.给出所有新酒瓶中酒的度数的9 ...

最新文章

  1. SpringBoot + Redis:模拟 10w 人的秒杀抢单!
  2. css3选项卡样式,css3选项卡标题样式设计1
  3. docker日志位置
  4. [持续收集]中国好注入-语句
  5. USB-HDD-WinPE U盘版WINPE启动盘维护系统
  6. 如何修改Ubuntu Linux的时间
  7. 计算机地址栏搜索不了网,我的电脑地址栏不见了怎么办 地址栏不见了如何解决...
  8. maven jacoco_使用JaCoCo Maven插件为单元和集成测试创建代码覆盖率报告
  9. 前端学习(1426):ajax封装
  10. CVS配置过程 (部分转)
  11. 中常用的函数_ST语言编程中常用的函数/功能块
  12. java面试算法总结_java编程面试过程中常见的10大算法概念汇总
  13. BZOJ 3261: 最大异或和位置-贪心+可持久化01Trie树
  14. Windows Server 2012中的多元密策略
  15. C#电子病历管理系统源码 医院电子病历源码
  16. 【软考网络工程师】华为路由器交换机配置
  17. 最新免费下载无水印视频,抖音短视频去水印免费保存下载教程
  18. P1116 车厢重组
  19. 【genius_platform软件平台开发】第九十三讲:串口通信(485通信)
  20. 一个菜鸡的ACM之路

热门文章

  1. 使用 SAP UI5 绘制 Business Rule Control
  2. 新式茶饮“拿捏”年轻人,“八马茶业”们的出路在哪?
  3. 如何魔改Xilinx Vivado 的MIG IP核
  4. 华硕天选2/系列切换应用声音消失问题的解决方法
  5. CentOS 7.6的64位安装JAVA JDK
  6. R语言-蒲丰投针问题(向量化)
  7. pythonreshape函数三个参数_Python Numpy中reshape函数参数-1的含义
  8. 企业上市需要哪些条件
  9. 数据预测之BP神经网络具体应用以及matlab代码(转)
  10. 远程工作的五个层次 – 以及为什么您可能处于第2层