一、总体标准偏差和样本标准偏差

假设我们测量了变量xxx,测得的结果是x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​。令xˉ\bar xxˉ是它们的算术平均值,μ\muμ是xxx的真实值。

我们使用标准(偏)差(Standard Deviation)来度量数据分布的分散程度。标准差越大,数据分布越离散,反之越集中。

我们在小学/初中学过标准差的计算公式σ=∑i=1N(xi−μ)2N\sigma=\sqrt{\frac{\sum_{i=1}^{N}(x_i-\mu)^2}{N}}σ=N∑i=1N​(xi​−μ)2​​其中μ\muμ是总体的平均值。但是物理实验中采用的是S=∑i=1n(xi−xˉ)2n−1S=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n-1}}S=n−1∑i=1n​(xi​−xˉ)2​​其中xˉ\bar xxˉ是样本的平均值。那为什么分母变成n−1n-1n−1了呢?包括我在内的很多人都不理解。

实际上,σ\sigmaσ叫做总体标准偏差(Population Standard Deviation),而SSS叫做样本标准偏差(Sample Standard Deviation),是两种不同的标准偏差。它们的区别何在?总体标准偏差就是你已经知道了所有的数据,比如班级的成绩,然后你要计算它的离散程度。这在物理测量当中是不可能出现的,因为你可以测量无限次。样本标准偏差就是你要用一些数据(样本)来估计整体情况,相当于以偏概全。物理实验中就是这样一种情况,你测得一组数据,然后用这组数据近似表示真实值。在这种情形下,如果我们测得一组数据x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​,用总体标准偏差σ\sigmaσ来表征离散程度的话,就出现问题了:总体平均值,也就是真实值μ\muμ,我们是不知道的。那我们用xˉ\bar xxˉ代替μ\muμ,就会导致:我们计算的是x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​围绕样本的平均值xˉ\bar xxˉ的离散程度,而不是围绕真实值μ\muμ的离散程度。对于一组数x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​和一个变量ttt,令f(t)=∑i=1n(xi−t)2f(t)=\sum\limits_{i=1}^n(x_i-t)^2f(t)=i=1∑n​(xi​−t)2,这是一个开口向上的二次函数,在t=−b2a=∑i=1n2xi2n=∑i=1nxin=xˉt=-\frac{b}{2a}=\frac{\sum\limits_{i=1}^n2x_i}{2n}=\frac{\sum\limits_{i=1}^nx_i}{n}=\bar xt=−2ab​=2ni=1∑n​2xi​​=ni=1∑n​xi​​=xˉ的时候取得最小值。也就是说,∑i=1n(xi−xˉ)2≤∑i=1n(xi−μ)2\sum\limits_{i=1}^n(x_i-\bar x)^2\le\sum\limits_{i=1}^n(x_i-\mu)^2i=1∑n​(xi​−xˉ)2≤i=1∑n​(xi​−μ)2。这就意味着,我们低估了数据的离散程度。我们需要将分母改为n−1n-1n−1,来稍稍增大偏差的值。

那为什么是n−1n-1n−1呢?纯统计学的严格证明颇为复杂,但我们可以用一种别样的思考方式。现在我们获得的样本有nnn个测量结果,就是有nnn条独立的信息。我们已经知道xˉ\bar xxˉ,如果再知道x1−xˉ,x2−xˉ,⋯,xn−1−xˉx_1-\bar x,x_2-\bar x,\cdots,x_{n-1}-\bar xx1​−xˉ,x2​−xˉ,⋯,xn−1​−xˉ,那xn−xˉx_n-\bar xxn​−xˉ自然就知道了。现在我们把这些偏差的平方加起来,应该只有n−1n-1n−1条独立的信息,所有除以n−1n-1n−1才说得通。专业的名词叫做有n−1n-1n−1个“自由度”。

其实到这里你也许还是没有理解。是的,我也没有理解。在系统学习统计学之前是不可能理解的。但是很多人对采用n−1n-1n−1作为分母的说法是“约定俗成的”,即用n−1n-1n−1更符合统计规律。所以我们也不用在乎那么多了,记住在物理实验的时候用n−1n-1n−1作为分母来算标准偏差就好了。

最后,我想说的是,当n→∞n\to\inftyn→∞的时候,即测量无限次,那xˉ\bar xxˉ就是μ\muμ,σ\sigmaσ和SSS的比值就会趋近于111,这时总体标准偏差和样本标准偏差就是一回事了。


二、标准偏差和标准误

还是讨论物理实验中的问题。我们刚才讲了标准偏差(Standard Deviation),它的公式是S=∑i=1n(xi−xˉ)2n−1S=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n-1}}S=n−1∑i=1n​(xi​−xˉ)2​​关于分母为什么是n−1n-1n−1就已经够让我们头疼了,现在又冒出来一个标准误(Standard Error of Mean),这玩意又是什么呢?

标准误的含义用来估计样本平均值和真实值有多少差异的,用σxˉ\sigma_{\bar x}σxˉ​表示。例如,xˉ=0.370\bar x=0.370xˉ=0.370,σxˉ=0.002\sigma_{\bar x}=0.002σxˉ​=0.002,那么测量结果就写成0.370±0.0020.370\pm0.0020.370±0.002。

对于标准偏差和标准误的区别,知乎上有一个我感觉很好的解释:
举个栗子,现在我们测量了200200200次,分为202020组,每组101010个数取一个平均值,那这202020个平均值的标准偏差就是这200200200个数据的标准误。

标准误的计算公式是σxˉ=Sn=∑i=1n(xi−xˉ)2n(n−1)\sigma_{\bar x}=\frac{S}{\sqrt n}=\sqrt{\frac{\sum_{i=1}^{n}(x_i-\bar x)^2}{n(n-1)}}σxˉ​=n​S​=n(n−1)∑i=1n​(xi​−xˉ)2​​
为什么要除以n\sqrt nn​呢?我们考虑nxˉ=x1,x2⋯,xnn\bar x=x_1,x_2\cdots,x_nnxˉ=x1​,x2​⋯,xn​的标准偏差,而x1,x2⋯,xnx_1,x_2\cdots,x_nx1​,x2​⋯,xn​是相互独立的,所以它们的标准偏差都等于SSS,其中SSS是xxx的标准偏差。那么σnxˉ2=nS2\sigma_{n\bar x}^2=nS^2σnxˉ2​=nS2,即n2σxˉ2=nS2n^2\sigma_{\bar x}^2=nS^2n2σxˉ2​=nS2,σxˉ=Sn\sigma_{\bar x}=\frac{S}{\sqrt n}σxˉ​=n​S​。


本文到这里就结束了,还是留下了太多没有解决的问题,以后慢慢补上吧,总之物理实验直接套公式就行了,不用操那么多心~


2022/11/28更新:现在学了概率论与数理统计,有了新的理解,请看这里–>【概率论】关于为什么样本标准偏差分母是n-1的进一步理解。

物理实验引发的思考:总体标准偏差和样本标准偏差的区别是什么?标准偏差和标准误的区别是什么?相关推荐

  1. PPT.101.COM56e4.html,14级大学物理实验绪论.ppt

    14级大学物理实验绪论 1.米尺 最小分度值:1mm 仪器误差:△仪=0.5mm 标准偏差: =0.3mm 待测物长度L=末位置读数-初位置读数 L=26.5-6.0mm=20.5mm 2.游标卡尺 ...

  2. 哪些些实验适合用计算机实测,计算机实测物理实验2014年讨论内容

    >老师您好,我在做李萨如图时,在r=2kΩ时,两组数据都小于理论值,而且,其李萨如图结果与计算结果相同.不知为什么 邓君元 14301050044 (202.120.224.114) 这个结果很 ...

  3. 计算机实验报告心得体会100字左右,[物理实验心得体会] 物理实验心得100字

    篇一:物理实验心得体会 学习物理实验心得体会 转眼我们已经学了一个多学期的大学物理实验了,大学物理实验是一门十分有趣的课,它把理论和实际结合在一起,它让我们更好的了解了物理所带给我们的力量. 在我看来 ...

  4. 大学物理实验试卷1到8_物理实验在绝对的“理论”面前就是“纸老虎”

    引言 物理实验的重要性似已无需多说,首先,依据新大纲的要求,学生实验比以往增加了4. 1% ;教师演示实验增加了21.2%. 其次,有人统计,与物理实验有关的高考题,已占到总分值的18%.可见不论是从 ...

  5. 【渝粤题库】陕西师范大学500018 物理实验研究 作业(专升本)

    <物理实验研究>作业 一.回答问题 什么是创新.具有那些特征? 现代科技创新发展的主要特点有哪些? 什么是创新性思维? 创新思维的主要方法 什么是创新技法 本课程介绍的常用科技创新技法有哪 ...

  6. Octavia API接口慢问题排查引发的思考

    女主宣言 文本梳理了Octavia API接口访问慢问题的排查过程和解决方案,并对排查过程中涉及到的相关知识点进行了梳理,希望日后遇到类似的问题可以有所借鉴和参考. PS:丰富的一线技术.多元化的表现 ...

  7. 【汇编语言与计算机系统结构笔记01】x86/MIPS/ARM指令集概述与特性,一篇HPCA引发的思考(商业生态的决定性作用)

    资源Bilibili AV46914471 + AV57921488 汇编语言与计算机系统结构 清华大学 张悠慧 本次笔记内容: 01.汇编语言与计算机系统结构 02.汇编基础知识--指令集综述 文章 ...

  8. 大学物理实验绪论笔记——关于物理实验的误差分析、处理与数据记录

    一.完整的测量结果表达式举例 以钢丝的杨氏模量为例: 测量结果为:E=(1.89±0.08)x (N/m2) 或 E=1.89x(1±4.3%)  (N/m2) 应包括:测量量(代表符号)+测量量值+ ...

  9. [大学物理实验-5]波尔共振实验

    [大学物理实验-5]波尔共振实验 前言 实验预习(Preview) 实验报告(Report) 实验报告(Report) 总结(Sum up) 前言 最近在整理一些学过的课程的资料,有一些课虽然和我的专 ...

最新文章

  1. Android Service
  2. Jenkins分布式部署配置
  3. fanuc机器人提示暂停_川崎机器人故障排除参考方法
  4. java弹窗_弹出窗口总结 - 王道JAVA - CSDNBlog
  5. zmq源码阅读 --- api介绍 -- zmq_ctx_new + zmq_socket + zmq_bind + zmq_close + zmq_ctx_destroy
  6. python 快递分拣小程序
  7. PS亮度蒙版插件TKActions V5 Mac版
  8. 2022茶艺师(初级)操作证考试题库及在线模拟考试
  9. 关解决windows报错 Use `--location=global` instead. 和 found 0 vulnerabilities
  10. 中国儿童乐园行业市场建设现状分析与营销策略研究报告2022版
  11. easyUI可编辑表格编辑器添加事件
  12. java计算平面度,计算产品面的平面度和平行度(C#代码)
  13. 描述统计与推断统计的关系
  14. 机器人:打开潘多拉魔盒
  15. 在线压缩图片,在线无损压缩图片
  16. AI-自然语言处理-自然语言处理介绍
  17. c语言程序设计库搜索app,C语言编程宝典app
  18. ECMAScript 篇
  19. 神经网络设计(10)——性能曲面和最优点
  20. 色彩处理--Curves与Levels

热门文章

  1. 中国铁塔,室内分布系统
  2. dwg如何转换成pdf文件?
  3. 数据增广+代码实现+QA
  4. 【报告分享】中国游戏行业盘点洞察数据报告-小葫芦大数据(附下载)
  5. Themida / Winlicense (TM / WL)脱壳总结,Themida脱壳,Winlicense脱壳各个版本Safengine区别总结
  6. 这些方法可以手写扫描识别
  7. 数据库系统的概念及其四大特点
  8. 有限元分析之边界条件
  9. NOI 1.10 编程基础之简单排序 C++
  10. 第三方登录QQ申请步骤