许多paper里经常能看到Mean±SD(SE)这样的表达方式,或者在图表里用SD或者SE来表示error bar,用SD的居多,但是也有不少用SE的。初学者很容易混淆SD(standard deviation)和SE(standard error)。

SD

SD我们都很清楚,是表达数据的离散程度,然后实际应用中很多数据具有近似正态分布的概率分布,有了SD,我们就可以大致估计数据的范围,譬如经典的"68-95-99.7法则",即约 68% 数值分布在距离平均值有 1 个标准差之内的范围,约 95% 数值分布在距离平均值有 2 个标准差之内的范围,以及约 99.7% 数值分布在距离平均值有 3 个标准差之内的范围。如下图:

SE

SE是什么呢,一般来说,自然界里很难获得总体数据,我们只能用样本(无论是各种实验还是社会调查抽样)去近似估计总体,这样问题就来了,估计的准不准(平均值)?
我们可以理论上这样做,既然不能获得总体,我们可以尽可能多(无限)的从标准差为σ的总体数据里抽取大小为 n 的样本,每个样本各有一个平均值,所有样本平均值的标准差就可以用"68-95-99.7法则"评估准不准了(这就是所谓的置信区间),样本平均值的标准差可以被证明如下公式表达:

但由于通常σ为未知,此时可以用研究中取得样本的标准差 (S) 来估计:

这就是SE的来源,即样本平均值的SD,我们用MATLAB编程演示下。

MATLAB演示

以掷硬币为例,掷100次,统计正面(1)的次数,共统计1000次作为一个sample,然后我们这样采1000个sample(程序不怕累的)。
先贴结果,代码放后面。结果如下,我们能看到样本平均值的SD基本等于样本的SE!

完整代码如下:

%1000个样本(sample)
sample_mean = []for m=1:1000%掷硬币100次,统计正面的次数,共统计1000次作为一个samplesample = []for i = 1:1000box = randi([0,1],100,1);sample = [sample length(box(box==1))];    endsample_mean = [sample_mean mean(sample)];
end%sample的标准差和标准误
SD_sample = std(sample)
SE_sample = SD_sample/sqrt(1000)
%sample平均值的标准差
SD_sample_mean = std(sample_mean)

结论

1、标准差(SD)更能反应离散程度。

paper里需要Mean±SD这个信息,就是便于读者进行判断数据的离散性,e.g.,一般我们把偏离平均值2或3个SD的值作为outlier(i.e., 异常值)。

2、标准误则比较适合用于评估精确性或准确性的问题。

paper里根据需要也可以提供Mean±SE这个信息,就是便于读者进行判断数据的不确定性,e.g.,95%置信区间是用的Mean ± 2*SE。

无论用哪种表达方式,一定要注意标明,特别是error bar,好的paper都会说明这是什么的。

关于样本标准差(SD)与样本标准误差(SE)相关推荐

  1. (转)关于样本标准差(SD)与样本标准误差(SE)

    许多paper里经常能看到Mean±SD(SE)这样的表达方式,或者在图表里用SD或者SE来表示error bar,用SD的居多,但是也有不少用SE的.初学者很容易混淆SD(standard devi ...

  2. 如何理解95%置信区间

    如何正确理解95%置信区间 科技论文里经常会出现[95%CI]的评价,这个评价到底有什么意义,他和68-95-99.7法则的关系是什么,可能很多人没有清楚的理解,包括之前写论文评价95%CI的自己. ...

  3. SD vs SE in Ecology.

    标准差(SD):是数据的一个统计量,用于衡量数据的变异程度,是每个观察值与均值之间差异的平方和的平均值的平方根.SD通常用于描述一组数据中的变异程度.SD较大意味着数据更分散,较小意味着数据更聚集. ...

  4. 均值估计标准差(Standard Deviation) 和 标准误差(Standard Error)

    最近一直在研究均值估计之类的问题,下午正好有机会和大家分享一下. 本文摘自 Streiner DL.Maintaining standards: differences between the sta ...

  5. python t检验_A or B A/B测试-python独立双样本t检验

    一.简单介绍A/B测试 A/B测试为同一个目标制定两个版本,一部分用户使用A版本,另一部分用户使用B版本,记录用户使用数据,比较各个版本对于改进目标的转化效果,选择更好的版本. 二.数据集介绍 有两种 ...

  6. GraphPad Prism 教程 :标准差与平均值的标准误差有什么区别

    之前已经推送了关于标准差(SD).平均值的标准误差(SEM)的介绍文章,今天将重点介绍一下标准差(SD)和平均值的标准误差(SEM)之间的区别.什么场景下需要绘制SD或SEM图形? 开始之前,我们先复 ...

  7. 简单介绍一下R中的几种统计分布及常用模型

    统计学上分布有很多,在R中基本都有描述.因能力有限,我们就挑选几个常用的.比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示. 统计分布每一种分布有四个函数:d――density(密度函数) ...

  8. R语言函数总结(转)

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  9. 【转】R语言函数总结

    原博: R语言与数据挖掘:公式:数据:方法 R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头, ...

最新文章

  1. 图解Transformer,读完这篇就够了
  2. Zabbix学习之路(五)之MySQL监控
  3. 如何让某些用户对Marketing Cloud的contact数据只能实施只读操作
  4. Exchange server 2010系列教程之三 发送邮件测试
  5. 玖云个人导航API工具网站源码
  6. matlab padarray
  7. java expression 强制出现_Java中带有强制括号对的单行循环
  8. python并发编程方法_一文了解Python并发编程的工程实现方法
  9. awgn信道c语言程序,关于awgn信道的程序求解~!
  10. 每日一题【62】导数-公切线问题
  11. 知乎视频该如何玩能够赚到一波,5K字揭秘!
  12. 课程设计 齿轮油泵泵体的机械加工工艺规程及工艺夹具装备设计
  13. android的边框设置
  14. 几何光学基础(1):基本定律
  15. [NOIP2020]微信步数
  16. java中的日历_Java中的日历功能
  17. Unity即将内置骨骼动画插件Anima2D
  18. ios下video标签无法播放视频
  19. bios 升级后win7无法启动的一个可能原因
  20. Python3.4 调用语音及警报声

热门文章

  1. NOKIA N70如何恢复出厂设置
  2. 百练 红与黑(DFS)
  3. Framework7跳转页面如何自动隐藏工具栏(no-tabbar)
  4. 微信小程序 _登录态理解
  5. 游戏脚本代码大全_引擎入门 | 创建双杆射击游戏(组件 2)
  6. 2018第四届美亚杯中国电子数据取证大赛个人赛write up
  7. 电话骗局:被电信诈骗的恐惧与救赎
  8. 高胜算交易策略(三):识别趋势现状和反转位置
  9. 匈奴 东胡 突厥 蒙古 契丹 女真 ……终于全部搞懂了!值得看。
  10. 小程序仿微视_微信小程序仿抖音,微视上下滑动整屏切换视频带关注,收藏