解释箱线图的主要结果

请完成以下步骤来解释箱线图。

关于本主题

  • 步骤 1:评估主要特征
  • 步骤 2:查找非正常或异常数据的指示符
  • 步骤 3:评估和比较组

步骤 1:评估主要特征
检查分布的中心和散布。评估样本数量对箱线图外观的影响。

中心和散布
检查以下元素可深入了解样本数据的中心和散布。

中位数

中位数由箱子中的线表示。中位数常用于度量数据的中心。一半观测值小于等于该值,而另一半则大于等于该值。

四分位间距框

四分位间距框表示中间 50% 的数据。它显示第一个四分位数与第三个四分位数之间的距离 (Q3-Q1)。

须从箱子的任一侧延伸。须表示下 25% 和上 25% 的数据值的范围,不包括异常值。
将指针放在箱线图上以显示包含这些统计量的工具提示。例如,静息心率的此箱线图显示心率的中位数为 71。大多数主体的心率介于 64 和 80 之间,但也有一些主体的心率低至 48 或高至 100。

调查此箱线图上任何奇怪的或不想要的特征。例如,箱线图上可能显示木板的长度中位数远小于目标长度 8 英尺。注意
由于箱线图的四分位数是计算值,因此它们可能不是数据集内的实际观测值。有关如何解释四分位数的更多信息,请转到什么是四分位数?。有关如何计算四分位数的具体信息,请转到图形汇总的方法和公式。

样本数量 (n)
样本数量可能会影响图形的外观。
例如,尽管这两个箱线图似乎有相当大的差异,但这两个箱线图都是使用从同一个总体中随机选择的数据样本创建的。

n = 15
n = 500

当样本数量最少为 20 时,箱线图效果最佳。如果样本数量太小,箱线图显示的四分位数和异常值可能没有意义。如果样本数量小于 20,请考虑改用单值图。

步骤 2:查找非正常或异常数据的指示符
偏斜数据表明数据可能不正常。异常值可能表明数据中存在其他情况。

偏斜数据
当数据偏斜时,大多数数据位于图形的高或低侧。偏斜表明数据可能未呈正态分布。
这些箱线图说明的是偏斜数据。带右偏斜数据的箱线图显示等待时间。大部分等待时间相对较短,只有少数等待时间很长。带左偏斜数据的箱线图显示失效时间数据。少数几个项立即失败,更多的项会在随后失败。

右偏斜
左偏斜

如果已知数据本身未偏斜,请调查可能的原因。如果您希望分析严重偏斜的数据,请阅读该分析的“数据注意事项”主题,以确保您可以使用非正常数据。

异常值
异常值是远离其他数据值的数据值,可能会显著影响您的结果。通常情况下,在箱线图上最容易识别异常值
在箱线图上,异常值用星号 (*) 标识。

提示
将指针放在异常值上以标识数据点。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除与异常的单次事件(也称为特殊原因)相关联的数据值。然后,重新执行分析。

步骤 3:评估和比较组
如果箱线图含组,请评估和比较组的中心和散布。

中心
查找组中心之间的差异。
例如,此箱线图显示四个供应商生产的电线的厚度。一些组的厚度中位数似乎不同。

散布
查找组散布之间的差异。
例如,此箱线图显示四条生产线生产的麦片盒的填充重量。各组麦片盒的重量中位数比较相似,但某些组的重量比其他组的变异性大。

要确定散布(方差)之间的差异在统计意义上是否显著,请执行以下操作之一:

  • 如果只有两个组,请使用双方差检验。
  • 如果有三个或多个组,请使用相等方差的检验。

什么是四分位数?

四分位数是将数据样本分成四个相等部分的值。利用四分位数,可以快速评估数据集的散布和中心趋势 – 这是了解数据的重要前期步骤。

例如,对于以下数据:7、9、16、36、39、45、45、46、48、51

  • Q1 = 14.25
  • Q2(中位数)= 42
  • Q3 = 46.50
  • 四分位间距 = 14.25 - 46.50,或 32.25

注意
四分位数是计算值,而不是数据中的观测值。通常,需要在两个观测值之间插值才能正确计算出四分位数。

由于不受极端观测值的的影响,因此与均值和标准差相比,中位数和四分位间距是对高度偏斜数据的中心趋势和散布程度的更好度量。

箱线图上的“向里生长”或“反转”须

默认情况下,箱子的底部位于第一个四分位数 (Q1) 值处,顶部位于第三个四分位数 (Q3) 值处。须是从箱子的顶部和底部延伸到相邻值的线。相邻的值是仍位于以下限值所定义的区域内部的最低和最高观测值:

  • 下限:Q1 - 1.5 (Q3 - Q1)
  • 上限:Q3 + 1.5 (Q3 - Q1)

但是,上面的相邻值可能会小于 Q3,这将从 Q3 向箱子内部绘制须。下面的相邻值还可能会大于 Q1,这将从 Q1 向箱子内部绘制须。

对于次箱线图:

  • Q1 = 1382
  • Q3 = 1792
  • 下限 = 1382 - 1.5*(1792-1382) = 767
  • 上限 = 1792 + 1.5*(1792-1382) = 2407

此范围内的最小观测值是 1200,最大观测值是 1563。下面的须将 Q1=1382 连接到 Q1=1200,这会延伸到箱子外部。上面的须将 Q3=1792 连接到 Q3=1536,这会延伸到箱子内部。

注意
如果您选择针对箱子端点使用折叶点而不是四分位数,则须永远不会“向里生长”。

箱线图的四分位怎么计算_Minitab图形 | 箱线图—3解释结果相关推荐

  1. 感性电路电流计算_正弦稳态电路计算之一:相量图法辅助求解

    正弦稳态电路有时利用相量图求解比直接计算简单. 例:图1电路中,已知U=100V,R2=6.5Ω,R=20Ω,当调节触点C使得Rac=4Ω时,电压表读数最小,为30V,求复阻抗Z. 图1 待求电路 分 ...

  2. k线形态python_如何用Python量化“相似K线”实现形态选股?

    (文章转载自公众号 MindGo量化平台, 作者 陈城) 导读:"历史会重演"是技术分析的三大假设之一,市场行为与投资者心理有着千丝万缕的联系.比如价格形态,它们通过一些特定的价格 ...

  3. R语言ggplot2可视化交互作用图(Interaction Plot):可视化不同分组(分类变量1)在不同剂量下(分类变量2)的箱图(box plot)、均值计算并连接成线图(line plot)

    R语言ggplot2可视化交互作用图(Interaction Plot):可视化不同分组(分类变量1)在不同剂量下(分类变量2)的箱图(box plot).均值计算并连接成线图(line plot) ...

  4. ggplot2箱式图两两比较_R语言ggplot2箱线图绘图总结

    主要从如何看图.用图与作图三个方面来对箱线图进行理解和总结. 1.看图 箱线图概述图1 箱线图概述图2 如图所示,箱线图是将一组数据按照大小顺序排列后进行绘制的,包含6个数据节点,分别表示出数据的上边 ...

  5. ggplot2箱线图的美化之路: 箱线图到直方图加散点图再加误差线的美化之路

    如何把你的箱线图变成plus版? 箱线图到直方图加散点图再加误差线的美化之路 前言 数据准备 箱线图美化 01 一个平平无奇的箱线图 02 给箱线图加上误差线 03 加上散点的信息 04 去除网格线和 ...

  6. jmp怎么做合并的箱线图_如何在JMP中给箱线图(Box Plot)快速着色

    箱线图(Box-plot),是大家耳熟能详的一种显示数据分散情况的统计图.通过箱线图,我们可以很容易地比较几组数据的形状,识别数据中的异常值,锁定那些需要我们关注的异常值信息,发现解决问题的机会. 箱 ...

  7. 一分钟学会看k线图_一分钟怎样学会看k线图(纯干货)散户必备!

    原标题:一分钟怎样学会看k线图(纯干货)散户必备! K线图最早是日本德川幕府时代大阪的米商用来记录当时一天.一周或一月中米价涨跌行情的图示法,后被引入股市.K线图有直观.立体感强.携带信息量大的特点, ...

  8. php计算股票均线,移动平均线——Moving Average 平均线的计算公式

    在前一章节我们介绍了一些走蜡烛图技术的形态包括持续形态和反转形态等等.虽然蜡烛图已经成为目前交易中广泛使用的技术分析工具但是在实际应用中由于自身的一些缺点使得交易者判断买人卖出时机的准确度降低.蜡烛图 ...

  9. python绘制k线图_Python使用PyQtGraph绘制股票行情K线图

    PyQtGraph是Python平台上一种功能强大的2D/3D绘图库,相对于matplotlib库,由于其在内部实现方式上,使用了高速计算的numpy信号处理库以及Qt的GraphicsView框架, ...

最新文章

  1. poj1236(强连通分量)
  2. linux服务器补丁加载方法,Kpatch不重启给Linux内核打补丁
  3. 青蛙 mysql_青蛙学Linux—MySQL常用命令(二)
  4. linux怎么离线安装gcc文件夹,CentOS下离线安装gcc环境,图文详细,方法全面
  5. 女生学计算机未来出路,计算机真的已经烂大街了吗,女生学计算机没出路吗?...
  6. C# 循环语句 for
  7. es6 Generator.prototype.return()方法
  8. SQL Server中 char与varchar
  9. 织梦错误mynews.lib.php on line 40,织梦错误Fatal error: Using $this when not in object context...
  10. Java数据库编程技术 第三章习题
  11. Java JDK8下载 (jdk-8u251-windows-x64和jdk-8u271-linux-x64.tar)
  12. YOLOv5 6.0 解决不显示Gflops方法:
  13. 直接添加GO词云到基因表达热图上
  14. Java代码如何运行的?
  15. MICCAI 2019 Proceeding 论文集part1-6
  16. Vue中利用moment.js(时间格式化插件)做一个倒计时组件
  17. 阐述免费增值游戏的设计特点及注意事项
  18. exlc表格怎么换行_Excel表格如何自动换行
  19. Ceph配置——5.Ceph-MON设置
  20. QQ音乐评论分布可视化

热门文章

  1. matlab求解复杂复数方程,用matlab求解一个两重积分方程(未知数在积分下限,含复数积分)...
  2. 对不起,Ubuntu 21.04出现了内部错误 解决办法
  3. Linux 下的截屏并编辑的工具介绍
  4. 【收藏】OGC标准服务 WMS WCS WFS WPS
  5. Spark on K8S及history服务部署
  6. ubuntu18.04安装python3.7并将python3指向python3.7
  7. 封装一个流水号ID生成器:id-spring-boot-starter
  8. 【webservice】JAX-WS独立服务使用
  9. Ubuntu安装pygame的过程记录与分享(包括python的卸载,openssl的安装,python3.7的安装,pygame的安装)
  10. oracle join详解,inner join和left join之间的区别详解