全文大概1400字,阅读全文大概需要4.5分钟。

上一篇讲了箱线图基本组成,其中涉及到:

  1. 5大要数: 最大值,最小值,第一四分位数(Q1),第二四分位数(中位数Median),第三四分位数(Q3) , 平均数(Mean)
  2. 基于「N+1」, 「N-1」两种四分位数的算法
  3. 四分位距(IQR)以及上限值,下限值
  4. 最小观测值,,最大观测值以及异常值(Outliers)

继续阅读之前,我还得强调一下,最大观测值是除异常值外的最大值,最小观测值是除异常值外的最小值!

今天介绍使用EXCEL画箱线图的其中一种方法---K线图

一. 先介绍下K线图

成人的世界总是绕不开股票,哪怕你压根不玩股票,周边肯定也有很多"韭菜",天天聊大盘,聊K线!好,先认识下K线。

一般K线图

由上图可知,K线图由最高价、开盘价、收盘价、最低价构成,最重要的是外形很像箱线图!

股票么,有涨有跌,而K线图中分别有不同的表示。

涨了!收盘价高于开盘价!

欢欣鼓舞迎大牛

跌了!收盘价低于开盘价!

陷熊市捶胸顿足

看到了吧,红色就是红红火火,冒绿光的就是蔫了吧唧,萎靡不振

参照箱线图,小结一下:

  • 箱线图的最大观测值可用K线的最高价代替
  • 箱线图的最小观测值可用K线的最低价代替
  • 箱线图的第三分位数(Q3)可用开盘价收盘价代替
  • 箱线图的第三分位数(Q1)可用开盘价收盘价代替
  • 原始的K线图无法表示中位数(median),平均数(mean)以及异常值(outliers)

二. 实例操作

1.原始数据/样本数据

图1是某高校10名学生各参加8个科目的期末考试成绩单,据此制作箱线图

图1 学生期末成绩表

2. 数据统计

因为四分位数的算法有「N+1」, 「N-1」两种,如下计算均基于「N-1」;EXCEL 的函数 "QUARTILE.INC" 以及 "QUARTILE" 都是基于「N-1」;"QUARTILE.EXC"基于「N+1」

图2 学生成绩统计

算出上限值和下限值,当然异常值也就确定了,图1 标红的数据则是异常值

如图2,这些过程统计值是必须的,举例说明:

<1. Q1[25%]; B27 = QUARTILE(B14:B23,1)

这里"B14:B23"数据区代表10名学生的英语成绩列表, 参数"1"代表第一四分位数

<2. 中位数[Median]; B28 = QUARTILE(B14:B23,2)

参数"2"代表第二四分位数也就是中位数,当然是用函数Median() 效果等效

<3. Q1[75%]; B29 = QUARTILE(B14:B23,3)

参数"3"代表第三四分位数,此外四分位距[IQR] = Q3-Q1

<4. 最大观测值; B34 = MAX(IF(B14:B23<B32,B14:B23))

IF(B14:B23<B32,B14:B23),其中B32为计算出的英语成绩上限值为108.75,超过这个数则为异常值。这个条件判断语句将返回一个数组,数组中由学生英语成绩中小于108.75的元素组成,操作时注意使用Ctrl + Shift + Enter
因此,表达式MAX(IF(B14:B23<B32,B14:B23))意为找到异常值外的最大值,即最大观测值!

<5. 最小观测值; B35 =MIN(IF(B14:B23>B33,B14:B23))

小于下限值为异常值,异常值外的最小值为最小观察值

3. 数据整理

我们将要先画K线图,确切的说是EXCEL K线图中的 "开盘-最高价-最低价-收盘”类型,当然要想完成这个类型的K线图,数据必须按照这个顺序进行整理。

据此我们将步骤2中的数据整理为图3。

图3 整理后的统计数据

我们前面讲到玩股票的两大状态,要么涨了,要么跌,所以开收盘价不存在绝对高低之分,所以再整理数据的时候,除了按照Q3-最大观测值-最小观测值-Q1之外,当然也可以按照Q1-最大观测值-最小观测值-Q3排序。

绘制如上类型的K线图,只需要4组数据,所以中位数,平均数需要额外假如到图表中。

4. 利用K线图绘制箱线图的基本框架

选择数据 A37:I41>插入所有图表>股价图>“开盘-最高价-最低价-收盘”>确认

得到图表如图4所示

图4 K线图基本框架

5. 图表美化

  • 修改标题,删除图例
  • 删除Y周主轴线,调整X,Y字体
  • 将最大、最小观测值添加标记"-"
  • 添加数据标签,移动到合适位置修改标签字体颜色

如图5

图5 格式化K线图

6. 图表中添加中位数,平均数

选中数据源>添加数据系列“平均数”以及“中位数”,并移动到最大观测值和最小观测值之间,图图6

图6 添加&amp;amp;quot;中位数&amp;amp;quot;,&amp;amp;quot;平均数&amp;amp;quot;数据系列

7. 修改数据系列中位数和平均数的标记特性

平均数一般以"x"标识,而中位数则以"—”标识,如图7

图7 添加标记

8. 中位数和平均数添加数据标签,最终我们得到箱线图如图8

图8 完成箱线图的制作

可以看到图8与开篇介绍的箱线图的区别在于,使用K线图制作箱线图少了异常值的标记!

最后,下篇介绍EXCEL制作箱线图的另一种方法!

最最后,觉得有用,点个赞再走哇~~

箱线图怎么判断异常值_极简统计学---箱线图[2]相关推荐

  1. 箱线图怎么判断异常值_原创【六西格玛工具解读】02——箱线图(Boxplot)

    为方便从事质量工作的小伙伴系统了解相关管理工具,小编整理出六西格玛工具系列的应用解读.旨在相关爱好者交流探讨,也可供报考六西格玛黄带.绿带或黑带的朋友参考.因个人水平有限,难免存在疏忽和错误,还请各位 ...

  2. 箱线图怎么判断异常值_箱形图(Box-plot)识别异常值,是否有数据依据?还是经验法则?...

    箱形图(英文:Box plot),又称为盒须图.盒式图.盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图.因型状如箱子而得名.在各种领域也经常被使用,常见于品质管理,快速识别异常值. 箱形图 ...

  3. 箱线图怎么判断异常值_异常数值识别(检测)

    一.异常值定义: 异常值是指样本中的个别值,其数值明显偏离它(或他们)所属样本的其余观测值.二.识别异常值方法:方法一:.变异系数 ---------------------------------- ...

  4. 一款极简的在线甘特图项目管理软件

    知竹 - 一款极简的在线甘特图项目管理软件 在线地址: https://www.yxsss.com/ 主要功能包括 添加任务.直观操作,所见即所得. 时间.进度图形化清清楚楚,最细时间单位可以到小时, ...

  5. 2022-07-12 读书笔记:《写给所有人的极简统计学》

    2022-07-12 读书笔记:<写给所有人的极简统计学> 该系列文章系个人读书笔记及总结性内容,任何组织和个人不得转载进行商业活动! 本书作者:永野裕之 一直想学习一下数理统计的基础内容 ...

  6. ggplot2箱式图两两比较_个人向ggplot2箱线图总结

    主要从如何看图.用图与作图三个方面来对箱线图进行理解和总结. 1.看图 箱线图概述图1 箱线图概述图2 如图所示,箱线图是将一组数据按照大小顺序排列后进行绘制的,包含6个数据节点,分别表示出数据的上边 ...

  7. 原子性 可见性 有序性_极简主义的内容可见性

    原子性 可见性 有序性 A couple of years ago, Minimalism as a concept took over the design world. 几年前, 极简主义作为一种 ...

  8. 光滑曲线_极简微积分——函数的曲线的描绘

    我们曾为导数是什么,导数如何计算付出了很多的努力去搞明白它到底是什么一回事.导数在物理学,经济学中都发挥了重要的作用,下面将讲述一些导数在函数图像分析方面的简单应用,以证明我们学过的导数不只是理论上的 ...

  9. windows7经典开机音乐_极简之美——网易云音乐云石蓝牙音箱 拆机评测

    极简之美--网易云音乐云石蓝牙音箱 拆机评测 选购过程 说起随身蓝牙音箱,在手机厂商纷纷淘汰3.5mm耳机口之后,一副蓝牙耳机以及一个随身蓝牙音箱应该已经是标配了. 我也有这样的需求,我是为了今年再去 ...

最新文章

  1. Yii2 使用 QQ 和 Weibo 第三方登录源码
  2. 二 查看oracle归档日志路径
  3. android时间显示中文版,系统运行时间显示工具(Vov System Uptime)
  4. 【CodeForces-1041C】Coffee Break(贪心,STL,set二分维护,题意难,有坑,SJ题,构造)(知识点总结)
  5. matlab 基本变量和函数
  6. 多线程的那点儿事(基础篇)
  7. mpython 直接访问_python -mSimpleHTTPServer 开启一个简单的http服务器,可传输文件
  8. PostgreSQL查看系统视图的源码
  9. 用unity制作能量护盾(2)
  10. java中输出5个数_编写一个程序,要求用户输入5个数字,并输出这些数字中最大的数字和这些数字中最小的数字...
  11. ADT(abstract data types)抽象数据类型
  12. ps计算机图片素材,电脑ps怎么把图片变清晰(手把手教你修图)
  13. 一芯FC1179主控扩容U盘量产修复教程(图文详解)
  14. 梯度下降算法和逆误差传播算法
  15. 原代码审计笔记-安全缺陷
  16. 全球与中国网络连接视频门铃对讲机系统市场深度研究分析报告势
  17. 在 Windows Server 2003 企业服务器中如何配置 IPv6 协议
  18. aec Gain 公式
  19. CPU位数、操作系统位数、指令集、寄存器位数、机器字长等
  20. APP注册登录那点事

热门文章

  1. c语言学生管理系统常见问题,关于C语言学生管理系统问题
  2. 电脑显示器不亮主机正常_电脑显示屏不亮但是主机已开机怎么解决
  3. css动画逐帧播放、缩放
  4. Google Developers可以访问了?
  5. windows卸载qt_如何在Qt中显示一个窗口并在关闭后立即将其删除?
  6. python opencv findcontours_OpenCV之视频分析 – 背景消除与前景ROI提取
  7. jdk13.0.2安装mysql_centos下的安装mysql,jdk
  8. WebAPI性能监控-MiniProfiler与Swagger集成
  9. AutoWrapper:通过有意义的响应来美化您的ASP.NET Core API
  10. 使用Kendo上传控件实现ASP.NET Core的“批处理模式”