箱形图可以用来观察数据整体的分布情况,利用中位数,25/%分位数,75/%分位数,上边界,下边界等统计量来来描述数据的整体分布情况。通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就是异常数据。

其中上下边界的计算公式如下:

UpperLimit=Q3+1.5IQR=75%分位数+(75%分位数-25%分位数)*1.5,

LowerLimit=Q1-1.5IQR=25%分位数-(75%分位数-25%分位数)*1.5

(将数据由小到大排序,处于中间的为中位数,即50%分位数,在75%位置的即为75%分位数或四分之三分位数——Q3,在25%位置的即为25%分位数或四分之一分位数——Q1)

参数说明:

1. Q1表示下四分位数,即25%分位数;Q3为上四分位数,即75%分位数;IQR表示上下四分位差,系数1.5是一种经过大量分析和经验积累起来的标准,一般情况下不做调整。

2. 分位数的参数可根据具体预警结果调整:25%和75%,是比较灵敏的条件,在这种条件下,多达25%的数据可以变得任意远而不会很大地扰动四分位。具体业务中可结合拟合结果自行调整为其他分位。

作者:星星贝
链接:https://www.zhihu.com/question/36172806/answer/76299923
来源:知乎
著作权归作者所有,转载请联系作者获得授权。

箱体图如何排除异常点相关推荐

  1. 箱体图_靓爆了!东莞近千个市政箱体换上“新装”成街头风景线

    小伙伴们 你在上班途中或是逛街路上 有没有发现 东莞好多城市主干道两旁 最近新添了一道亮丽风景线 曾经锈迹斑斑的各类箱体 悄悄披上"新装" 颜值爆表 曾经老旧的市政箱体经过重新美化 ...

  2. python 画箱体图

    任务:将三组txt数据转化为箱体图进行比较 分析:(1)读入使用numpy中loadtext函数 (2)并用numpy中的mean将数据转换为数组 (3)使用pandas中boxplot画图 代码如下 ...

  3. 箱体图Boxplot及Python绘制方法

    一.箱体图介绍 箱体图Boxplot是一种表示数据分布的方法(wiki:boxplot),一个基本的箱体图从上到下分别表示最大值,上四分位,均值,下四分位,最小值.有的箱体图中还会加入异常值等. 箱体 ...

  4. R语言绘制箱体图举例图文版

    熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 箱体图,或箱形图是科学研究.统计分析中常 ...

  5. 用pandas绘制箱体图(boxplot)

    无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.教程链接:https://www.cbedai.net ...

  6. vsto画箱体图 箱线图 xlboxwhisker

    vsto画箱体图 箱线图 xlboxwhisker using Excel=Microsoft.Office.Interop.Excel; Excel.Chart lChart = null; //1 ...

  7. python box_箱体图Boxplot及Python绘制方

    一.箱体图介绍 箱体图Boxplot是一种表示数据分布的方法(wiki:boxplot),一个基本的箱体图从上到下分别表示最大值,上四分位,均值,下四分位,最小值.有的箱体图中还会加入异常值等. 箱体 ...

  8. python画厢式图_用matplotlib画箱体图(boxplot)

    画boxplot的接口为 matplotlib.pyplot.boxplot,不过在画之前,我需要好好理解一下箱体图所代表的含义和计算方法. 用一个实际的例子来说明如何画boxplot,这个例子来自w ...

  9. 【python】绘制箱体图/蜡烛图/K线图

    1. 单类别图 plt.figure(figsize = (15,8)) sns.boxplot(x="your_column1", y="your_column2&qu ...

最新文章

  1. greenplum 数据库如何增加列_Greenplum行存与列存的选择以及转换方法-阿里云开发者社区...
  2. 爱上MVC~为Html.EditorForModel自定义模版
  3. 移动数据分析服务使用教程
  4. 日志审计产品(转载)
  5. 使用OpenCV和Python从图像中提取形状
  6. github设置中文_【Github】100+ Chinese Word Vectors 上百种预训练中文词向量
  7. php 留言板分页显示,php有分页的留言板,留言成功后怎么返回当前页?
  8. java实例分析宠物商店_java实例分析:宠物商店.ppt
  9. OpenXml开发-向Excel2007文档中添加数据
  10. 马斯克宣布:特斯拉Model Y本月14日发布,预估售价折合人民币25.8万
  11. (转)量化投资大师采访摘录-詹姆斯·西蒙斯 James Simons
  12. fterm linux ssh 乱码,用fterm ssh时出现如下乱码,请问如何解决
  13. 苏大与东大计算机软件专业比较,东北大学和苏州大学哪个实力更强一些?网友:苏大强?...
  14. java编程英语词汇_Java编程基础常见英语词汇
  15. veins安装及运行笔记
  16. 华软java_“华软四个月,胜读四年书” 就业喜报上30岁的Java学员自述无标题文章...
  17. 机器学习(1): 线性回归——最小二乘法 小结
  18. HDU-1713 相遇周期
  19. oracle导出数据到 csv文件方法整理
  20. Immersionbar学习笔记

热门文章

  1. 私域认知篇:私域流量到底是什么?私域流量现象,私域流量可以解决什么问题,如何开展私域流量?...
  2. 深度学习:view size is not compatible with input tensor‘s size and stride (at least one dimension spans a
  3. 驾照科目一速过技巧--2023年
  4. 在线表单工具哪个好?
  5. 厦门大学354汉语基础考研参考书目
  6. Android 解决帧动画卡顿问题
  7. MySQL 三个排序方法 row_number()、rank()、dense_rank()
  8. Sqlserver取整
  9. 学生签到系统c代码_学生考勤系统源代码
  10. 喝酒神器小程序源码+全新带特效/多种游戏/支持流量主