箱体图如何排除异常点
箱形图可以用来观察数据整体的分布情况,利用中位数,25/%分位数,75/%分位数,上边界,下边界等统计量来来描述数据的整体分布情况。通过计算这些统计量,生成一个箱体图,箱体包含了大部分的正常数据,而在箱体上边界和下边界之外的,就是异常数据。
其中上下边界的计算公式如下:
UpperLimit=Q3+1.5IQR=75%分位数+(75%分位数-25%分位数)*1.5,
LowerLimit=Q1-1.5IQR=25%分位数-(75%分位数-25%分位数)*1.5
(将数据由小到大排序,处于中间的为中位数,即50%分位数,在75%位置的即为75%分位数或四分之三分位数——Q3,在25%位置的即为25%分位数或四分之一分位数——Q1)
参数说明:
1. Q1表示下四分位数,即25%分位数;Q3为上四分位数,即75%分位数;IQR表示上下四分位差,系数1.5是一种经过大量分析和经验积累起来的标准,一般情况下不做调整。
2. 分位数的参数可根据具体预警结果调整:25%和75%,是比较灵敏的条件,在这种条件下,多达25%的数据可以变得任意远而不会很大地扰动四分位。具体业务中可结合拟合结果自行调整为其他分位。
作者:星星贝
链接:https://www.zhihu.com/question/36172806/answer/76299923
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
箱体图如何排除异常点相关推荐
- 箱体图_靓爆了!东莞近千个市政箱体换上“新装”成街头风景线
小伙伴们 你在上班途中或是逛街路上 有没有发现 东莞好多城市主干道两旁 最近新添了一道亮丽风景线 曾经锈迹斑斑的各类箱体 悄悄披上"新装" 颜值爆表 曾经老旧的市政箱体经过重新美化 ...
- python 画箱体图
任务:将三组txt数据转化为箱体图进行比较 分析:(1)读入使用numpy中loadtext函数 (2)并用numpy中的mean将数据转换为数组 (3)使用pandas中boxplot画图 代码如下 ...
- 箱体图Boxplot及Python绘制方法
一.箱体图介绍 箱体图Boxplot是一种表示数据分布的方法(wiki:boxplot),一个基本的箱体图从上到下分别表示最大值,上四分位,均值,下四分位,最小值.有的箱体图中还会加入异常值等. 箱体 ...
- R语言绘制箱体图举例图文版
熊荣川 六盘水师范学院生物信息学实验室 xiongrongchuan@126.com http://blog.sciencenet.cn/u/Bearjazz 箱体图,或箱形图是科学研究.统计分析中常 ...
- 用pandas绘制箱体图(boxplot)
无意中发现了一个巨牛的人工智能教程,忍不住分享一下给大家.教程不仅是零基础,通俗易懂,而且非常风趣幽默,像看小说一样!觉得太牛了,所以分享给大家.教程链接:https://www.cbedai.net ...
- vsto画箱体图 箱线图 xlboxwhisker
vsto画箱体图 箱线图 xlboxwhisker using Excel=Microsoft.Office.Interop.Excel; Excel.Chart lChart = null; //1 ...
- python box_箱体图Boxplot及Python绘制方
一.箱体图介绍 箱体图Boxplot是一种表示数据分布的方法(wiki:boxplot),一个基本的箱体图从上到下分别表示最大值,上四分位,均值,下四分位,最小值.有的箱体图中还会加入异常值等. 箱体 ...
- python画厢式图_用matplotlib画箱体图(boxplot)
画boxplot的接口为 matplotlib.pyplot.boxplot,不过在画之前,我需要好好理解一下箱体图所代表的含义和计算方法. 用一个实际的例子来说明如何画boxplot,这个例子来自w ...
- 【python】绘制箱体图/蜡烛图/K线图
1. 单类别图 plt.figure(figsize = (15,8)) sns.boxplot(x="your_column1", y="your_column2&qu ...
最新文章
- greenplum 数据库如何增加列_Greenplum行存与列存的选择以及转换方法-阿里云开发者社区...
- 爱上MVC~为Html.EditorForModel自定义模版
- 移动数据分析服务使用教程
- 日志审计产品(转载)
- 使用OpenCV和Python从图像中提取形状
- github设置中文_【Github】100+ Chinese Word Vectors 上百种预训练中文词向量
- php 留言板分页显示,php有分页的留言板,留言成功后怎么返回当前页?
- java实例分析宠物商店_java实例分析:宠物商店.ppt
- OpenXml开发-向Excel2007文档中添加数据
- 马斯克宣布:特斯拉Model Y本月14日发布,预估售价折合人民币25.8万
- (转)量化投资大师采访摘录-詹姆斯·西蒙斯 James Simons
- fterm linux ssh 乱码,用fterm ssh时出现如下乱码,请问如何解决
- 苏大与东大计算机软件专业比较,东北大学和苏州大学哪个实力更强一些?网友:苏大强?...
- java编程英语词汇_Java编程基础常见英语词汇
- veins安装及运行笔记
- 华软java_“华软四个月,胜读四年书” 就业喜报上30岁的Java学员自述无标题文章...
- 机器学习(1): 线性回归——最小二乘法 小结
- HDU-1713 相遇周期
- oracle导出数据到 csv文件方法整理
- Immersionbar学习笔记
热门文章
- 私域认知篇:私域流量到底是什么?私域流量现象,私域流量可以解决什么问题,如何开展私域流量?...
- 深度学习:view size is not compatible with input tensor‘s size and stride (at least one dimension spans a
- 驾照科目一速过技巧--2023年
- 在线表单工具哪个好?
- 厦门大学354汉语基础考研参考书目
- Android 解决帧动画卡顿问题
- MySQL 三个排序方法 row_number()、rank()、dense_rank()
- Sqlserver取整
- 学生签到系统c代码_学生考勤系统源代码
- 喝酒神器小程序源码+全新带特效/多种游戏/支持流量主