箱线图怎么判断异常值_箱形图(Box-plot)识别异常值,是否有数据依据?还是经验法则?...
箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。
箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。
我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解
1、下四分位数Q1
(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数。
例中:
Q1所在的位置=(14+1)/4=3.75,
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
2、中位数(第二个四分位数)Q2
中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。
例中:
Q2所在的位置=2(14+1)/4=7.5,
Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5
3、上四分位数Q3
计算方法同下四分位数。
例中:
Q3所在的位置=3(14+1)/4=11.25,
Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。
4、上限
上限是非异常范围内的最大值。
首先要知道什么是四分位距如何计算的?
四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR
5、下限
下限是非异常范围内的最小值。
下限=Q1-1.5IQR
BDP个人版箱形图效果:
其实箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不会影响箱形图的数据形状,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。
箱线图怎么判断异常值_箱形图(Box-plot)识别异常值,是否有数据依据?还是经验法则?...相关推荐
- Python使用matplotlib可视化箱图、seaborn中的boxplot函数可视化分组箱图、在箱图中添加抖动数据点(Dot + Box Plot)
Python使用matplotlib可视化箱图.seaborn中的boxplot函数可视化分组箱图.在箱图中添加抖动数据点(Dot + Box Plot) 目录
- R语言ggplot2可视化:可视化箱图、在箱图中添加抖动数据点(Dot + Box Plot)、自定义抖动数据点的大小、颜色、数据点分布在箱图中间、添加主标题、副标题、题注信息
R语言ggplot2可视化:可视化箱图.在箱图中添加抖动数据点(Dot + Box Plot).自定义抖动数据点的大小.颜色.数据点分布在箱图中间.添加主标题.副标题.题注信息 目录
- 密度图的密度估计_箱形图、小提琴图、直方图……统统可以卡通化!
全文共11345字,预计学习时长23分钟或更长 对于数据科学家来说,可视化工具比比皆是,因此,退一步去钻研每种可视化的类型及其适用的最佳案例就变得十分重要.为了发挥工具的最佳效用,有时可以考虑将其拟人 ...
- 小提琴统计图_箱形图和小提琴图
箱形图(Box-plot) 又称为盒须图.盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图,因形状如箱子而得名.它能显示出一组数据的最大值.最小值.中位数.及上下四分位数. 箱形图绘制须使用 ...
- java盒图_箱形图/盒图(转)
http://zh.wikipedia.org/wiki/%E7%AE%B1%E5%BD%A2%E5%9C%96 http://www.blogjava.net/norvid/articles/317 ...
- 节点图一般的比例_基于图的异常检测(二):LOCKINFER
论文:Inferring lockstep behavior from connectivity pattern in large graphs 作者:Meng Jiang,Peng Cui 来源:P ...
- 机器人图形变变变_《图形变变变》中班教案
<图形变变变>中班教案 作为一无名无私奉献的教育工作者,通常需要用到教案来辅助教学,编写教案有利于我们准确把握教材的重点与难点,进而选择恰当的教学方法.写教案需要注意哪些格式呢?以下是小编 ...
- 怎么让热图显示基因名_热图怎么做? | 热图函数pheatmap()
是不是会经常绘制热图?那热图怎么做?先看一眼这个函数的参数,这么多,而且最后还有省略号.那么我们应该怎么合理使用这些参数让你的热图看起来更加高大上呢? pheatmap(mat, color = co ...
- opencv ocr文字识别_用OpenCV和OCR识别图片中的表格数据
♚ 作者: jclian,喜欢算法,热爱分享,希望能结交更多志同道合的朋友,一起在学习Python的道路上走得更远! 在很多时候,我们的数据来源形式是多种多样的,有时候数据(或表格)也会呈现在图片 ...
最新文章
- java中实现具有传递性吗_Java中volatile关键字详解,jvm内存模型,原子性、可见性、有序性...
- Python的装饰器
- Android分享功能
- 对天天开心消消乐(订餐系统)的建议
- 浅谈数据中心IT机房的空气调节(上篇)-气流遏制
- 用友u8年度账文件服务器错误,用友u8erp软件出纳管理模块年度数据结转常见问题...
- MediaCodec的使用和若干问题处理
- collatz序列 python程序_Python Collatz序列实现过程解析
- 小麦积分墙:我的App与微信搞上了
- 《锁王创造营》 第一关:初出茅庐
- 美图秀秀拼接渐变过渡_如何使用Web组件创建渐变过渡
- android spannablestring设置字体颜色,Android SpannableString设置超链接、颜色、字体等属性...
- 克里斯蒂安贝尔_克里斯蒂安贝尔现身机场,身材瘦到认不出来,蝙蝠侠又开始减重了...
- Sqlite3并发读写注意事项
- surface book 3 结束休眠之后风扇狂转
- 服务器ie不能打开购物网站,[Answers 分享]通过IE浏览器无法打开网上银行或者支付宝等加密安全站点...
- 计算机网络三网,七律四首(手机、电视、计算机网络、三网融合)
- 【流浪地球——休眠仓】题解
- (十二) 灰度共生矩阵
- 如何使用glove,fasttext等词库进行word embedding?(原理篇)
热门文章
- 条件随机场(CRF)相对于HMM,MEMM的优势
- zz 写科技论文的一点体会
- CVPR 2017 ADNet:《 Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning》论文笔记
- java readunsignedint,int readUnsignedShort()
- java如何读取rfid的数据_100G 数据如何先随机读取1%?
- oracle 跨服务器推送视图_oracle跨数据库视图
- vuecli 实战商城后台管理系统_前台商城系统及后台管理系统
- 2021-03-29 标准化函数
- PKUWC2019游记WC2019游记
- 标识位:可以用以确定鼠标点击的是哪一个按钮或者是文本框