MATLAB箱型图异常值/离群值处理(箱型图红色加号)
MATLAB箱型图异常值/离群值处理(箱型图红色加号)
博主针对污染物小时浓度值绘制了年变化的箱型图,出现了大片的较高“异常值”,其实是一些高污染事件,并不属于“异常值”。导师建议将异常值归入箱型图。
箱型图能显示出一组数据的最大值(须线上端)、最小值(虚线下端)、中位数(箱体中间线)、上下四分位数(箱体上下缘,也可以认为是75%和25%)及异常值(默认画出来为红色加号)。
异常值:是位于数据系列中的极端值,该异常值非常小或非常大,因此可能影响数据系列的整体。异常值通常被视为极值,由于其极高或极低的值而可能影响整体,因此应从数据中丢弃。
异常值也可以表示为位于分布的整体之外的值,因此可以影响整个数据系列。异常值通常被认为是由于存在可能低估或高估研究的极值而导致测量误差的原因,因为它与来自群体的随机样本中的其他值具有异常距离。
根据所有统计学家遵循的基本标准,对异常值的通用定义是落在第三个四分位数之上或低于第一个四分位数的四分位数距的1.5倍以上。
原文链接:https://blog.csdn.net/wokaowokaowokao12345/article/details/92718896
最大须线长度的乘数,指定为正数值。最大须线长度是 Whisker 和四分位差的乘积。
boxplot 将大于 q3 + w × (q3 – q1) 或小于 q1 – w × (q3 – q1) 的点绘制为离群值,其中 w 是乘数 Whisker,而 q1 和 q3 分别是样本数据的第 25 个和第 75 个百分位数。
如果数据呈正态分布,‘Whisker’ 的默认值大约对应于 +/–2.7σ 和 99.3% 的覆盖率。绘制的须线会延伸到邻近值,该值是非离群值的最远端数据值。
将 ‘Whisker’ 指定为 0,表示不带须线,q1 和 q3 之外的所有点都将视为离群值。
有关经过标注的带须线的箱线图示例,请参阅箱线图。
示例: ‘Whisker’,0
来自:matlab-boxplot
q1是下四分位数,q2是中位数,q3是上四分位数。
设定whisker是一个较大的值就可以将所有的数都包含进来了。
若想讲所有异常值包含进总体内:
boxplot(x,g,'Whisker',10);
10可以是足够大的任何数。
若想去除箱型图的须线:
boxplot(x,g,'Whisker',0);
MATLAB箱型图异常值/离群值处理(箱型图红色加号)相关推荐
- Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化、箱型图/散点图、小提琴图/散点图组合可视化的简介、使用方法之最强攻略(建议收藏)
Py之seaborn:数据可视化seaborn库(二)的组合图可视化之密度图/核密度图分布可视化.箱型图/散点图.小提琴图/散点图组合可视化的简介.使用方法之最强攻略(建议收藏) 目录 二.组合图可视 ...
- Py之matplotlibseaborn :高级图可视化之Q-Q分位数图probplot、boxplot箱线图、stripplot分类散点图案例应用及代码实现
Py之matplotlib&seaborn :高级图可视化之Q-Q分位数图probplot.boxplot箱线图.stripplot分类散点图案例应用及代码实现 目录 基于百分位数原理寻找异常 ...
- R语言使用GGally包的ggpairs函数可视化变量相关性分析图:包含散点图、密度图、柱状图、箱图等、并自定义数据点的大小
R语言使用GGally包的ggpairs函数可视化变量相关性分析图:包含散点图.密度图.柱状图.箱图等.并自定义数据点的大小 目录
- R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加箱图、带缺口的小提琴图、小提琴图)实战
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加箱图.带缺口的小提琴图.小提琴图)实战 目录 R语言使用ggplot2包geom_jit ...
- R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(手动配置箱图箱体颜色)实战
R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(手动配置箱图箱体颜色)实战 目录 R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(手动配置箱图箱 ...
- R语言使用beanplot包绘制豆荚图实战:与箱图、小提琴图对比、绘制不对称的豆荚图
R语言使用beanplot包绘制豆荚图实战:与箱图.小提琴图对比.绘制不对称的豆荚图 目录 R语言使用beanplot包绘制豆荚图实战 #包的安装和导入 #豆荚图与箱图
- Py之Seaborn:数据可视化Seaborn库的柱状图、箱线图(置信区间图)、散点图/折线图、核密度图/等高线图、盒形图/小提琴图/LV多框图的组合图/矩阵图实现
Py之Seaborn:数据可视化Seaborn库的柱状图.箱线图(置信区间图).散点图/折线图.核密度图/等高线图.盒形图/小提琴图/LV多框图的组合图/矩阵图实现 目录
- 箱线图入门,一文看懂箱线图,matplotlib画箱线图
什么是箱线图? 我们画箱线图的目的其实是去查看数据分布的离散程度. 上图将箱线图的重要部分都标出来了.对于箱线图来说,图中会有的要素有: 最大值 Q3(大于75%数据的位点) 中位数 Q1(大于25% ...
- r语言echarts画箱线图_R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)
箱线图 箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图.在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的好处和一个在线绘制箱线图的工具.就这样都 ...
最新文章
- qt 拖拽 修改大小
- 美国农业生产与农产品国际贸易 对话国际农民丰收节贸易会
- Struts流程分析+源码分析
- PLinq Lookup ParallelQuery
- mysql数据库ACID实现原理
- Bootstrap HTML 编码规范之字符编码
- spring各个jar包作用
- RHEL下SendMail修改发邮箱地址
- ueditor清除多余空行
- 工程图字体宋体仿宋_宋体和仿宋体的区别
- 天书 kdb+之q语言
- Chrome 添加【微信 / QQ】内置浏览器(解决 “请在微信客户端打开链接” 提示)
- 打新股和打新债有什么区别?
- 【Flink】Flink 消费 kafka retries和retry.backoff.ms 引起问题
- 28python成功输出腾讯位置大数据北京地区迁出数据
- 【转】 教你一眼认出英语单词的意思
- Qt+Win10使用QAxWidget控件实现远程桌面控制
- 反编译华为U8825Dldquo;framework-res.apkrdquo;出现的错误提示(2)
- 2021 ICPC Asia Taiwan Online Programming Contest
- linux命令查看raid5,Linux中RAID5搭建与测试