Matlab中有关boxplot(X)命令的解释:

boxplot(X) produces a box and whisker plot for each column of the matrix X. The box has lines at the lower quartile, median, and upper quartile values. Whiskers extend from each end of the box to the adjacent values in the data—by default, the most extreme values within 1.5 times the interquartile range from the ends of the box. Outliers are data with values beyond the ends of the whiskers. Outliers are displayed with a red + sign.

格式

boxplot(X) %产生矩阵X的每一列的盒图和“须”图,“须”是从盒的尾部延伸出来,并表示盒外数据长度的线,如果“须”的外面没有数据,则在“须”的底部有一个点。
boxplot(X,notch) %当notch=1时,产生一凹盒图,notch=0时产生一矩箱图。
boxplot(X,notch,‘sym’) %sym表示图形符号,默认值为“+”。
boxplot(X,notch,‘sym’,vert) %当vert=0时,生成水平盒图,vert=1时,生成竖直盒图(默认值vert=1)。
boxplot(X,notch,‘sym’,vert,whis) %whis定义“须”图的长度,默认值为1.5,若whis=0则boxplot函数通过绘制sym符号图来显示盒外的所有数据值。

Examples 1

The following commands create a box plot of car mileage grouped by country.

load carsmall

boxplot(MPG,Origin)

Examples 2

The following example produces notched box plots for two groups of sample data.

x1 = normrnd(5,1,100,1);

x2 = normrnd(6,1,100,1);

boxplot([x1,x2],‘notch’,‘on’)

Examples 3

x1 = normrnd(5,1,100,1);
x2 = normrnd(6,1,100,1);
boxplot([x1,x2])

The difference between the medians of the two groups is approximately 1.Since the notches in the boxplot do not overlap, you can conclude, with 95% confidence, that the true medians do differ.

Examples 4

The following figure shows the boxplot for same data with the length of the whiskers specified as 1.0 times the interquartile range. Points beyond the whiskers are displayed using +.

x1 = normrnd(5,1,100,1); x2 = normrnd(6,1,100,1); boxplot([x1,x2],‘notch’,‘on’,‘whisker’,1)

箱形图

最近有很多用户说到了年终需要回顾这一年的工作,根据这一年的数据看看有没有异常的情况,那么哪种图能够清晰直观地展现出这一信息呢?

答案只有一个,那就是…

箱形图

箱形图(英文:Box plot),又称为盒须图、盒式图、盒状图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因型状如箱子而得名。在各种领域也经常被使用,常见于品质管理,快速识别异常值。

箱形图最大的优点就是不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据的清洗。

想要搞懂箱形图,那么一定要了解…

五大因“数”

我们一组序列数为例:12,15,17,19,20,23,25,28,30,33,34,35,36,37讲解这五大因“数”


1、下四分位数Q1

(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。

(2)根据位置,计算相应的四分位数。

例中:

Q1所在的位置=(14+1)/4=3.75,

Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;

2、中位数(第二个四分位数)Q2

中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。

例中:

Q2所在的位置=2(14+1)/4=7.5,

Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5

3、上四分位数Q3

计算方法同下四分位数。

例中:

Q3所在的位置=3(14+1)/4=11.25,

Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。

4、上限

上限是非异常范围内的最大值。

首先要知道什么是四分位距如何计算的?

四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR

5、下限

下限是非异常范围内的最小值。

下限=Q1-1.5IQR

实例

讲了这么多的“数学知识”,那么箱形图到底如何通过BDP应用到实际的工作呢?我们还是用一个实例来帮助大家理解。

现在有“2017年各季度各地区分公司销售业绩”工作表,我们想要找出各季度哪些分公司业绩属于不正常范围内。

数据示例如下图:

BDP箱形图结果:

从上图可以清晰的找出异常点,例如第二季度北京分公司的销售额为22147元,该值比上限10759元还要大,所以定义为异常值。

具体操作在这里就不讲解了,可以参考“各位久等了,全新的炫酷图表终于上线啦!”

箱形图的价值

1.直观明了地识别数据批中的异常值

上文讲了很久的识别异常值,其实箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不会影响箱形图的数据形状,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。

2.利用箱线图判断数据批的偏态和尾重

对于标准正态分布的样本,只有极少值为异常值。异常值越多说明尾部越重,自由度越小(即自由变动的量的个数);

而偏态表示偏离程度,异常值集中在较小值一侧,则分布呈左偏态;异常值集中在较大值一侧,则分布呈右偏态。

3.利用箱线图比较几批数据的形状

同一数轴上,几批数据的箱线图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便昭然若揭。如上图,可直观得看出第三季度各分公司的销售额大体都在下降。

局限性

但箱形图也有他的局限性,比如:不能精确地衡量数据分布的偏态和尾重程度;对于批量比较大的数据,反映的信息更加模糊以及用中位数代表总体评价水平有一定的局限性。

https://zhuanlan.zhihu.com/p/33473642

MATLAB 命令 BOXPLOT相关推荐

  1. 利用matlab命令画出以下信号的波形,MATLAB实验报告

    文档收集于互联网,已重新整理排版.word 版本可编辑,有帮助欢迎下载支持. 1文档来源为:从网络收集整理.word 版本可编辑. 实验一 名称:连续时间信号分析 姓名:王嘉琦 学号:0636 班级: ...

  2. 在Matlab命令窗口中执行,交互式命令操作就是在MATLAB命令行窗口中输入命令并执行。...

    交互式命令操作就是在MATLAB命令行窗口中输入命令并执行. 答:√ 中国大学MOOC: 一侧肾切除后,另一留存肾会长得更加硕大,这种生理现象称为 . 答:代偿 Street jazz 的编舞师都会有 ...

  3. Matlab命令集--常用字符串函数

    Matlab命令集--常用字符串函数 常用函数 eval  :运行字符串表示的表达式 char  :将数组变成字符串 double:将数字字符串变成数字 字符串操作 deblank :去掉字符串末尾的 ...

  4. Matlab命令汇总

    Matlab命令汇总 都是从网上转的,贴到一起方便查,使用的时候直接Ctrl+F搜索. 一.常用对象操作:除了一般windows窗口的常用功能键外. 1.!dir 可以查看当前工作目录的文件.   ! ...

  5. matlab命令行窗口显示长度设置_设置命令行窗口输出显示格式 | MATLAB format| MathWork...

    本页对应的中文页面未升级,但未能翻译. 若应查看最新内容,请点击这里访问英文页面. 设置命令行窗口输出显示格式 format 将命令行窗口中的输出显示格式修改为 style 指定的格式. format ...

  6. matlab多元二次分析,Matlab篇----常用的回归分析Matlab命令(regress篇)

    前言 最近学了不少回归分析的知识,用到了几个常用的Matlab命令,写在这里做个总结. 回归分析,就是研究几种变量之间的关系.如果你也很喜欢分析数据,这种技巧是基本的一项.(PS:高级的是机器学习.) ...

  7. Matlab篇----常用的回归分析Matlab命令(regress篇)

    前言 最近学了不少回归分析的知识,用到了几个常用的Matlab命令,写在这里做个总结. 回归分析,就是研究几种变量之间的关系.如果你也很喜欢分析数据,这种技巧是基本的一项.(PS:高级的是机器学习.) ...

  8. matlab示波器模拟,[转载]利用MATLAB命令窗口绘制Simulink仿真示波器波形的方法

    利用MATLAB命令窗口绘制Simulink仿真示波器波形的方法 最近写了一篇有关步进电机控制仿真分析的文章,需要将一部分仿真波形图贴到WORD里面去.但贴图时发现,如果直接将simulink中示波器 ...

  9. [Matlab]篇----回归分析Matlab命令(regress篇)

    [Matlab]篇--回归分析Matlab命令(regress篇) 一.简介 最近在做回归分析方面的东西,网上查阅相关资料,通过实际调试,对调试结果进行总结. 回归分析法指利用数据统计原理,对大量统计 ...

最新文章

  1. keras 的 example 文件 cifar10_cnn.py 解析
  2. cocos2d-x的A*寻路
  3. git版本号管理工具的上手
  4. 【Python】学习笔记总结1(Python基础)
  5. 提交spark的bug的地方
  6. Java经典23结构模型的设计模式(三)------附加代理模式、适配器型号、Facade模式的差异...
  7. Android_自适应布局
  8. WPF Visifire 图表控件
  9. wps linux 64 下载,WPS For Linux 10.1.0.6757社区版发布下载
  10. 华为U8500使用心得
  11. PyCharm配置Virtual Environment
  12. 趣图:你永远想不到用户怎么使用你的产品
  13. 前端JS获取图片文件的真实格式
  14. 小程序开发实战学习笔记 1
  15. Echart柱状图-柱子顶部显示数值/显示图标
  16. 系统出错,发生系统错误1067
  17. 【机器学习笔记7】决策树原理及应用
  18. 知乎搜索文本相关性与知识蒸馏
  19. json-server Error: EPERM: operation not permitted, mkdir ‘C:\Progra m Files\nodejs\node_
  20. tflearn教程_tflearn api文档

热门文章

  1. JDK8 lambda的会话指南–术语表
  2. Java 8中使用Lambda表达式的策略模式
  3. Java 8最新消息
  4. 带有谓词的Java中的功能样式-第1部分
  5. mysql 表丢失_Mysql数据库备份 部分数据表丢失 Mysql table doesn't exist 解决
  6. 注册界面的实现案例视频(前端开发)
  7. Linux查看用户信息/查看所有用户信息的命令
  8. 类Unix系统下,vim各种模式之间的切换
  9. 搭建IC设计EDA虚拟机服务器,忆往昔--集成门控时钟技术的前世--分离门控时钟技术...
  10. linux注册平台驱动,关于Linux驱动的平台注册方式-- platform_driver_register