文章目录

  • 数据准备
  • 相关概念:Q1,Q2,Q3,IQR,QQ1,QQ3
  • 绘制箱线图
  • 分析箱线图

数据准备

假设有如下数据:


我们要分别绘制出age这列数据的箱线图和%fat这列数据的箱线图。

相关概念:Q1,Q2,Q3,IQR,QQ1,QQ3

Q1,Q2,Q3:

将数据从小到大排序,可以把这份数据平均分成四份,其中第一份数据最后一个数就是Q1,也叫做下四分位数,第二份数据最后一个数就是Q2,也叫中位数,第三份数据的最后一个数就是Q3,也叫上四分位数。

至此,我们可以想象,在一条数轴上,我们已经标出了Q1,Q2,Q3。

IQR,QQ1,QQ3:

  1. IQR=Q3-Q1。被称之为四分位距。
  2. QQ1=Q1-1.5IQR
  3. QQ3=Q3+1.5IQR

其中:

  1. IQR被称之为四分位距。
  2. [QQ1,QQ3]被称之为内限,即如果数据落在这个范围之外,被看作是异常值。因此QQ1和QQ3两个点也被称之为异常值截断点。

把QQ1和QQ2也标记在数轴上

小总结:

显然那五个标记在数轴上的从小到大排列会是这样的:QQ1,Q1,Q2,Q3,QQ3。
在QQ1左边或者QQ3右边的数据我们称之为异常数据。

绘制箱线图

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
data=pd.read_csv("agebodyfat.csv")

figure,axis=plt.subplots(nrows=1,ncols=2,figsize=(20,8),dpi=80)
list=["age","%fat"]
for i in range(2):axis[i].boxplot(data[list[i]],showmeans=True,boxprops={'color': 'red'},flierprops={'marker': 'o', 'mfc': 'red', 'color': 'black'},)axis[i].grid(linestyle="--",alpha=0.5)axis[i].set_title(list[i])axis[i].set_xticks([])plt.suptitle("boxplot of age and %fat")
plt.show()

绘制的结果如下:

分析箱线图

很直观可以发现两组数据都是Q2,Q3距离比较近,所以可以知道在Q2~Q3区间上数据分布比较密集。

使用python中的库matplotlib绘制箱线图(boxplot)相关推荐

  1. R 中导入csv数据,编辑数据框中异常值并绘制箱线图 Boxplot

    1. 打开Rstudio 2. 使用 read.csv() 读取数据.例如:g <- read.csv("homework3-4_data.csv") 3. 执行下述代码绘制 ...

  2. 绘制箱线图的标签python_利用Python - Matplotlib 绘制箱线图

    1.箱线图介绍 第一步:计算上四分位数,中位数,下四分位数(计算公式略). 第二步:计算上四分位数和下四分位数之间的差值,四分位数差. 第三步:绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数 ...

  3. Matplotlib绘制箱线图

    箱线图(Box-plot)又称为盒式图或箱型图,是一种用来显示一组数据分散情况的统计图,它能显示一组数据的上界.下界.中位数.上下四分位数以及异常值等.箱线图的各部分组成及其含义如下图所示. 关键术语 ...

  4. python绘制箱线图boxplot()

    最近在处理数据时,需要使用python绘制箱线图. 1. 箱线图 箱线图(Box-plot)又称为盒式图或箱型图,是一种用来显示一组数据分散情况的统计图,它能显示一组数据的上界.下界.中位数.上下四分 ...

  5. Python+matplotlib绘制箱线图并设置异常值、中值、均值显示格式

    推荐教材: <Python数据分析.挖掘与可视化>(慕课版)(ISBN:978-7-115-52361-7),董付国,人民邮电出版社,定价49.8元,2020年1月出版,2021年3月第6 ...

  6. seaborn和pandas绘制箱线图 boxplot

    import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline # 用seaborn ...

  7. python箱线图配色_python绘制箱线图

    三种方式绘制箱线图 #第一种:直接使用自带的箱线图函数 import pandas as pd import matplotlib.pyplot as plt data=pd.read_excel(& ...

  8. 用python绘制箱线图

    箱线图作用-python实践-异常值识别 文章目录 一.别名 二.历史 三.定义 四.作用 (1)识别异常值 (2)判断偏态 (3)评估数据集中程度 五.用python绘制箱线图 参考 一.别名 箱须 ...

  9. python boxplot用法,Python使用plt.boxplot() 参数绘制箱线图

    Python 绘制箱线图主要用 matplotlib 库里 pyplot 模块里的 boxplot() 函数. plt.boxplot() 参数详解 plt.pie(x, # 指定要绘制箱线图的数据: ...

最新文章

  1. 安装Macports遇到的问题和PATH设置
  2. Unity AOP 处理异常的方法
  3. 每天一个Linux命令(17)--whereis命令
  4. HDU 4418 Time travel
  5. if( 1 == x ) 比 if( x == 1 ) 哪个好
  6. 使用远程服务器Spyder
  7. Java Level 2 学习的八大名著
  8. [亲测可用]Premiere Pro 2020视频剪辑软件,premiere2020软件安装包
  9. 解决多旅行商(MTSP)的分组遗传算法(GGA-SS)
  10. 使用Python进行数独求解(二)
  11. (已解决)spring-boot maven报错Project 'org.springframework.boot:spring-boot-starter-parent:2.2.0.RELEAS
  12. 缓存行填充与@sun.misc.Contended注解
  13. 桌面上的计算机图片怎么复制,怎么把一张普通的图片复制到EXCEL表格中
  14. C语言学习:除去剪切板内容的换行与回车
  15. 【python爬虫】爬取深圳证券业协会公布的营业部数据并对pdf文件进行解析
  16. 完美解决win7系统中IE占用CPU过高问题(转)
  17. JAVA默认永久代大小_jvm——metaspace代替永久代
  18. 针对学校出现猪流感而做的一个简单的小软件(更新版)
  19. MySQL数据库的InnoDB引擎TableSpaceExists问题解决
  20. 如何防止form表单重复提交

热门文章

  1. 互联网刚刚年满50,发明它的那个人却「后悔」了
  2. 为什么要学习响应式设计
  3. 针对IT人员的四月热点新书推荐
  4. 基于深度学习的交互式问答研究综述
  5. 赠书 | 元宇宙:开启未来世界的六大趋势
  6. 独家 | 提升API设计技能的22个最佳实践(附链接)
  7. 我们能达到电影里的智能吗?最可能实现的AI场景是什么?如何看待AI自主性?...
  8. 资源 | 来自独秀同学的深度网络数学笔记,还不快收藏?
  9. 数据蒋堂 | JOIN简化 - 消除关联
  10. 【技术干货】卷积神经网络中十大拍案叫绝的操作