使用python中的库matplotlib绘制箱线图(boxplot)
文章目录
- 数据准备
- 相关概念:Q1,Q2,Q3,IQR,QQ1,QQ3
- 绘制箱线图
- 分析箱线图
数据准备
假设有如下数据:
我们要分别绘制出age这列数据的箱线图和%fat这列数据的箱线图。
相关概念:Q1,Q2,Q3,IQR,QQ1,QQ3
Q1,Q2,Q3:
将数据从小到大排序,可以把这份数据平均分成四份,其中第一份数据最后一个数就是Q1,也叫做下四分位数,第二份数据最后一个数就是Q2,也叫中位数,第三份数据的最后一个数就是Q3,也叫上四分位数。
至此,我们可以想象,在一条数轴上,我们已经标出了Q1,Q2,Q3。
IQR,QQ1,QQ3:
- IQR=Q3-Q1。被称之为四分位距。
- QQ1=Q1-1.5IQR
- QQ3=Q3+1.5IQR
其中:
- IQR被称之为四分位距。
- [QQ1,QQ3]被称之为内限,即如果数据落在这个范围之外,被看作是异常值。因此QQ1和QQ3两个点也被称之为异常值截断点。
把QQ1和QQ2也标记在数轴上
小总结:
显然那五个标记在数轴上的从小到大排列会是这样的:QQ1,Q1,Q2,Q3,QQ3。
在QQ1左边或者QQ3右边的数据我们称之为异常数据。
绘制箱线图
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
data=pd.read_csv("agebodyfat.csv")
figure,axis=plt.subplots(nrows=1,ncols=2,figsize=(20,8),dpi=80)
list=["age","%fat"]
for i in range(2):axis[i].boxplot(data[list[i]],showmeans=True,boxprops={'color': 'red'},flierprops={'marker': 'o', 'mfc': 'red', 'color': 'black'},)axis[i].grid(linestyle="--",alpha=0.5)axis[i].set_title(list[i])axis[i].set_xticks([])plt.suptitle("boxplot of age and %fat")
plt.show()
绘制的结果如下:
分析箱线图
很直观可以发现两组数据都是Q2,Q3距离比较近,所以可以知道在Q2~Q3区间上数据分布比较密集。
使用python中的库matplotlib绘制箱线图(boxplot)相关推荐
- R 中导入csv数据,编辑数据框中异常值并绘制箱线图 Boxplot
1. 打开Rstudio 2. 使用 read.csv() 读取数据.例如:g <- read.csv("homework3-4_data.csv") 3. 执行下述代码绘制 ...
- 绘制箱线图的标签python_利用Python - Matplotlib 绘制箱线图
1.箱线图介绍 第一步:计算上四分位数,中位数,下四分位数(计算公式略). 第二步:计算上四分位数和下四分位数之间的差值,四分位数差. 第三步:绘制箱线图的上下范围,上限为上四分位数,下限为下四分位数 ...
- Matplotlib绘制箱线图
箱线图(Box-plot)又称为盒式图或箱型图,是一种用来显示一组数据分散情况的统计图,它能显示一组数据的上界.下界.中位数.上下四分位数以及异常值等.箱线图的各部分组成及其含义如下图所示. 关键术语 ...
- python绘制箱线图boxplot()
最近在处理数据时,需要使用python绘制箱线图. 1. 箱线图 箱线图(Box-plot)又称为盒式图或箱型图,是一种用来显示一组数据分散情况的统计图,它能显示一组数据的上界.下界.中位数.上下四分 ...
- Python+matplotlib绘制箱线图并设置异常值、中值、均值显示格式
推荐教材: <Python数据分析.挖掘与可视化>(慕课版)(ISBN:978-7-115-52361-7),董付国,人民邮电出版社,定价49.8元,2020年1月出版,2021年3月第6 ...
- seaborn和pandas绘制箱线图 boxplot
import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline # 用seaborn ...
- python箱线图配色_python绘制箱线图
三种方式绘制箱线图 #第一种:直接使用自带的箱线图函数 import pandas as pd import matplotlib.pyplot as plt data=pd.read_excel(& ...
- 用python绘制箱线图
箱线图作用-python实践-异常值识别 文章目录 一.别名 二.历史 三.定义 四.作用 (1)识别异常值 (2)判断偏态 (3)评估数据集中程度 五.用python绘制箱线图 参考 一.别名 箱须 ...
- python boxplot用法,Python使用plt.boxplot() 参数绘制箱线图
Python 绘制箱线图主要用 matplotlib 库里 pyplot 模块里的 boxplot() 函数. plt.boxplot() 参数详解 plt.pie(x, # 指定要绘制箱线图的数据: ...
最新文章
- 安装Macports遇到的问题和PATH设置
- Unity AOP 处理异常的方法
- 每天一个Linux命令(17)--whereis命令
- HDU 4418 Time travel
- if( 1 == x ) 比 if( x == 1 ) 哪个好
- 使用远程服务器Spyder
- Java Level 2 学习的八大名著
- [亲测可用]Premiere Pro 2020视频剪辑软件,premiere2020软件安装包
- 解决多旅行商(MTSP)的分组遗传算法(GGA-SS)
- 使用Python进行数独求解(二)
- (已解决)spring-boot maven报错Project 'org.springframework.boot:spring-boot-starter-parent:2.2.0.RELEAS
- 缓存行填充与@sun.misc.Contended注解
- 桌面上的计算机图片怎么复制,怎么把一张普通的图片复制到EXCEL表格中
- C语言学习:除去剪切板内容的换行与回车
- 【python爬虫】爬取深圳证券业协会公布的营业部数据并对pdf文件进行解析
- 完美解决win7系统中IE占用CPU过高问题(转)
- JAVA默认永久代大小_jvm——metaspace代替永久代
- 针对学校出现猪流感而做的一个简单的小软件(更新版)
- MySQL数据库的InnoDB引擎TableSpaceExists问题解决
- 如何防止form表单重复提交