目录

基本用法

水平箱线图,显示均值

改变箱线图的形状(箱体的形状notch、异常值的形状sym)

改变箱线图的颜色(箱体边框的颜色、箱体填充色)

相较散点图和折线图,柱状图、饼图、箱线图(箱型图)是另外 3 种数据分析常用的图形,主要用于分析数据内部的分布状态或分散状态。其中箱线图(箱型图)的主要作用是发现数据内部整体的分布分散情况,包括上下限、各分位数、异常值。

与之前的可视化博客内容不同的是,这里我们需要先介绍一下箱线图上各部位的含义:

Matplotlib 中绘制箱线图的函数为 boxplot () ,有两种语法,如下:

常用语法:

matplotlib.pyplot.boxplot(xnotch=Nonesym=Nonevert=Nonewhis=Nonepositions=Nonewidths=Nonepatch_artist=Nonebootstrap=Noneusermedians=Noneconf_intervals=Nonemeanline=Noneshowmeans=Noneshowcaps=Noneshowbox=Noneshowfliers=Noneboxprops=Nonelabels=Noneflierprops=Nonemedianprops=Nonemeanprops=Nonecapprops=Nonewhiskerprops=Nonemanage_xticks=Trueautorange=Falsezorder=Nonehold=Nonedata=None)

常用参数及说明:

参数 说明 参数 说明
x 指定要绘制箱线图的数据; showcaps 是否显示箱线图顶端和末端的两条线
notch 是否是凹口的形式展现箱线图 showbox 是否显示箱线图的箱体
sym 指定异常点的形状 showfliers 是否显示异常值
vert 是否需要将箱线图垂直摆放 boxprops 设置箱体的属性,如边框色,填充色等;
whis 指定上下须与上下四分位的距离 labels 为箱线图添加标签
positions 指定箱线图的位置 filerprops 设置异常值的属性
widths 指定箱线图的宽度 medianprops 设置中位数的属性
patch_artist 是否填充箱体的颜色; meanprops 设置均值的属性
meanline 是否用线的形式表示均值 capprops 设置箱线图顶端和末端线条的属性
showmeans 是否显示均值 whiskerprops 设置须的属性

其他参数请参考文档:https://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.boxplot

只接收DataFrame的 boxplot () 语法:

DataFrame.boxplot(column=Noneby=Noneax=None,showmeans=Falsefontsize=Nonerot=0grid=Truefigsize=Nonelayout=Nonereturn_type=None...)

参数 接收值 说明 默认值
column list 指定要进行箱型图分析的列; 全部列
showmeans bool 是否显示均值; FALSE
notch bool 是否是凹口的形式展现箱线图; FALSE
patch_artist bool 是否填充箱体的颜色,若为true,则默认蓝色; FALSE
grid bool 箱型图网格线是否显示; TRUE
vert  bool 竖立箱型图(True)/水平箱型图(False); TRUE
sym string 指定异常点的形状; o

基本用法

import pandas as pd
import matplotlib.pyplot as plt#读取数据
datafile = u'D:\\pythondata\\learn\\matplotlib.xlsx'
data = pd.read_excel(datafile)
box_1, box_2, box_3, box_4 = data['收入_Jay'], data['收入_JJ'], data['收入_Jolin'], data['收入_Hannah']plt.figure(figsize=(10,5))#设置画布的尺寸
plt.title('Examples of boxplot',fontsize=20)#标题,并设定字号大小
labels = 'Jay','JJ','Jolin','Hannah'#图例
plt.boxplot([box_1, box_2, box_3, box_4], labels = labels)#grid=False:代表不显示背景中的网格线
# data.boxplot()#画箱型图的另一种方法,参数较少,而且只接受dataframe,不常用
plt.show()#显示图像

水平箱线图,显示均值

import pandas as pd
import matplotlib.pyplot as plt#读取数据
datafile = u'D:\\pythondata\\learn\\matplotlib.xlsx'
data = pd.read_excel(datafile)
box_1, box_2, box_3, box_4 = data['收入_Jay'], data['收入_JJ'], data['收入_Jolin'], data['收入_Hannah']plt.figure(figsize=(10,5))#设置画布的尺寸
plt.title('Examples of boxplot',fontsize=20)#标题,并设定字号大小
labels = 'Jay','JJ','Jolin','Hannah'#图例#vert=False:水平箱线图;showmeans=True:显示均值
plt.boxplot([box_1, box_2, box_3, box_4], labels = labels, vert=False,showmeans=True )
plt.show()#显示图像

改变箱线图的形状(箱体的形状notch、异常值的形状sym)

import pandas as pd
import matplotlib.pyplot as plt#读取数据
datafile = u'D:\\pythondata\\learn\\matplotlib.xlsx'
data = pd.read_excel(datafile)
box_1, box_2, box_3, box_4 = data['收入_Jay'], data['收入_JJ'], data['收入_Jolin'], data['收入_Hannah']
plt.figure(figsize=(10,5))#设置画布的尺寸
plt.title('Examples of boxplot',fontsize=20)#标题,并设定字号大小#notch:是否是凹口的形式展现箱线图;sym:异常点的形状;
plt.boxplot([box_1, box_2, box_3, box_4],notch = True,sym = '*')
plt.show()#显示图像

改变箱线图的颜色(箱体边框的颜色、箱体填充色)

箱体色的设置需配合 patch_artist = True 使用

import pandas as pd
import matplotlib.pyplot as plt#读取数据
datafile = u'D:\\pythondata\\learn\\matplotlib.xlsx'
data = pd.read_excel(datafile)
box_1, box_2, box_3, box_4 = data['收入_Jay'], data['收入_JJ'], data['收入_Jolin'], data['收入_Hannah']plt.figure(figsize=(10,5))#设置画布的尺寸
plt.title('Examples of boxplot',fontsize=20)#标题,并设定字号大小#boxprops:color箱体边框色,facecolor箱体填充色;
plt.boxplot([box_1, box_2, box_3, box_4],patch_artist = True, boxprops = {'color':'orangered','facecolor':'pink'})plt.show()#显示图像

箱型图的花哨用法并不常用,因此不多加赘述了。

Matplotlib - 箱线图、箱型图 boxplot () 所有用法详解相关推荐

  1. Matplotlib - 饼图、环形图 pie() 多重饼图 subplots() 所有用法详解

    目录 基本用法 饼图中突出显示某部分 环形图(空心饼图) 多重饼图,并添加分割线 相较散点图和折线图,柱状图.饼图.箱线图是另外 3 种数据分析常用的图形,主要用于分析数据内部的分布状态或分散状态.饼 ...

  2. Matplotlib - 柱状图、直方图、条形图 bar() barh() 所有用法详解

    目录 基本用法 多个直方图并列显示 显示直方图上的数值 多个直方图堆叠显示 水平直方图 相较散点图和折线图,柱状图(直方图.条形图).饼图.箱线图是另外 3 种数据分析常用的图形,主要用于分析数据内部 ...

  3. python 折线图 尾部_Matplotlib 折线图plot()所有用法详解

    散点图和折线图是数据分析中最常用的两种图形.其中,折线图用于分析自变量和因变量之间的趋势关系,最适合用于显示随着时间而变化的连续数据,同时还可以看出数量的差异,增长情况. Matplotlib 中绘制 ...

  4. 【GCN】图卷积网络(GCN)入门详解

    机器学习算法与自然语言处理出品 @公众号原创专栏作者 Don.hub 单位 | 京东算法工程师 学校 | 帝国理工大学 图卷积网络(GCN)入门详解 什么是GCN GCN 概述 模型定义 数学推导 G ...

  5. 时序图怎么看?时序图、活动图、状态图、协作图的区别详解

    时序图怎么看?时序图.活动图.状态图.协作图的区别详解 2019-12-16 10:05:32 燚智能物联网 简介 时序图时序图用于描述对象之间的传递消息的时间顺序, 即用例中的行为顺序.当执行一个用 ...

  6. Matplotlib subplot()函数用法详解

    Matplotlib subplot()函数用法详解 在使用 Matplotlib 绘图时,我们大多数情况下,需要将一张画布划分为若干个子区域,之后,我们就可以在这些区域上绘制不用的图形.在本节,我们 ...

  7. c语言数据类型int的用法,C语言基本数据类型:整型(int)用法详解|C语言学习

    C语言基本数据类型:整型(int)用法详解 1. 整型 int C 语言提供了很多整数类型(整型),这些整型的区别在于它们的取值范围的大小,以及是否可以为负.int 是整型之一,一般被称为整型.以后, ...

  8. 蜡烛图plotly_可视化神器Plotly(5)---参数详解

    本文主要针对plotly的参数含义进行说明,随着plotly版本的迭代更新,部分参数的用法会有细微变化,具体参加官方文档 一.图表预览 二.图表类型 Angularaxis:极坐标图表 Area:区域 ...

  9. spi协议时序图和四种模式实际应用详解

    大家好,我是无际. 上个章节我们讲解了spi接口定义,今天我们更加深入讲解下spi协议时序图和spi四种模式的用法. 刚开始接触单片机开发时,最怕就是看时序图,对于我来说就是奇怪的知识. 特别是SPI ...

最新文章

  1. 冒泡 MS Azure 不便宜。。。
  2. ASP.NET自定义控件组件开发 第四章 组合控件开发CompositeControl
  3. 用python爬取一个人所有信息_python实战===爬取所有微信好友的信息
  4. P1772 [ZJOI2006]物流运输
  5. Python入门100题 | 第038题
  6. Programming Computer Vision with Python (学习笔记八)
  7. Eureka客户端使用IP注册preferIpAddress和ip-address的区别
  8. 记一次特别的往事 while 循环
  9. spring JdbcTemplate数据库查询实例
  10. Qt:Qt实现飞秋拦截助手—ARP攻击
  11. php购物车(session)
  12. Linux FTP服务配置
  13. BZOJ4415: [Shoi2013]发牌
  14. Javascript:模拟ztree侧边栏的回收
  15. 【论文笔记】Recover Canonical-View Faces in the Wild with Deep Neural Network
  16. 想做影视“化妆师”,首先要知道影视后期调色的8个基本步骤!
  17. matlab做弹簧阻尼系统,第5章 弹簧阻尼系统建模.ppt
  18. 大学转计算机专业申请理由,大学转专业申请书
  19. Linux下进程通讯消息队列
  20. ZHW_AI发布CSDN的模板和要求

热门文章

  1. HDU 3605Escape(缩点+网络流之最大流)
  2. 【转载】OpenStack Swift学习笔记
  3. linux uuid/uuid.h
  4. 国内MCU厂商也开始卷了
  5. 跟我师兄聊天引发的思考
  6. 单片机c语言pwm整流的程序,基于 单片机控制PWM整流电源的设计.doc
  7. 每日一题(13)—— #includefile.h 与 #include “file”的区别
  8. javascript option 菜单图标_苹果电脑上神奇的Option键 巧用option键提升效率
  9. project ‘org.springframework.boot:spring-boot-starter-parent:2.1.4.RELEASE‘ not found
  10. 【Pytorch神经网络实战案例】14 构建条件变分自编码神经网络模型生成可控Fashon-MNST模拟数据