(1)

箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图、柱状图或饼图等传统图表,只是数据大小、占比、趋势等等的呈现,其包含一些统计学的均值、分位数、极值等等统计量,因此,该图信息量较大,不仅能够分析不同类别数据平均水平差异(需在箱线图中加入均值点),还能揭示数据间离散程度、异常值、分布差异等等。

在python中常用matplotlib的boxplot来绘制,最简单绘制的如下:

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

np.random.seed(2) #设置随机种子

df = pd.DataFrame(np.random.rand(5,4),

columns=['A', 'B', 'C', 'D'])#先生成0-1之间的5*4维度数据,再装入4列DataFrame中

df.boxplot() #也可用plot.box()

plt.show()

Paste_Image.png

从图形可以看出,A、B、C、D四组数A、D数据较集中(大部分在上下四分位箱体内),但都有异常值,C的离散程度最大(最大值与最小值之间距离),以均值为中心,B分布都有明显右偏(即较多的值分布在均值的右侧),A、C则有明显左偏。

(2)

从分析的角度来说,上面boxplot最初始图形已经够用,但是在matplotlib库下boxplot函数中包含n多参数,涉及到对框的颜色及形状、线段线型、均值线、异常点的形状大小等等设置,由于大多并不常用,用了几个常用参数,作图如下:

df.boxplot(sym='r*',vert=False,patch_artist=True,meanline=False,showmeans=True)

plt.show()

Paste_Image.png

其中,sym='r*',表示异常点的形状,

vert=False,表示横向还是竖向(True),,

patch_artist=True,(上下四分位框内是否填充,True为填充)

meanline=False,showmeans=True,是否有均值线及其形状,meanline=True时,均值线也像中位数线一样是条红色线段,这样容易与中位数线混淆。

另外,还有其他参数,比如notch表示中间箱体是否缺口,whis为设置数据的范围,showcaps、showbox是否显示边框,可以参见

http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.boxplot,如该网页中图形:

Paste_Image.png

左上图是默认图形,中上、右上是显示均值点及形状,左下是是否显示箱体边框,中下是带缺口的箱体,右下是是否显示异常值。

(3)

前边说过,很多参数使用很少,但对于图形来说,可能还能用到的就是美化,比如各条线的颜色,粗细程度等等。这里可用for循环来构造。

f=df.boxplot(sym='r*',patch_artist=True)

for box in f['boxes']:

# 箱体边框颜色

box.set( color='#7570b3', linewidth=2)

# 箱体内部填充颜色

box.set( facecolor = '#1b9e77' )

for whisker in f['whiskers']:

whisker.set(color='r', linewidth=2)

for cap in f['caps']:

cap.set(color='g', linewidth=3)

for median in f['medians']:

median.set(color='DarkBlue', linewidth=3)

for flier in f['fliers']:

flier.set(marker='o', color='y', alpha=0.5)

plt.show()

Paste_Image.png

其中,boxes, 是25分位值和75分位值构成的box,

medians, 是中位值的横线, 每个median是一个Line2D对象

whiskers, 是指从box 到error bar之间的竖线.

fliers, 是指error bar线之外的离散点.

caps, 是指error bar横线.

means, 是均值的横线,

(4)

还可以做子图,如我们在最开始的DataFrame数据中加入分类数据列:

df['E'] = np.random.choice(['X', 'Y'], size=20)#加入以X、Y随机分类的E列

print(df)

plt.figure()

df.boxplot(by='E')

plt.show()

Paste_Image.png

这样我们就可以比较,不同类别X、Y在同一列下的数据分布情况及其差异。

python画统计图怎么在右上角表示哪条线代表什么_Python-matplotlib统计图之箱线图漫谈...相关推荐

  1. python画厢式图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  2. python panda 库箱线图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  3. Python 之 Matplotlib 散点图、箱线图和词云图

    文章目录 一.散点图 1. scatter() 函数 2. 设置图标大小 3. 自定义点的颜色和透明度 4. 可以选择不同的颜色条,配合 cmap 参数 5. cmap 的分类 5.1 Sequent ...

  4. python 画漫画_在漫画中画一条直线,罗宾逊投影

    transform参数与要打印的数据相关联.在lat/lon中指定直线的起点和终点,因此唯一合理的变换是大地坐标变换和PlateCarree变换.在 当您设置transform=ccrs.Robins ...

  5. python绘制柱状图和折线图_python(matplotlib)中如何把折线图和柱状图画在一起?

    代码如下import numpy as np import matplotlib.pyplot as plt #构造数据 N = 10 ind = np.arange(N) bars = np.ran ...

  6. python画一箭穿心_焉栩嘉带火一款手机壳,看清上面的图案后,没想到你是这样的人...

    原标题:焉栩嘉带火一款手机壳,看清上面的图案后,没想到你是这样的人 提起焉栩嘉的话,想必每个人都不陌生吧?他不仅是R1SE的成员,而且还是"北京电影学院"的学生,当初他在入学的时候 ...

  7. python画图matplotlib直方图条怎么变宽_python – matplotlib和numpy – 直方图条颜色和规范化...

    所以我有两个问题: 1-我有一个2D直方图w / 1D直方图沿着x& y轴.这些直方图总计了它们各自的x和y值,而主直方图总计了对数x-y区间的值.代码如下.我用pcolormesh来生成2D ...

  8. 用python画苹果的logo_简单几步,100行代码用Python画一个蝙蝠侠的logo

    转自:菜鸟学Python 简单几步,100行代码用Python画一个蝙蝠侠的logo-1.jpg (35.33 KB, 下载次数: 0) 2020-7-30 12:04 上传 蝙蝠侠作为DC漫画的核心 ...

  9. Matlab和Python 画矩阵的非零元分布图

    文章目录 前言 Matlab画矩阵的非零元分布图 程序 结果 Python画矩阵的非零元分布图 程序 结果 总结 前言 一般我们在进行数值计算时,经常会遇到求解如下等式的问题: Ax=bAx=b Ax ...

最新文章

  1. AI如何落地企业?UCloud三步走战略:Build,Train,Deploy
  2. js移除某个样式_js中如何移除css样式?
  3. python免费课程讲解-Python快速入门免费课程
  4. 新无限天空服务器,天空魔域3782版最新服务端(含网站程序)
  5. javascript --- js中prototype、__proto__、[[Propto]]、constructor的关系
  6. 华强北出租5G手机,半小时3块钱,双11“秒杀利器”,十秒九中!
  7. pdo mysql 事务_PHP PDO对象如何确定它是否已经存在于MySQL事务中?
  8. php stripcslashes 转义,stripcslashes()
  9. EXT.NET高效开发(二)——封装函数
  10. 2022最新酷盒iApp源码V7.8版+内置超多功能
  11. java手机号码加密_用户名-手机号加密特殊处理
  12. gps面积测量仪手机版下载安装_gps面积测量仪手机版下载-GPS距离面积测量仪 安卓版v3.5.7-PC6安卓网...
  13. 再深一点:如何给女朋友解释什么是微服务?
  14. 驱动开发:断链隐藏驱动程序自身
  15. 简单制作一个Python聊天机器人
  16. 怎么写好文案?这些工具很好用
  17. 血污夜之仪式秘密巫师实验室收集策略
  18. 2019年的软件百强企业榜单
  19. 电脑重装系统word从第二页开始有页眉页脚如何设置
  20. Centos系统修改为静态ip

热门文章

  1. window下eclipse +cdt+cygwin做C,C++开发环境搭建 (转自:http://blog.csdn.net/thinkandchange/article/details/7935)
  2. Hibernate缓存和ehcache
  3. FreeMarker整合Spring 3
  4. Rotation Rose各部分的名称
  5. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(更快的RCNN:通过区域提议网络实现实时)
  6. day28:检测磁盘io|自定义时段查看tomcat 日记|打印城市名字|代码上线|统计网站并发量...
  7. 三、值类型与引用类型
  8. android社会化分享
  9. PHPer面试指南-前言
  10. MySQL索引的创建、删除和查看