参考链接:https://www.jianshu.com/p/b2f70f867a4a

箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图、柱状图或饼图等传统图表,只是数据大小、占比、趋势等等的呈现,其包含一些统计学的均值、分位数、极值等等统计量,因此,该图信息量较大,不仅能够分析不同类别数据平均水平差异(需在箱线图中加入均值点),还能揭示数据间离散程度、异常值、分布差异等等。

在python中常用matplotlib的boxplot来绘制,最简单绘制的如下:

importnumpyasnpimportmatplotlib.pyplotaspltimportpandasaspdnp.random.seed(2)#设置随机种子df = pd.DataFrame(np.random.rand(5,4),columns=['A','B','C','D'])#先生成0-1之间的5*4维度数据,再装入4列DataFrame中df.boxplot()#也可用plot.box()plt.show()

Paste_Image.png

从图形可以看出,A、B、C、D四组数A、D数据较集中(大部分在上下四分位箱体内),但都有异常值,C的离散程度最大(最大值与最小值之间距离),以均值为中心,B分布都有明显右偏(即较多的值分布在均值的右侧),A、C则有明显左偏。

(2)

从分析的角度来说,上面boxplot最初始图形已经够用,但是在matplotlib库下boxplot函数中包含n多参数,涉及到对框的颜色及形状、线段线型、均值线、异常点的形状大小等等设置,由于大多并不常用,用了几个常用参数,作图如下:

df.boxplot(sym='r*',vert=False,patch_artist=True,meanline=False,showmeans=True)plt.show()

Paste_Image.png

其中,sym='r*',表示异常点的形状,

vert=False,表示横向还是竖向(True),,

patch_artist=True,(上下四分位框内是否填充,True为填充)

meanline=False,showmeans=True,是否有均值线及其形状,meanline=True时,均值线也像中位数线一样是条红色线段,这样容易与中位数线混淆。

另外,还有其他参数,比如notch表示中间箱体是否缺口,whis为设置数据的范围,showcaps、showbox是否显示边框,可以参见

Paste_Image.png

左上图是默认图形,中上、右上是显示均值点及形状,左下是是否显示箱体边框,中下是带缺口的箱体,右下是是否显示异常值。

(3)

前边说过,很多参数使用很少,但对于图形来说,可能还能用到的就是美化,比如各条线的颜色,粗细程度等等。这里可用for循环来构造。

f=df.boxplot(sym='r*',patch_artist=True)forboxinf['boxes']:# 箱体边框颜色box.set( color='#7570b3', linewidth=2)# 箱体内部填充颜色box.set( facecolor ='#1b9e77')forwhiskerinf['whiskers']:    whisker.set(color='r', linewidth=2)forcapinf['caps']:    cap.set(color='g', linewidth=3)formedianinf['medians']:    median.set(color='DarkBlue', linewidth=3)forflierinf['fliers']:    flier.set(marker='o', color='y', alpha=0.5)plt.show()

Paste_Image.png

其中,boxes, 是25分位值和75分位值构成的box,

medians, 是中位值的横线, 每个median是一个Line2D对象

whiskers, 是指从box 到error bar之间的竖线.

fliers, 是指error bar线之外的离散点.

caps, 是指error bar横线.

means, 是均值的横线,

(4)

还可以做子图,如我们在最开始的DataFrame数据中加入分类数据列:

df['E'] = np.random.choice(['X','Y'], size=20)#加入以X、Y随机分类的E列print(df)plt.figure()df.boxplot(by='E')plt.show()

Paste_Image.png

这样我们就可以比较,不同类别X、Y在同一列下的数据分布情况及其差异。

作者:博观厚积

链接:https://www.jianshu.com/p/b2f70f867a4a

來源:简书

简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

python双坐标轴箱线图_python matplotlib箱线图相关推荐

  1. python双坐标轴箱线图,python绘制双y轴、箱线图、概率分布三种图形及案例

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 本文演示了如何通过python绘制双y轴.箱线图.概率分布三种图形,并给出了具体案例源代码供 ...

  2. python如何为饼图添加标题_python – Matplotlib子图标题,图标题格式

    我将如何格式化下面的饼图子图,以便在图标题和子图标题之间有更多的空白区域.理想情况下,子图标题也会更接近实际的饼图本身. 我似乎无法在文档中找到任何可能启用此功能的内容,但我是matplotlib的新 ...

  3. python画图为什么运行不出来_python matplotlib画的图怎么显示不出来

    展开全部 最近2113在看<Python数据分析>这本书,而自5261己写代码一直用的是Pycharm,在练习的4102时候就碰到了plot()绘图不能显示出来的问题1653.网上翻了一下 ...

  4. python用matplotlib画人口图_Python+Matplotlib画contour图

    - 全文阅读3分钟 - 在本文中,你将学习到以下内容: 理解画contour图的数据结构 contour图的参数调节 如何添加colorbar 我们先假设x, y的取值范围如下: import mat ...

  5. python的contour怎么画虚线_Python+Matplotlib画contour图

    在本文中,你将学习到以下内容: 理解画contour图的数据结构 contour图的参数调节 如何添加colorbar 我们先假设x, y的取值范围如下: import matplotlib.pypl ...

  6. python堆叠面积图_06. Matplotlib 2 |折线图| 柱状图| 堆叠图| 面积图| 填图| 饼图| 直方图| 散点图| 极坐标| 图箱型图...

    1.基本图表绘制 plt.plot() 图表类别:线形图.柱状图.密度图,以横纵坐标两个维度为主 同时可延展出多种其他图表样式 plt.plot(kind='line', ax=None, figsi ...

  7. Python学习笔记——绘图设置(三)箱线图

    箱线图也称箱须图,是利用数据中的五个统计量:最小值.第一四分位数(25%).中位数.第三四分位数(75%).最大值来描述数据的一种方法,粗略的看出数据是否有对称性.分布的分散程度等信息,可以用来比较多 ...

  8. Py之matplotlib-seaborn :核密度估计(KDE)分析/奇异点分析/相关性分析简、绘图的高级进阶之高级图可视化(直方图-箱线图-密度图-小提琴图等)简介、代码实现之详细攻略

    Py之matplotlib-seaborn :核密度估计(KDE)分析/奇异点分析/相关性分析简.绘图的高级进阶之高级图可视化(直方图-箱线图-密度图-小提琴图等)简介.代码实现之详细攻略 目录 根据 ...

  9. python画相关系数矩阵图_pyhton中matplotlib箱线图的绘制(matplotlib双轴图、箱线图、散点图以及相关系数矩阵图))...

    //2019.07.23 1.箱形图,又称为盒式图,一般可以很好地反映出数据分布的特征,也可以进行多项数据之间分布特征的比较,它主要包含五个基础数据:中位数,两个上下分位数以及上下边缘线数据 其中的一 ...

最新文章

  1. CRNN维度变换的解释这样你也可以自定义CRNN了
  2. JavaScript那些事儿-不被知晓的预解释
  3. iris流程图_如何搭建一个简单的机器学习流水线?
  4. javaweb mysql 连接池 c3p0 配置_JavaWeb基础—数据库连接池DBCP、C3P0
  5. 学习分享会(2019.5.31)
  6. 耳机不支持android,安卓手机为什么不能用EarPods耳机 原因分析【图解】
  7. MySQL工作笔记-使用JPA映射mysql数据库要注意的地方
  8. 我的世界服务器指令修改拔刀剑,我的世界拔刀剑Mod 合成刀方法作用
  9. ubuntu没有指纹登录_Thinkpad在Ubuntu 20.04下使用指纹登陆
  10. centos7系统greenplum5.7集群详细安装配置文档-亲试通过
  11. 股票量化实盘交易接口如何做回测?
  12. 数据压缩_任务五_预测误差均方值推导及最小二乘法
  13. 爪哇语:??????? 字面量,分类和存储库
  14. 杭电ACM 2014:青年歌手大奖赛_评委会打分
  15. 电子行业测试软件,CAM软件技术在电子行业的应用测试验证
  16. jQuery小游戏之锅打灰太郎
  17. 怎样的人生才是好的呢?
  18. 贪玩蓝月服务器维护需多少时间,贪玩蓝月合区维护一次多久 | 手游网游页游攻略大全...
  19. [NodeJS实战][Vue实战]Vue-PixiJS [开箱可用][新手极简]
  20. OpenCV-实现天空变换(图像分割)

热门文章

  1. Unity shader 使用 半兰伯特 (Half-Lambert)漫反射会使得模型在没有直射光的情况下漆黑一片
  2. Python报错:AttributeError: module ‘__main__‘ has no attribute 的解决方案
  3. 基于ARM的嵌入式linux 内核的裁剪与移植
  4. foxmail(二)
  5. 【批处理DOS-CMD命令-汇总和小结】-切换工作目录,切换当前目录,进入指定文件夹(cd和chdir、pushd和popd)
  6. C#连接和使用MySQL数据库详细教程
  7. 微软开始善后 发布补丁告别Win10免费升级
  8. 揭秘华为数字化转型架构蓝图(多图详解,建议收藏)
  9. 计算机毕业设计ssm校园食堂订餐系统531p9系统+程序+源码+lw+远程部署
  10. 智能电表市场容量分析,年出货破亿颗