1)

箱线图,又称箱形图(boxplot)或盒式图,不同于一般的折线图、柱状图或饼图等传统图表,只是数据大小、占比、趋势等等的呈现,其包含一些统计学的均值、分位数、极值等等统计量,因此,该图信息量较大,不仅能够分析不同类别数据平均水平差异(需在箱线图中加入均值点),还能揭示数据间离散程度、异常值、分布差异等等。

在python中常用matplotlib的boxplot来绘制,最简单绘制的如下:

import numpy as np

import matplotlib.pyplot as plt

import pandas as pd

np.random.seed(2) #设置随机种子

df = pd.DataFrame(np.random.rand(5,4),

columns=['A', 'B', 'C', 'D'])#先生成0-1之间的5*4维度数据,再装入4列DataFrame中

df.boxplot() #也可用plot.box()

plt.show()

从图形可以看出,A、B、C、D四组数A、D数据较集中(大部分在上下四分位箱体内),但都有异常值,C的离散程度最大(最大值与最小值之间距离),以均值为中心,B分布都有明显右偏(即较多的值分布在均值的右侧),A、C则有明显左偏。

(2)

从分析的角度来说,上面boxplot最初始图形已经够用,但是在matplotlib库下boxplot函数中包含n多参数,涉及到对框的颜色及形状、线段线型、均值线、异常点的形状大小等等设置,由于大多并不常用,用了几个常用参数,作图如下:

df.boxplot(sym='r*',vert=False,patch_artist=True,meanline=False,showmeans=True)

plt.show()

其中,sym='r*',表示异常点的形状,

vert=False,表示横向还是竖向(True),,

patch_artist=True,(上下四分位框内是否填充,True为填充)

meanline=False,showmeans=True,是否有均值线及其形状,meanline=True时,均值线也像中位数线一样是条红色线段,这样容易与中位数线混淆。

另外,还有其他参数,比如notch表示中间箱体是否缺口,whis为设置数据的范围,showcaps、showbox是否显示边框,可以参见

http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.boxplot,如该网页中图形:

左上图是默认图形,中上、右上是显示均值点及形状,左下是是否显示箱体边框,中下是带缺口的箱体,右下是是否显示异常值。

(3)

前边说过,很多参数使用很少,但对于图形来说,可能还能用到的就是美化,比如各条线的颜色,粗细程度等等。这里可用for循环来构造。

f=df.boxplot(sym='r*',patch_artist=True)

for box in f['boxes']:

# 箱体边框颜色

box.set( color='#7570b3', linewidth=2)

# 箱体内部填充颜色

box.set( facecolor = '#1b9e77' )

for whisker in f['whiskers']:

whisker.set(color='r', linewidth=2)

for cap in f['caps']:

cap.set(color='g', linewidth=3)

for median in f['medians']:

median.set(color='DarkBlue', linewidth=3)

for flier in f['fliers']:

flier.set(marker='o', color='y', alpha=0.5)

plt.show()

其中,boxes, 是25分位值和75分位值构成的box,

medians, 是中位值的横线, 每个median是一个Line2D对象

whiskers, 是指从box 到error bar之间的竖线.

fliers, 是指error bar线之外的离散点.

caps, 是指error bar横线.

means, 是均值的横线,

(4)

还可以做子图,如我们在最开始的DataFrame数据中加入分类数据列:

df['E'] = np.random.choice(['X', 'Y'], size=20)#加入以X、Y随机分类的E列

print(df)

plt.figure()

df.boxplot(by='E')

plt.show()

这样我们就可以比较,不同类别X、Y在同一列下的数据分布情况及其差异。

python多个箱线图_箱线图Python相关推荐

  1. arcgis批量出图python代码_【GIS进阶】ArcGIS批量出图_定义出图

    今天的文章是浩哥投稿!!! 下图是我欢呼雀跃的样子~~~~~ 本文亮点: 所有步骤都是用ArcGIS中各种工具和软件操作组合,未使用Arcpy与Python等需要使用代码的工具! 这次的这个批量出图又 ...

  2. python箱线图_箱线图(Python代码)

    箱线图 理论:懒得介绍了... 用五位数描述数据 能够准确稳定地描绘出数据的离散分布情况,不受异常值影响. 不能精确地衡量数据分布的偏态和尾重程度:对于批量比较大的数据,反映的信息更加模糊以及用中位数 ...

  3. python pyplot k线图_量化之路-python绘图-使用matplotlib绘制股票K线图(附代码)

    最近不知道在瞎忙什么,学习速度有点慢,更新也比较少,需要反思一下. 在学习完python爬虫和获取股票数据技能后,接下来需要将数据输出称为图形,以便查看趋势,以及分析趋势. 重新梳理下需要学会的技能步 ...

  4. python分箱统计个数_【数据处理】python变量分箱常见手法:分类型、数值型、卡方、自定义...

    """ 分箱逻辑: 1.类别型特征: 1)类别数在5个以下,可以直接根据类别来分箱 (binning_cate) 2)类别数在5个以上,建议做降基处理,再根据降基后的类别 ...

  5. python编程思维导图_用来梳理 Python 编程核心知识15张思维导图

    原标题:用来梳理 Python 编程核心知识15张思维导图 小编这次在逛论坛的时候,无意中发现了一份python的武功秘籍,也就是一份思维导图,堪称业界经典! 思维导图可以有力地激发你的联想,通过一个 ...

  6. python画画用哪库好_小白开始学Python最著名的绘图库

    原标题:小白开始学Python最著名的绘图库 这是菜鸟学Python的第101篇原创文章 数据分析里面可视化是重要的环节,辛苦把数据采集,然后经历了很多工序的清洗之后,最后要展现给用户,最好的方法就是 ...

  7. python中的画布背景设置_教你用python画图—Turtle详细教程

    Turtle模块绝对是吸引非专业代码开发者人员学习python入门的好工具 通过turtle几行代码的执行软件就会画出漂亮的图形,美观而且有成就感,这样一下子对python编程就产生了兴趣. 这些漂亮 ...

  8. 编写python程序一年365天_编写第一个Python程序

    无论读者使用的是哪种操作系统,相信都已经安装好了 Python 环境,可以通过命令行窗口或者 Python 自带的 IDLE 成功启动交互式解释器(如图所示). 本节将带领读者正式编写第一个 Pyth ...

  9. python培训的课时是多久_如何快速学习python,学习python的最短时间是多久?

    在我们即将迈入python培训课堂之前,你肯定很关注学习python的最短时间是多久,怎样才能快速学习python等问题,今天就为大家详细地回答一下这个问题,希望对你有所帮助! 这篇文章将为你的自学之 ...

最新文章

  1. Delphi的彩蛋 (好像Delphi5~Delphi7都可以)
  2. 中国移动选择博科NFV软件设备来支持“互联网+”使命
  3. Warning: post-commit hook failed (exit code 255) with no output.
  4. 上下文对象及servletContext接口
  5. linux 指定库名 登录mysql_数据库学习笔记之MySQL(01)
  6. 升级到win10,安装visualstudio ,80端口被系统服务占用的解决
  7. Spring 核心价值
  8. 关于font-size对垂直居中影响的问题
  9. 为今天的光纤检测选择光纤示波器
  10. 友盟消息推送UPush
  11. 【引用】窗口处理技巧大全 vb(窗体控件)
  12. codeforces 112APetya and Strings(字符串水题)
  13. 图像语义分割(15)-ConvCRFs:用于语义分割的卷积条件随机场
  14. 矿池如何给矿机下发任务
  15. discuz mysql语句_discuz 数据库插入
  16. js-鼠标经过显示下拉菜单
  17. 字谜游戏Java程序实现
  18. 板载SoC与插槽CPU
  19. 斐讯路由器虚拟服务器怎么设置,斐讯PSG1218路由器如何设置
  20. 游戏计算机电源,吃鸡一族看过来,游戏PC应配什么电源?

热门文章

  1. 10.5亿人次观看珠海航展!图扑助力展商数字孪生演示,太震撼!
  2. Swift开发 UIColor分类Hex颜色转换
  3. python绘制直线的垂线_Matplotlib:散点图中的垂直线
  4. python处理wps表格数据匹配_两个excel表格数据匹配wps-WPS怎样用VLOOKUP引用另一个表格的数据...
  5. 孙子兵法36计详解(完整版)
  6. 计算机编程教育资源,风变编程以科技实现教育普惠,俱进教育公平
  7. Python简单爬虫(以爬取豆瓣高分图书为例)
  8. MongoDB一篇从入门到实战
  9. 李慧芹数据结构代码(顺序表)
  10. Gnuplot特殊字符之Symbol字体