微信公众号:「Python读财」

如有问题或建议,请公众号留言

Seaborn是基于matplotlib的Python可视化库。 它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,不需要经过大量的调整就能使你的图变得精致。

注:所有代码均在IPython notebook中实现

boxplot

箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数及上下四分位数。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。图解如下:

接下来我们介绍Seaborn中的箱型图的具体实现方法,这是boxplot的API:

seaborn.boxplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, color=None, palette=None, saturation=0.75, width=0.8, dodge=True, fliersize=5, linewidth=None, whis=1.5, notch=False, ax=None, **kwargs)

我们从具体的实例出发

%matplotlib inline

import pandas as pd

import numpy as np

import seaborn as sns

import matplotlib.pyplot as plt

plt.rc("font",family="SimHei",size="15")  #解决中文乱码问题

本文所使用的数据集是鸢尾花卉数据集

data.head(6)

x,y:dataframe中的列名(str)或者矢量数据

data:dataframe或者数组

sns.boxplot(x=data["pw"],data=data)

palette:调色板,控制图像的色调

fig,axes=plt.subplots(1,2,sharey=True)

sns.boxplot(x="catagory",y="pw",data=data,ax=axes[0]) #左图

sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",ax=axes[1]) #右图

hue(str):dataframe的列名,按照列名中的值分类形成分类的条形图

sns.boxplot(x="color",y="pl",data=data,hue="catagory",palette="Set3")

order, hue_order (lists of strings):用于控制条形图的顺序

sns.boxplot(x="catagory",y="pw",data=data,palette="Set3",order=[2,1,0])

orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

fig,axes=plt.subplots(2,1)

sns.boxplot(data=data,orient="v",palette="Set3",ax=axes[0])  #竖直显示

sns.boxplot(data=data,orient="h",palette="Set3",ax=axes[1])  #水平显示

fliersize:float,用于指示离群值观察的标记大小

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,ax=axes[0]) #fliersize默认为5

sns.boxplot(x="color",y="pl",data=data,fliersize=20,ax=axes[1])

whis: 确定离群值的上下界(IQR超过低和高四分位数的比例),此范围之外的点将被识别为异常值。IQR指的是上下四分位的差值。

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,whis=1,ax=axes[0])  #左图

sns.boxplot(x="color",y="pl",data=data,whis=2,ax=axes[1])  #右图

width: float,控制箱型图的宽度

fig,axes=plt.subplots(1,2)

sns.boxplot(x="color",y="pl",data=data,width=0.3,ax=axes[0])  #左图

sns.boxplot(x="color",y="pl",data=data,width=0.8,ax=axes[1])  #右图

violinplot

violinplot与boxplot扮演类似的角色,它显示了定量数据在一个(或多个)分类变量的多个层次上的分布,这些分布可以进行比较。不像箱形图中所有绘图组件都对应于实际数据点,小提琴绘图以基础分布的核密度估计为特征。具体用法如下:

seaborn.violinplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, bw='scott', cut=2, scale='area', scale_hue=True, gridsize=100, width=0.8, inner='box', split=False, dodge=True, orient=None, linewidth=None, color=None, palette=None, saturation=0.75, ax=None, **kwargs)

实例所用的数据集如下:

data.head(6)

在这里就不再介绍x,y,hue,data,order,hue_order,palette 参数的用法,这些参数的用法和之前介绍的图形的用法是一样的,如有需要可以查看之前的内容。

先来画一个小提琴图:

sns.violinplot(x="gender",y="age",data=data)

split: 将split设置为true则绘制分拆的violinplot以比较经过hue拆分后的两个量:

fig,axes=plt.subplots(2,1)

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,ax=axes[0]) #上图,拆分后的图

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",ax=axes[1])  #下图

scale_hue:bool,当使用色调变量(hue参数)嵌套小提琴时,此参数确定缩放是在主要分组变量(scale_hue = true)的每个级别内还是在图上的所有小提琴(scale_hue = false)内计算出来的。

fig,axes=plt.subplots(2,1)

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=False,ax=axes[0]) #上图

ax=sns.violinplot(x="color",y="age",data=data,hue="smoker",split=True,scale_hue=True,ax=axes[1])  #下图

orient:"v"|"h" 用于控制图像使水平还是竖直显示(这通常是从输入变量的dtype推断出来的,此参数一般当不传入x、y,只传入data的时候使用)

fig,axes=plt.subplots(2,1)

sns.violinplot(data=data[["height","weight","age"]],orient="v",ax=axes[0]) #上图

sns.violinplot(data=data[["height","weight","age"]],orient="h",ax=axes[1]) #下图

inner:控制violinplot内部数据点的表示,有'box','quartile','point','stick'四种方式。

fig,axes=plt.subplots(2,2)

sns.violinplot(x="color",y="age",data=data,inner="box",ax=axes[0,0])  #钢琴图内显示箱型图(左上)

sns.violinplot(x="color",y="age",data=data,inner="quartile",ax=axes[0,1])  #钢琴图内显示四分位数线(右上)

sns.violinplot(x="color",y="age",data=data,inner="point",ax=axes[1,0])  #钢琴图内显示具体数据点(左下)

sns.violinplot(x="color",y="age",data=data,inner="stick",ax=axes[1,1])  #钢琴图内显示具体数据棒(右下)

scale: 该参数用于缩放每把小提琴的宽度,有'area','count','width'三种方式

fig,axes=plt.subplots(3,1)

sns.violinplot(x="color",y="age",data=data,scale="area",ax=axes[0]) #如果为"area",每把小提琴将有相同的面积(上图)

sns.violinplot(x="color",y="age",data=data,scale="count",ax=axes[1])  #如果为"count",小提琴的宽度将根据该小组中观察的数量来缩放(中图)

sns.violinplot(x="color",y="age",data=data,scale="width",ax=axes[2])  #如果为"age",每把小提琴将有相同的宽度(下图)

cut: float,距离,以带宽大小为单位,以控制小提琴图外壳延伸超过内部极端数据点的密度。设置为0以将小提琴范围限制在观察数据的范围内(即,在ggplot中具有与trim = true相同的效果)

fig,axes=plt.subplots(2,1)

sns.violinplot(x="age",y="gender",data=data,ax=axes[0]) #上图

sns.violinplot(x="age",y="gender",data=data,cut=0,ax=axes[1])  #下图

width: float,控制钢琴图的宽度(比例)

fig,axes=plt.subplots(2,1)

sns.violinplot(x="color",y="age",data=data,ax=axes[0],width=0.5)  #上图

sns.violinplot(x="color",y="age",data=data,ax=axes[1],width=0.9)  #下图

这已经是Seaborn入门系列的第三篇文章了,相信大家已经大概了解Seaborn的作图过程,也可以体会到用Seaborn作图相比于matplotlib更加简单。以上内容是我结合官方文档和自己的一点理解写成的,有什么错误大家可以指出来并提提意见,共同交流、进步,也希望我写的这些能够给阅读完本文的你或或少的帮助!

关注我的公众号「Python读财」,后台回复「py」即可获取Python学习资源礼包,还有Python学习交流群哦!

本作品采用《CC 协议》,转载必须注明作者和本文链接

python boxplot orient_Python 可视化 | Seaborn5 分钟入门 (三)——boxplot 和 violinplot相关推荐

  1. python boxplot orient,Python可视化 | Seaborn5分钟入门(三)——boxplot和violinplot

    微信公众号:「Python读财」 如有问题或建议,请公众号留言 Seaborn是基于matplotlib的Python可视化库. 它提供了一个高级界面来绘制有吸引力的统计图形.Seaborn其实是在m ...

  2. python 竖线 绘图_Python可视化 | Seaborn5分钟入门(二)——barplot countplot

    Seaborn是基于matplotlib的Python可视化库. 它提供了一个高级界面来绘制有吸引力的统计图形.Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图 ...

  3. python中seaborn画swarm图_Python可视化 | Seaborn5分钟入门(四)——stripplot和swarmplot

    微信公众号:「Python读财」 如有问题或建议,请公众号留言 Seaborn是基于matplotlib的Python可视化库. 它提供了一个高级界面来绘制有吸引力的统计图形.Seaborn其实是在m ...

  4. Python使用matplotlib可视化小提琴图、seaborn中的violinplot函数可视化多分类变量的小提琴图(Violin Plot)

    Python使用matplotlib可视化小提琴图.seaborn中的violinplot函数可视化多分类变量的小提琴图(Violin Plot) 目录

  5. ECharts实现数据可视化 “ 10分钟入门 “ 教程(超详细)

    (起源!)ECharts介绍 官网链接:

  6. Python Matplotlib数据可视化绘图之(六)————图片大小、颜色、标题、纵横坐标、画布和绘图区域背景颜色、Legend(图例)等的参数设置详解

    文章目录 前言 一.图片大小的设定和调节 1. 三种调整matplotlib图片大小的方法 1.1 plt.figure(figsize=(n, n)) 1.1.1 代码如下: 1.1.2 输出结果如 ...

  7. python 三分钟入门_Cython 三分钟入门教程

    作者:perrygeo 译者:赖勇浩(http://laiyonghao.com) 原文:http://www.perrygeo.net/wordpress/?p=116 我最喜欢的是Python,它 ...

  8. python数据分析可视化实例-Python数据分析与可视化从入门到精通

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...

  9. python可视化数据分析-Python数据分析与可视化从入门到精通

    (1)没有高深理论,每章都以实例为主,读者参考书中源码运行,就能得到与书中一样的结果.(2)专注于Python数据分析与可视化操作中实际用到的技术.相比大而全的书籍资料,本书能让读者尽快上手,开始项目 ...

最新文章

  1. 基于深度神经网络的图像缺损修复方法综述
  2. const应用和作用
  3. javase基础socket编程之局域网聊天,局域网文件共享
  4. 几句话就能让你明白:IPv6与Voip
  5. 深度学习与概率、统计的有趣探讨
  6. [相关总结性文章] 写给即将入行的程序员的一封信
  7. bigdecimal 保留两位小数_Python的保留小数及对齐
  8. linux windows文件 编码_Mac, Windows和Linux电脑之间如何快速传输文件
  9. 使用jQuery来实现一个简单的ajax请求
  10. es6 Generator函数概述
  11. 三大运营商2月份运营数据发布:超过一半的中国人都在用移动
  12. Apex里面的retainAll
  13. Swift游戏实战-跑酷熊猫 02 创建熊猫类
  14. java socket ipv6_Java支持IPv6研究
  15. 你控制不了情绪,怎么过得好这一生?
  16. java white case语句_JAVA基础(一)
  17. Css、less和Sass(SCSS)的区别
  18. tl-wdr5620虚拟服务器设置,TP-Link TL-WDR5620路由器手机怎么设置?
  19. 微信群满100人后无法扫码进群?你们要的解决方法来了!
  20. UVA10859 放置街灯 Placing Lampposts(树状DP)

热门文章

  1. “阿里巴巴小程序繁星计划”:20亿扶持200万小程序开发者和100万商家
  2. Hadoop迁移MaxCompute神器之DataX-On-Hadoop使用指南
  3. 阿里云AI如何助攻世界杯?视频集锦背后的技术实践
  4. 阿里云 ESS 弹性伸缩服务新功能来袭,更全面、更自动化的使用体验
  5. 在 Kubernetes 集群中使用 MetalLB 作为 LoadBalancer(下)
  6. 华为云WeLink正式发布,这是更懂企业的智能工作平台一枚!
  7. OpenStack精华问答 | OpenStack的目标是什么?
  8. 大数据里的婚姻:婚后两年,出轨高峰……
  9. mysql基础和高级整理_mysql基础整理01
  10. python怎么把列表转换成字符串_如何将字节列表(unicode)转换为Python字符串?