课程总览:

Seaborn是Python中使用最广泛的数据可视化库之一,作为Matplotlib的扩展。它提供了一个简单、直观、但高度可定制的数据可视化应用程序接口(API)。

在本教程中,我们将看看如何在 Seaborn 中绘制一个箱形图。

箱形图(Box-plot),是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。

导入数据

我们需要选择具有连续特征的数据集来创建箱线图,因为箱线图显示连续变量的汇总统计数据——数据集的中位数和范围。我们将使用森林火灾数据集:,数据连接如下:

先导入我们需要使用的模块:

我们使用Pandas来读取CSV文件,并通过打印其前面几行数据来检查数据包含项。另外,我们要检查数据集是否包含任何缺失的值:

第二个print语句返回False,这意味着没有任何丢失的数据。如果有,我们就必须处理丢失的值。

在我们检查数据集的一致性之后,我们想要选择我们想要可视化的连续特征。为了方便起见,我们将它们保存为自己的变量:

用 Seaborn 绘制箱形图

现在我们已经加载了数据并选择了我们想要可视化的变量,我们可以创建箱形图了!

我们可以通过使用 Seaborn 的 boxplot 函数来创建箱形图。我们传入数据集以及我们想要可视化的变量:

运行上面程序,绘制如下图:

如果我们想看分类型的数据分布,如每周不同天数的DMC的分布,可以采用如下方式:

运行上面程序,绘制如下图:

如果我们想同时可视化多个列,我们应该为x和y参数提供什么呢?

我们可以创建一个新的数据集,这个数据集值包含我们想要可视化的变量,并使用 melt() 方法传到 data 的参数中,提供诸如 x='variable' 和 y='value' 这样的标签:

运行上面程序,绘制如下图:

自定义箱形图

更改颜色

Seaborn会自动将不同的颜色分配给不同的变量,这样我们就可以很容易地从视觉上区分它们。不过,如果我们想要指定它们,我们也可以提供要使用的颜色列表。

在选择了一个带有十六进制值的颜色列表后,我们可以将它们传递到 palette 参数:

运行上面程序,绘制如下图:

定制轴标签

我们可以使用Seaborn轻松地调整x轴和y轴标签,如更改字体大小,更改标签,或旋转它们使标记更容易阅读:

运行上面程序,绘制如下图:

排序

如果我们想要以特定的顺序查看这些变量,我们可以使用order参数,并按照你想要的顺序提供列名:

运行上面程序,绘制如下图:

包含子图

如果我们想要将各个特性的图分离到它们自己的子图中,我们可以通过使用Matplotlib中的subplot函数创建图形和轴来实现这一点。然后,我们使用axis对象并通过它们的索引访问它们。boxplot()函数接受一个ax参数,指定它应该绘制在哪个坐标轴上:

运行上面程序,绘制如下图:

带有数据点的箱形图

我们甚至可以将数据点覆盖到箱形图上,以便看到包含该分布的点的分布和样本,以及更多细节。

运行上面程序,绘制如下图:

python 绘制箱型图_Python数据可视化:Seaborn 绘制箱形图相关推荐

  1. python画厢式图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  2. 数据科学之数据可视化----Seaborn绘制小提琴图

    哈喽各位小伙伴,这篇文章我们来介绍下使用Seaborn绘制小提琴图. 小提琴图长这样 小提琴图定义 还是的,在学习之前我们来了解小提琴图.小提琴图是箱图和密度图的一种结合图形.左右越宽代表当前数据量越 ...

  3. python panda 库箱线图_Python数据可视化:箱线图多种库画法

    概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...

  4. python生成热度图_Python数据可视化 热力图

    不要停止奔跑,不要回顾来路,来路无可眷恋,值得期待的只有前方.--<马男波杰克> ​​​​ 一.matplotlib绘制热力图 Matplotlib是Python著名的2D绘图库,该库仿造 ...

  5. python绘制箱型图+打印异常值

    箱型图+打印异常值 写在最前面 代码 写在最前面 读取csv文件,绘制箱型图(竖着的),并打印出所有异常值. 更新conda及所有库 conda update -n base -c https://m ...

  6. python数据可视化之美源码_Python数据可视化之美-专业图

    Python数据可视化之美 专业图表绘制指南 作  者:张杰 著 定  价:129 出 版 社:电子工业出版社 出版日期:2020年03月01日 页  数:303 装  帧:平装 ISBN:97871 ...

  7. python做动态折线图_Python数据可视化 pyecharts实现各种统计图表过程详解

    1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...

  8. python pyecharts 折线图_Python数据可视化之pyecharts实现各种图表

    之前的一篇文章介绍了使用Matplotlib实现各种统计图表,Python数据可视化之Matplotlib实现各种图表.这篇文章就介绍使用pyecharts实现各种统计图表. 1.pyecharts介 ...

  9. python画误差图_Python数据可视化:如何创建误差图

    一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形. 这是Python数据可视化的系列短篇,针对初级和中级用户,将理论和示例代码相结合,使用matplotlib, seab ...

  10. python动态横道图_Python数据可视化:甘特图画法

    大家好,我是一名Python数据分析师,我想把自己转行成功之路上的经验分享给大家,由此就有了我的人工智能四部曲:<15天学会Python编程>.<每天10分钟,用Python学数据分 ...

最新文章

  1. 就在刚刚!阿里达摩院刷新纪录,超越微软、Facebook!
  2. 系统维护For流星无语
  3. html5后代选择符,css选择符有哪些?哪些属性可以继承?
  4. VS2005~VS2022,那些年用过的VS,致敬,青春!
  5. 配置源码管理工具(2)
  6. HTML5/CSS3基础
  7. 10 有关业务/事件类型WQ在年2021的号码范围不存在
  8. 卡尔曼滤波算法及C语言实现(转载)
  9. qml入门学习(一):hello world
  10. java 通过eclipse编辑器用mysql尝试 连接数据库
  11. 专家:苹果有能力打造Mac芯片但不会去做
  12. [RN] React Native 使用 Redux 比较详细和深刻的教程
  13. SpringBoot❤SpringClould常用注解史诗级汇总
  14. C# 3.0语言新特性(语言规范):4 对象和集合初始化器
  15. c语言中的三角函数公式,tan三角函数公式有哪些
  16. 安全提示:勒索病毒漏洞与CPU漏洞务必小心
  17. 易语言逐条读access数据_易语言数据库教程之ACCESS数据库全操作
  18. 世间所有,逃不过一个“缘”字
  19. PlatformIO使用Arduino[Ticker]库(ESP8266)
  20. 怎么把html格式转换成数字,Excel文本格式怎么转化成数字格式 excel文本转化数字格式教程...

热门文章

  1. wordpress后台打开速度非常慢怎么办
  2. 解决服务器上中文显示乱码问题
  3. 期权Greek之rho【python复现】
  4. 自学单片机是否先学c语言,学习单片机需要先学好C语言再去学单片机吗
  5. pyqt5-事件机制
  6. 计算机毕业设计SSM大学生体检管理系统【附源码数据库】
  7. 使用viewer实现图片预览
  8. 不会英语能学java_不会英语可以学java吗 不会英语怎么学java?
  9. C++后台开发面试题总结(涉及C++基础、多线程多进程、网络编程等)
  10. SPI配置高精度采集8通道24位ADS1256(卷一---datasheet阅读总结篇)