python 绘制箱型图_Python数据可视化:Seaborn 绘制箱形图
课程总览:
Seaborn是Python中使用最广泛的数据可视化库之一,作为Matplotlib的扩展。它提供了一个简单、直观、但高度可定制的数据可视化应用程序接口(API)。
在本教程中,我们将看看如何在 Seaborn 中绘制一个箱形图。
箱形图(Box-plot),是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比 较。箱线图的绘制方法是:先找出一组数据的上边缘、下边缘、中位数和两个四分位数;然后, 连接两个四分位数画出箱体;再将上边缘和下边缘与箱体相连接,中位数在箱体中间。
导入数据
我们需要选择具有连续特征的数据集来创建箱线图,因为箱线图显示连续变量的汇总统计数据——数据集的中位数和范围。我们将使用森林火灾数据集:,数据连接如下:
先导入我们需要使用的模块:
我们使用Pandas来读取CSV文件,并通过打印其前面几行数据来检查数据包含项。另外,我们要检查数据集是否包含任何缺失的值:
第二个print语句返回False,这意味着没有任何丢失的数据。如果有,我们就必须处理丢失的值。
在我们检查数据集的一致性之后,我们想要选择我们想要可视化的连续特征。为了方便起见,我们将它们保存为自己的变量:
用 Seaborn 绘制箱形图
现在我们已经加载了数据并选择了我们想要可视化的变量,我们可以创建箱形图了!
我们可以通过使用 Seaborn 的 boxplot 函数来创建箱形图。我们传入数据集以及我们想要可视化的变量:
运行上面程序,绘制如下图:
如果我们想看分类型的数据分布,如每周不同天数的DMC的分布,可以采用如下方式:
运行上面程序,绘制如下图:
如果我们想同时可视化多个列,我们应该为x和y参数提供什么呢?
我们可以创建一个新的数据集,这个数据集值包含我们想要可视化的变量,并使用 melt() 方法传到 data 的参数中,提供诸如 x='variable' 和 y='value' 这样的标签:
运行上面程序,绘制如下图:
自定义箱形图
更改颜色
Seaborn会自动将不同的颜色分配给不同的变量,这样我们就可以很容易地从视觉上区分它们。不过,如果我们想要指定它们,我们也可以提供要使用的颜色列表。
在选择了一个带有十六进制值的颜色列表后,我们可以将它们传递到 palette 参数:
运行上面程序,绘制如下图:
定制轴标签
我们可以使用Seaborn轻松地调整x轴和y轴标签,如更改字体大小,更改标签,或旋转它们使标记更容易阅读:
运行上面程序,绘制如下图:
排序
如果我们想要以特定的顺序查看这些变量,我们可以使用order参数,并按照你想要的顺序提供列名:
运行上面程序,绘制如下图:
包含子图
如果我们想要将各个特性的图分离到它们自己的子图中,我们可以通过使用Matplotlib中的subplot函数创建图形和轴来实现这一点。然后,我们使用axis对象并通过它们的索引访问它们。boxplot()函数接受一个ax参数,指定它应该绘制在哪个坐标轴上:
运行上面程序,绘制如下图:
带有数据点的箱形图
我们甚至可以将数据点覆盖到箱形图上,以便看到包含该分布的点的分布和样本,以及更多细节。
运行上面程序,绘制如下图:
python 绘制箱型图_Python数据可视化:Seaborn 绘制箱形图相关推荐
- python画厢式图_Python数据可视化:箱线图多种库画法
概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...
- 数据科学之数据可视化----Seaborn绘制小提琴图
哈喽各位小伙伴,这篇文章我们来介绍下使用Seaborn绘制小提琴图. 小提琴图长这样 小提琴图定义 还是的,在学习之前我们来了解小提琴图.小提琴图是箱图和密度图的一种结合图形.左右越宽代表当前数据量越 ...
- python panda 库箱线图_Python数据可视化:箱线图多种库画法
概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...
- python生成热度图_Python数据可视化 热力图
不要停止奔跑,不要回顾来路,来路无可眷恋,值得期待的只有前方.--<马男波杰克> 一.matplotlib绘制热力图 Matplotlib是Python著名的2D绘图库,该库仿造 ...
- python绘制箱型图+打印异常值
箱型图+打印异常值 写在最前面 代码 写在最前面 读取csv文件,绘制箱型图(竖着的),并打印出所有异常值. 更新conda及所有库 conda update -n base -c https://m ...
- python数据可视化之美源码_Python数据可视化之美-专业图
Python数据可视化之美 专业图表绘制指南 作 者:张杰 著 定 价:129 出 版 社:电子工业出版社 出版日期:2020年03月01日 页 数:303 装 帧:平装 ISBN:97871 ...
- python做动态折线图_Python数据可视化 pyecharts实现各种统计图表过程详解
1.pyecharts介绍 Echarts是一款由百度公司开发的开源数据可视化JS库,pyecharts是一款使用python调用echarts生成数据可视化的类库,可实现柱状图,折线图,饼状图,地图 ...
- python pyecharts 折线图_Python数据可视化之pyecharts实现各种图表
之前的一篇文章介绍了使用Matplotlib实现各种统计图表,Python数据可视化之Matplotlib实现各种图表.这篇文章就介绍使用pyecharts实现各种统计图表. 1.pyecharts介 ...
- python画误差图_Python数据可视化:如何创建误差图
一图胜千言,使用Python的matplotlib库,可以快速创建高质量的图形. 这是Python数据可视化的系列短篇,针对初级和中级用户,将理论和示例代码相结合,使用matplotlib, seab ...
- python动态横道图_Python数据可视化:甘特图画法
大家好,我是一名Python数据分析师,我想把自己转行成功之路上的经验分享给大家,由此就有了我的人工智能四部曲:<15天学会Python编程>.<每天10分钟,用Python学数据分 ...
最新文章
- 就在刚刚!阿里达摩院刷新纪录,超越微软、Facebook!
- 系统维护For流星无语
- html5后代选择符,css选择符有哪些?哪些属性可以继承?
- VS2005~VS2022,那些年用过的VS,致敬,青春!
- 配置源码管理工具(2)
- HTML5/CSS3基础
- 10 有关业务/事件类型WQ在年2021的号码范围不存在
- 卡尔曼滤波算法及C语言实现(转载)
- qml入门学习(一):hello world
- java 通过eclipse编辑器用mysql尝试 连接数据库
- 专家:苹果有能力打造Mac芯片但不会去做
- [RN] React Native 使用 Redux 比较详细和深刻的教程
- SpringBoot❤SpringClould常用注解史诗级汇总
- C# 3.0语言新特性(语言规范):4 对象和集合初始化器
- c语言中的三角函数公式,tan三角函数公式有哪些
- 安全提示:勒索病毒漏洞与CPU漏洞务必小心
- 易语言逐条读access数据_易语言数据库教程之ACCESS数据库全操作
- 世间所有,逃不过一个“缘”字
- PlatformIO使用Arduino[Ticker]库(ESP8266)
- 怎么把html格式转换成数字,Excel文本格式怎么转化成数字格式 excel文本转化数字格式教程...
热门文章
- wordpress后台打开速度非常慢怎么办
- 解决服务器上中文显示乱码问题
- 期权Greek之rho【python复现】
- 自学单片机是否先学c语言,学习单片机需要先学好C语言再去学单片机吗
- pyqt5-事件机制
- 计算机毕业设计SSM大学生体检管理系统【附源码数据库】
- 使用viewer实现图片预览
- 不会英语能学java_不会英语可以学java吗 不会英语怎么学java?
- C++后台开发面试题总结(涉及C++基础、多线程多进程、网络编程等)
- SPI配置高精度采集8通道24位ADS1256(卷一---datasheet阅读总结篇)