一天一图学Python可视化(1):线性回归图
现代人的时间越来越碎片化,因此我们准备抛弃那种长篇大论的教程,希望大家每天花上几分钟就可以学到一个小窍门或者某种图的绘制方法。只要每天都认真看一遍文章,有时间的时候花几分钟练习一下,一段时间之后,相信大家就都成为Python可视化的高手啦!
接下来,我们目标不大,一天学习并掌握一个实用的小案例就够了!
回归图
今天,我们学习的是使用seaborn绘制回归图。
回归图主要用于表现两个变量之间的线性关系,一般情况下,它在散点图的基础上,会增加一条直线(也有可能是曲线),这条线就是statsmodels
中使用最小二乘法预测的两个变量的关系:y = ax + b
。
回归图有非常丰富的应用场景,比如:
- 我们想知道广告费和营收、净利润之间是否成正比;
- 我们想知道用户日均活跃时长与用户创建天数之间的关系是什么;
- 我们想知道用户的生命周期价值(LTV)与用户获取成本之间的关系;
- 我们想知道学生的日均学习时长与成绩之间的关系;
- ……
看来我们有更多的理由来学习回归图了,毕竟它是一个应用超广泛的图形!
我们先看一下代码和效果:
import seaborn as sns
sns.set(style="ticks")# Load the example dataset for Anscombe's quartet
df = sns.load_dataset("anscombe")# Show the results of a linear regression within each dataset
sns.lmplot(x="x", y="y", col="dataset", hue="dataset", data=df,col_wrap=2, ci=None, palette="muted", height=4,scatter_kws={"s": 50, "alpha": 1});
那么接下来我们就详细讨论下绘图过程的细节。
x
/y
/data
:前两个参数用于指定列名,第三个参数用于指定数据。在seaborn
中,我们会经常使用pandas DataFrame
格式的数据,seaborn
对于pandas
有极为良好的支持。col
/row
:用于指定图中行和列所对应的变量,比如我们用dataset
变量传递给col
,那么在我们的图中,由于dataset
变量有四个取值,因此每个取值对应的子数据集会被绘制到单独的一列,一共四列(这里看到的不是四列,我们下边会讲到为什么)。hue
:用于指定色彩变量,在我们这张图中,hue
变量也是dataset
,所以这四组数据会在被分到四列的同时,也被分别绘制成四种不同的颜色。col_wrap
:这个参数就是明明我们的dataset
变量有四种取值,但图中看起来还是两列的原因。这个参数指定了再达到多少列以后,会进行折行。我们在这里指定了2,因此我们将原本的4列转换成了2行*两列。ci
:confidence interval,置信区间。这个过程是使用自助采样法,对样本多次重复抽样,得到样本均值的分布,并将其95%的置信区间绘制出来。palette
:调色板,这个用于控制hue
变量所展示的颜色。在分类(离散)变量中,我们一般会指定一组不同色调的颜色(针对连续变量,我们经常会使用同一个颜色的不同亮度、饱和度来表现)。height
:注意,这里指的是每个子图的高度,如果还想控制宽度的话,那就要再指定aspect
参数来控制宽高比。scatter_kws
:字典形式,用于控制散点的更多细节。这一组参数会隐式地传入更底层的plt.scatter
函数中,因此这里可以输入任何plt.scatter
支持的参数。在这里,我们用size
和alpha
分别控制了散点的大小和透明度。
好了,今天我们学习了使用seaborn.lmplot()
来绘制回归图,它用于表现两个变量之间的线性关系。
你学会了吗?
一天一图学Python可视化(1):线性回归图相关推荐
- python如何绘制蜘蛛图_蜘蛛网图实现Python可视化的方法
数据可视化是数据科学或机器学习项目中十分重要的一环.通常,你需要在项目初期进行探索性的数据分析(EDA),从而对数据有一定的了解,而且创建可视化确实可以使分析的任务更清晰.更容易理解,特别是对于大规模 ...
- 跟小白学Python数据分析——绘制水球图
本文继续采用PyEcharts v1.x版本进行绘制水球图. 注:PyEcharts分为 v0.5.x 和 v1.x 两个大版本,v0.5.x 和 v1.x 间不兼容,v0.5.x是基于Python2 ...
- python入门到放弃恶搞图-学Python方法用错,直接从入门到放弃!
原标题:学Python方法用错,直接从入门到放弃! 从你开始学习编程的那一刻起,就注定了以后所要走的路-从编程学习者开始,依次经历实习生.程序员.软件工程师.架构师.CTO等职位的磨砺:当你站在职位顶 ...
- 用python画小黄人步骤图-学Python画画:应用Turtle库画一个蠢萌的小黄人
学Python画画:应用Turtle库画一个蠢萌的小黄人 前言: 还记得小黄人哪只蠢萌蠢萌的单眼小黄人?就是喜欢做什么事都喜欢逞能的那只,下面用Python来实现一下,正在逃跑的小黄人.进群:7003 ...
- python基础知识思维导图-总结 Python 知识点思维导图
本文主要涵盖了 Python 编程的核心知识(暂不包括标准库及第三方库). 按顺序依次展示了以下内容的一系列思维导图:基础知识,数据类型(数字,字符串,列表,元组,字典,集合),条件&循环,文 ...
- python画折线图代码-python绘制简单折线图代码示例
1.画最简单的直线图 代码如下: import numpy as np import matplotlib.pyplot as plt x=[0,1] y=[0,1] plt.figure() plt ...
- 折线图_Pyecharts数据可视化分析—折线图
1. 实验介绍 本实验主要介绍折线图理论与基于Python的折线图实现. 1.1. 实验目的 掌握折线图基本使用场景,使用Python的pyecharts模块实现折线图. 1.2. 知识点 折线图理论 ...
- python画饼图-从零开始学Python可视化(五): 饼图及环形图
我们之前已经接触过了饼图,它主要用于表现比例.份额类的数据,今天我们在样式上进行更多的探索. 我们以笔记本行业来作为例子.假设笔记本电脑行业有ABCD五家公司,他们在2017年的国内市场份额分别为45 ...
- python动态横道图_Python数据可视化:甘特图画法
大家好,我是一名Python数据分析师,我想把自己转行成功之路上的经验分享给大家,由此就有了我的人工智能四部曲:<15天学会Python编程>.<每天10分钟,用Python学数据分 ...
最新文章
- springboot+vue前后端分离实现宿舍管理系统
- 实验七——函数定义及调用总结
- 一直记不住window下面的盘符切换
- pca 和lda区别
- Java 中的进程与线程的实现
- python语法元素合集
- python webpy 开发文档_Python webpy微信公众号开发之 回复图文消息
- 初探微信小程序渗透测试
- scratch小游戏2048
- 通用能力-判断推理题
- ckfinder 配置 php,GitHub - itxq/ckfinder: CkFinder3.5.1 for PHP 优化版 (添加又拍云存储)...
- Mac 谷歌Chrome设置浏览器跨域
- 传奇服务器 地图文件,[技术贴]地图配置文件
- qlv转MP4,基于windows命令实现
- 如何安装cadence 软件
- 18行的python快递查询
- 玉米社:竞价推广关键词出价原则,注意这几点!
- IIS 部署php程序
- Stata:面板数据,一般加上个体固定效应和时间固定效应
- Python实现将位图描摹为彩色矢量 svg 图片的源代码,Python实现位图转彩色矢量代码