散点图

如果我们想研究两个数字变量之间的关系,通常会选择散点图。在散点图中,每个数据点都单独表示为一个点,x 轴对应一个特征值,y 轴对应另一个特征值。创建散点图的一个基本方式是利用 Matplotlib 的 scatter 函数:

plt.scatter(data = df, x = 'num_var1', y = 'num_var2')

可以在这两个变量之间看到一个基本的正向关系,x 轴的值越高,y 轴上的变量值也增大。

替代方法

Seaborn 的 regplot 函数会创建散点图并进行回归函数拟合:

sb.regplot(data = df, x = 'num_var1', y = 'num_var2')

默认情况下,回归函数是线性的,并包含带阴影的回归估计置信区域。在这种情况下,因为看起来像 log(y) ~ x 关系,因此用原始单位绘制回归线不合适。如果我们不关心回归线,那么可以在 regplot 函数调用中设置 reg_fit = False。否则,如果我们想对观察到的数据关系绘制回归线,需要变换数据,如上节课中所述。

def log_trans(x, inverse = False):

if not inverse:

return np.log10(x)

else:

return np.power(10, x)

sb.regplot(df['num_var1'], df['num_var2'].apply(log_trans))

tick_locs = [10, 20, 50, 100, 200, 500]

plt.yticks(log_trans(tick_locs), tick_locs)

注意,x 轴和 y 轴值可以直接设为 Series 或数组,而不是参考 dataframe 中的列。

为者常成,行者常至

python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...相关推荐

  1. python建站部署_SpringBoot入门建站全系列(三十二)接入xxl-job分布式任务调度平台...

    SpringBoot入门建站全系列(三十二)接入xxl-job分布式任务调度平台 一.概述 XXL-JOB是一个轻量级分布式任务调度平台,其核心设计目标是开发迅速.学习简单.轻量级.易扩展.现已开放源 ...

  2. python绘图矩阵散点图_Python实践:seaborn的散点图矩阵(Pairs Plots)可视化数据

    如何快速创建强大的可视化探索性数据分析,这对于现在的商业社会来说,变得至关重要.今天我们就来,谈一谈如何使用python来进行数据的可视化! 一旦你有了一个很好的被清理过的数据集,下一步就是探索性数据 ...

  3. excel两个指标相关性分析_用Excel做相关性分析

    一.概念理解 相关关系:变量之间存在着的非严格的不确定的关系,对它们进行深层次的分析,观察它们的密切程度. 相关性分析:对变量之间相关关系的分析,即相关性分析.其中比较常用的是线性相关分析,用来衡量它 ...

  4. python 三维散点图拟合曲面_python 绘图---2D、3D散点图、折线图、曲面图

    python中绘制2D曲线图需要使用到Matplotlib,Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形,通过 Matplo ...

  5. 多元相关性分析_电子健康素养与中青年脑卒中患者健康行为的相关性分析

    电子健康素养与中青年脑卒中患者健康行为的相关性分析 戴春花 1, 王雪 1, 曾杏梅 1, 徐鹏翔 2, 冯基高 2 [ 摘要] 背景 近年来电子健康素养在慢性病患者的管理中受到广泛关注, 但目前关于 ...

  6. spark 相关性分析_《Spark机器学习进阶实战》——2.3.2 相关性分析

    2.3.2 相关性分析 相关性分析是指通过分析寻找不同商品或不同行为之间的关系,发现用户的习惯,计算两个数据集的相关性是统计中的常见操作. MLlib提供了计算多个数据集两两相关的方法.目前支持的相关 ...

  7. python双y轴的折线图_python matplotlib实现双Y轴的实例

    python matplotlib实现双Y轴的实例 如下所示: import matplotlib.pyplot as plt import numpy as np x = np.arange(0., ...

  8. python可视化分析网易云音乐评论_Python数据可视化:网易云音乐歌单

    通过Python对网易云音乐华语歌单数据的获取,对华语歌单数据进行可视化分析. 可视化库不采用pyecharts,来点新东西. 使用matplotlib可视化库,利用这个底层库来进行可视化展示. 推荐 ...

  9. python关于包的题怎么做_Python自定义包引入

    python中的Module是比较重要的概念.常见的情况是,事先写好一个.py文 件,在另一个文件中需要import时,将事先写好的.py文件拷贝 到当前目录,或者是在中增加事先写好的.py文件所在的 ...

最新文章

  1. 无法显示验证码去掉html,后台登陆验证码无法显示
  2. Windows下安装Anaconda3与配置
  3. TCP/IP协议学习之TCP、IP篇
  4. 大话PHP设计模式:类自动载入、PSR-0规范、链式操作、11种面向对象设计模式实现和使用、OOP的基本原则和自动加载配置...
  5. SEO算法:如何通过PageRank算法判断SEO排序结果
  6. c 获取mysql安装路径_linux查看mysql安装路径
  7. [转载]如何决定要使用多少点来做FFT?(转载)
  8. vs code 开发企业级python_入股不亏!VS Code中最好用的Python扩展插件
  9. window安装python3后怎么用pyspark_pyspark:连接spark集群Windows环境搭建
  10. sas导出数据串行解决方案
  11. python安装包下载
  12. 寒冬不怕!印度互联网市场潜力巨大
  13. 帐号登录:oAuth2.0流程
  14. Android 10.0 去掉SystemUI中的电池图标显示
  15. Oracle PeopleSoft 登录,peoplesoft不能登录DB解决方法
  16. 2022年国庆节水篇
  17. 集成测试和单元测试覆盖率合并
  18. CentOS 6.5安装Nvidia显卡驱动
  19. 银行账户存储系统C++
  20. 51单片机数码管滚动显示学号_单片机数码管显示0到9程序代码

热门文章

  1. linux sd卡 自动挂载 mdev,mdev实现U盘和SD卡的自动挂载
  2. 在git项目误上传了本地idea配置文件,如何解决?
  3. QML 发光呼吸动画字体
  4. 一幅图看懂Python编程
  5. 学习PWM的一些总结
  6. matlab对图像进行均值滤波_用K均值进行图像分割
  7. java输入日期计算天数_(JAVA)输入年月日,计算日期是今年的第几天?
  8. python 判断线程状态_Python线程指南
  9. 物生政可以报计算机专业吗,新高考物生政组合好吗?高考物生政可以报什么专业?...
  10. linux 限制单个ip流量,centos 的單ip流量控制-CentOS下利用iptables限速及限制每IP連接數...