概念

相关性分析:两个连续变量之间的关系检验。

Pearson相关系数:衡量两个变量的线性相关关系;

Spearman相关系数:衡量两个变量的线性相关关系,部分非线性的也可以衡量;

Kendall相关系数:衡量两个变量之间非线性相关关系;

0.3以上就是有相关性了,0.3~0.5就是有点强的,0.5以上就是很强的。

下面是分类变量,研究非连续的变量

卡方检验:两个分类变量的分析,是否相关,不能表示强弱。

Python例子

连续变量

代码如下:

from statsmodels.stats.anova import anova_lm
from statsmodels.formula.api import ols
import pandas as pd
from scipy import statsdf = pd.DataFrame([[20, 6000], [18, 6500], [17, 4500], [16, 3000], [21, 8000], [23, 18000],[30, 25000], [40, 18000], [55, 10000], [35, 19000], [26, 15000], [27, 8000]],columns=["age", "income"]
)if __name__ == '__main__':print(df[['age', 'income']].corr(method='pearson'), "\n")print(df[['age', 'income']].corr(method='spearman'), "\n")print(df[['age', 'income']].corr(method='kendall'), "\n")print(stats.chi2_contingency(df));pass

运行截图如下:

Python笔记-相关性分析(连续变量和分类变量)相关推荐

  1. 如何用python进行相关性分析_Python 数据相关性分析

    概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对 ...

  2. Python特征分析- 相关性分析

    Python特征分析- 相关性分析 相关性分析 引入库 图示初判 变量之间的线性相关性 散点图矩阵初判多变量间关系 Pearson相关系数 创建样本数据 正态性检验 → pvalue >0.05 ...

  3. Python数据相关性分析

    概述 在我们的工作中,会有一个这样的场景,有若干数据罗列在我们的面前,这组数据相互之间可能会存在一些联系,可能是此增彼涨,或者是负相关,也可能是没有关联,那么我们就需要一种能把这种关联性定量的工具来对 ...

  4. 基于相关性分析和主成分分析的变量筛选方法

    基于相关性分析和主成分分析的变量筛选方法 https://www.zybuluo.com/notmylove/note/1508052 主成分分析法 指标筛选 既然在课程专题四中讲到主成分分析法,那么 ...

  5. python 相关性分析_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  6. 如何用python进行相关性分析_Python文章相关性分析---金庸武侠小说分析

    最近常听同事提及相关性分析,正巧看到这个google的开源库,并把相关操作与调试结果记录下来. 小说集可以百度<金庸小说全集 14部>全(TXT)作者:金庸 下载下来. 需要整理好格式,门 ...

  7. 几组数据的相关性python_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  8. 如何用python进行相关性分析_使用 Python 查找分类变量和连续变量之间的相关性...

    在表格数据集上创建任何机器学习模型之前, 通常我们会检查独立变量和目标变量之间是否存在关系.这可以通过测量两个变量之间的相关性来实现.在 python 中, pandas 提供了一个函数 datafr ...

  9. 如何用python进行相关性分析_如何在python中检查连续变量和分类变量之间的相关性?...

    将分类变量转换为虚拟变量,并将变量放在numpy.array中.例如: data.csv:age,size,color_head 4,50,black 9,100,blonde 12,120,brow ...

最新文章

  1. SQL性能下降原因及Join查询
  2. 卷积神经网络CNN——图像卷积与反卷积(后卷积,转置卷积)
  3. Visual Assist x 无法自动补全Snippet提示的解决方法
  4. Python 2.7版本与3.6的不同
  5. html鼠标点击有手势出来,用原生js+css3撸的一个下拉手势事件插件
  6. 前后端分离开发模式下后端质量的保证 —— 单元测试
  7. Makefile的介绍与使用
  8. 限制在同一台电脑上只允许有一个用户登录系统
  9. 06-07 Jenkins中配置 Git 认证信息
  10. JavaScript隐式类型转换
  11. Exchange 2013反垃圾邮件功能
  12. oracle视频教程11g入门运维DBA性能优化OCP培训SQL数据库在线课程
  13. css如何设置动画,css3如何设置动画?css设置简单动画的方法
  14. 接口测试基础思维导图
  15. 1032:大象喝水 题解 信息学奥赛 NOIP
  16. ChinaVis2019中国可视化与可视分析大会成都站(7.21-7.24)
  17. Mac系统重置MySQL的 root密码
  18. 【Unity】Obi插件系列(六)——Obi Rope
  19. 毕业设计 单片机智能录音器设计与实现 - 物联网 嵌入式
  20. 制作PPT的基本技巧

热门文章

  1. AC自动机 - 关于Fail指针
  2. 玩转Linux文件描述符和重定向
  3. Python很简单,你一定能学会【加油!】
  4. XEIM 配置程序源代码
  5. 阿里女员工遭遇「杀猪盘」背后的思考
  6. 第七节:实战前必须掌握的10个指令(上)
  7. cass怎么把块打散命令_分解cass高程点即属性块
  8. dqn系列梳理_DQN是学习归纳出了策略,还是仅仅是memorize了大量的episodes?
  9. 深入浅出mfc_深入浅出HBase系列(一)
  10. 二分法采用五五分平均复杂度最小(相比四六分或三七分等)的定量证明方法