所需模块

numpy、pandas

相关系数计算

首先使用numpy.mean()方法求出均值,Xsd=numpy.std()方法求出标准差;

然后在通过(X-Xmean)/Xsd公式求出z分数;

最后通过numpy.sum(ZX*ZY)/len(X)

 1 import numpy
 2
 3 X=[
 4    12.5, 15.3, 23.2, 26.4, 33.5,
 5     34.4, 39.4, 45.2, 55.4, 60.9]
 6 Y=[
 7    21.2, 23.9, 32.9, 34.1, 42.5,
 8     43.2, 49.0, 52.8, 59.4, 63.5]
 9
10 #均值
11 Xmean=numpy.mean(X)
12 Ymean=numpy.mean(Y)
13
14 #标准差
15 Xsd=numpy.std(X)
16 Ysd=numpy.std(Y)
17
18 #z分数
19 ZX=(X-Xmean)/Xsd
20 ZY=(Y-Ymean)/Ysd
21
22 #相关系数
23 r=numpy.sum(ZX*ZY)/len(X)

使用内置函数直接计算

1、使用numpy的内置方法:numpy.corrcoef(X,Y),X和Y 为两组数据

2、使用pandas的内置方法:首先构造一个数据框,需要分析的两组数据称为两列,然后使用data.corr()

1 #直接调用内置方法
2 numpy.corrcoef(X,Y)
3
4 import pandas
5 data=pandas.DataFrame({
6     "x":X,
7     "y":Y})
8 data.corr()

转载于:https://www.cnblogs.com/U940634/p/9740991.html

Python数据挖掘-相关性-相关分析相关推荐

  1. Python数据挖掘实战——相关分析

    继续补以前拉下的债~~~ 一.相关性指标的研究意义 1.1相关系数(Correlation coefficient):     相关系数是变量间关联程度的最基本测度之一 1.2相关分析(Correla ...

  2. python数据分析的主要流程-python数据挖掘的基本流程有哪些?

    使用python对数据进行处理时,数据挖掘是极为重要的方式和阶段,目的是搜集大量数据,并从中通过算法搜索出隐藏在数据中的那些隐含的.先前未知的,并有具有潜在使用价值的信息.那么python数据挖掘的具 ...

  3. Python数据挖掘和机器学习

    -----------------------------2017.8.9--------------------------------- 先占个坑 在接下来的一个半月里(即从现在到十一) 我将结合 ...

  4. python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    #2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...

  5. python数据挖掘与机器学习实践技术

    分析机器学习在应用时需要掌握的经验及编程技巧.通过实际案例的形式,介绍如何提炼创新点,以及如何发表高水平论文等相关经验.旨在掌握Python编程的基础知识与技巧.特征工程(数据清洗.变量降维.特征选择 ...

  6. Python数据挖掘---绘图源代码具体详解

    第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式.它使用广泛,并且是众多应用的技术基础. 本文介绍那些使用Python数据挖掘实践用于发现和描述结构模式数据的工具.近些年来,P ...

  7. 【Python数据挖掘实战案例】K-Means广告效果聚类分析

    作者:杨啊小强 来源:Python数据科学修炼之路 本案例的业务场景: 假如你们公司投放广告的渠道很多,每个渠道的客户性质也可能不同,比如在优酷视频投广告和今日头条投放广告,效果可能会有差异.现在需要 ...

  8. 带你入门Python数据挖掘与机器学习(附代码、实例)

    作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...

  9. python数据挖掘是什么_python数据挖掘是什么

    数据挖掘(data mining,简称DM),是指从大量的数据中,通过统计学.人工智能.机器学习等方法,挖掘出未知的.且有价值的信 息和知识的过程. python数据挖掘常用模块 numpy模块:用于 ...

最新文章

  1. python统计csv行数_对Python 多线程统计所有csv文件的行数方法详解
  2. Unknown: Failed to get convolution algorithm. This is probably because cuDNN
  3. Hadoop-2.2.0学习之三YARN简介
  4. SAP Cloud for Customer动态控制任意UI元素的显示或隐藏
  5. esclip直接快捷键构造函数_史上最全IntelliJ IDEA mac版快捷键文档
  6. (七)linux函数接口的使用
  7. 使用Spring JDBC时遇到的Software caused connection abort: recv failed问题
  8. Geotools之“Hello World”——打开本地shp文件并显示
  9. (六省)蓝桥真题 奇妙的数字
  10. dos命令中DATE:~0,10输出日期格式名称格式/改为-
  11. 广域网相关技术之FR帧中继、PPP、PPPOE
  12. Excel多行转置为一列
  13. 微信连WiFi(sign有误)
  14. 弱口令介绍及破解方式
  15. 2017.12.5 八周第二次课
  16. NOIP 2015 d1t2 信息传递
  17. Long Way To Go 之 Python 2
  18. Python列表操作常用函数、方法大全
  19. android单手操作系统,生命不息,折腾不止:在 Android 上自制单手模式
  20. 通过ssh隧道访问mysql

热门文章

  1. SVN遇到Can't convert string from 'UTF-8' to native encoding(转)
  2. Python数据清理之数据质量
  3. MAC 下使用ipv6、ipv4观看电视、网络电视
  4. Html和CSS在浏览器中常见的兼容性问题处理
  5. 【WXS数据类型】Boolean
  6. linux服务器安装Mysql。看了几个教程,没装上,看这个一下就装上了。
  7. 利用WIX制作安装包(2)
  8. Java中Javadoc的{@link}与@see的简单区别
  9. 关于算法--分治法--合并排序
  10. li标签行内元素高度及居中