Python数据挖掘-相关性-相关分析
所需模块
numpy、pandas
相关系数计算
首先使用numpy.mean()方法求出均值,Xsd=numpy.std()方法求出标准差;
然后在通过(X-Xmean)/Xsd公式求出z分数;
最后通过numpy.sum(ZX*ZY)/len(X)
1 import numpy 2 3 X=[ 4 12.5, 15.3, 23.2, 26.4, 33.5, 5 34.4, 39.4, 45.2, 55.4, 60.9] 6 Y=[ 7 21.2, 23.9, 32.9, 34.1, 42.5, 8 43.2, 49.0, 52.8, 59.4, 63.5] 9 10 #均值 11 Xmean=numpy.mean(X) 12 Ymean=numpy.mean(Y) 13 14 #标准差 15 Xsd=numpy.std(X) 16 Ysd=numpy.std(Y) 17 18 #z分数 19 ZX=(X-Xmean)/Xsd 20 ZY=(Y-Ymean)/Ysd 21 22 #相关系数 23 r=numpy.sum(ZX*ZY)/len(X)
使用内置函数直接计算
1、使用numpy的内置方法:numpy.corrcoef(X,Y),X和Y 为两组数据
2、使用pandas的内置方法:首先构造一个数据框,需要分析的两组数据称为两列,然后使用data.corr()
1 #直接调用内置方法 2 numpy.corrcoef(X,Y) 3 4 import pandas 5 data=pandas.DataFrame({ 6 "x":X, 7 "y":Y}) 8 data.corr()
转载于:https://www.cnblogs.com/U940634/p/9740991.html
Python数据挖掘-相关性-相关分析相关推荐
- Python数据挖掘实战——相关分析
继续补以前拉下的债~~~ 一.相关性指标的研究意义 1.1相关系数(Correlation coefficient): 相关系数是变量间关联程度的最基本测度之一 1.2相关分析(Correla ...
- python数据分析的主要流程-python数据挖掘的基本流程有哪些?
使用python对数据进行处理时,数据挖掘是极为重要的方式和阶段,目的是搜集大量数据,并从中通过算法搜索出隐藏在数据中的那些隐含的.先前未知的,并有具有潜在使用价值的信息.那么python数据挖掘的具 ...
- Python数据挖掘和机器学习
-----------------------------2017.8.9--------------------------------- 先占个坑 在接下来的一个半月里(即从现在到十一) 我将结合 ...
- python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析
#2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...
- python数据挖掘与机器学习实践技术
分析机器学习在应用时需要掌握的经验及编程技巧.通过实际案例的形式,介绍如何提炼创新点,以及如何发表高水平论文等相关经验.旨在掌握Python编程的基础知识与技巧.特征工程(数据清洗.变量降维.特征选择 ...
- Python数据挖掘---绘图源代码具体详解
第一节 介绍 数据挖掘是一个隐式提取以前未知的潜在有用的数据信息提取方式.它使用广泛,并且是众多应用的技术基础. 本文介绍那些使用Python数据挖掘实践用于发现和描述结构模式数据的工具.近些年来,P ...
- 【Python数据挖掘实战案例】K-Means广告效果聚类分析
作者:杨啊小强 来源:Python数据科学修炼之路 本案例的业务场景: 假如你们公司投放广告的渠道很多,每个渠道的客户性质也可能不同,比如在优酷视频投广告和今日头条投放广告,效果可能会有差异.现在需要 ...
- 带你入门Python数据挖掘与机器学习(附代码、实例)
作者:韦玮 来源:Python爱好者社区 本文共7800字,建议阅读10+分钟. 本文结合代码实例待你上手python数据挖掘和机器学习技术. 本文包含了五个知识点: 1. 数据挖掘与机器学习技术简介 ...
- python数据挖掘是什么_python数据挖掘是什么
数据挖掘(data mining,简称DM),是指从大量的数据中,通过统计学.人工智能.机器学习等方法,挖掘出未知的.且有价值的信 息和知识的过程. python数据挖掘常用模块 numpy模块:用于 ...
最新文章
- python统计csv行数_对Python 多线程统计所有csv文件的行数方法详解
- Unknown: Failed to get convolution algorithm. This is probably because cuDNN
- Hadoop-2.2.0学习之三YARN简介
- SAP Cloud for Customer动态控制任意UI元素的显示或隐藏
- esclip直接快捷键构造函数_史上最全IntelliJ IDEA mac版快捷键文档
- (七)linux函数接口的使用
- 使用Spring JDBC时遇到的Software caused connection abort: recv failed问题
- Geotools之“Hello World”——打开本地shp文件并显示
- (六省)蓝桥真题 奇妙的数字
- dos命令中DATE:~0,10输出日期格式名称格式/改为-
- 广域网相关技术之FR帧中继、PPP、PPPOE
- Excel多行转置为一列
- 微信连WiFi(sign有误)
- 弱口令介绍及破解方式
- 2017.12.5 八周第二次课
- NOIP 2015 d1t2 信息传递
- Long Way To Go 之 Python 2
- Python列表操作常用函数、方法大全
- android单手操作系统,生命不息,折腾不止:在 Android 上自制单手模式
- 通过ssh隧道访问mysql