pandas计算皮尔逊相关系数
前置说明:
本文中使用的数据在文末提供下载,本文使用IH和IC主力合约的数据为例
目录
1. 概念
2. 计算过程
1. 概念
皮尔逊(pearson)相关系数:用于判断数据是否线性相关的方法
皮尔逊计算公式:
2. 计算过程
import pandas as pd
import numpy as np
import math
df_ih = pd.read_csv('IH_main_00.csv',encoding='utf-8')
df_ic = pd.read_csv('IC_main_00.csv',encoding='utf-8')
df_ih.head()
df_ih['tradeDate'] = pd.to_datetime(df_ih['tradeDate'])
df_ic['tradeDate'] = pd.to_datetime(df_ic['tradeDate'])
df_ih.sort_values(by='tradeDate',ascending=True,inplace=True)
df_ic.sort_values(by='tradeDate',ascending=True,inplace=True)
df_ih['pe_log_ih'] = np.log(df_ih['closePrice'])-np.log(df_ih['closePrice'].shift(1))
df_ic['pe_log_ic'] = np.log(df_ic['closePrice'])-np.log(df_ic['closePrice'].shift(1))
two_df = pd.merge(df_ih,df_ic,how='inner',on='tradeDate')
# 协方差
res_00 = two_df['pe_log_ih'].cov(two_df['pe_log_ic'])
# 方差
res_var_ih = two_df['pe_log_ih'].var()
res_var_ic = two_df['pe_log_ic'].var()
# 皮尔逊相关系数
res_pearson = res_00/math.sqrt(res_var_ih*res_var_ic)
res_pearson
# out: 0.6926085790765449
PS:
链接:https://pan.baidu.com/s/1dw209DIgxmnLRmjbcNmopA
提取码:3q6n
pandas计算皮尔逊相关系数相关推荐
- python怎么计算相关系数_Python三种方法计算皮尔逊相关系数
1.皮尔逊相关系数在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlat ...
- js计算皮尔逊相关系数
没找到网上有什么现成的,所以就自己写了个,挺简单的,记录一下. /*** 计算皮尔逊相关系数* @list1:数字列表1* @list2:数字列表2* @return number * */ func ...
- Python计算皮尔逊相关系数
** Python计算皮尔逊相关系数 ** 皮尔逊相关系数是衡量随机变量X与Y相关程度的一种方法,相关系数的取值范围是[-1,1].相关系数的绝对值越大,则表明X与Y相关度越高.当X与Y线性相关时,相 ...
- 推荐系统(2)--计算皮尔逊相关系数
计算皮尔逊相关系数 代码如下: #-*- coding:utf-8 -*- '''皮尔逊相关系数 ''' import json import numpy as np# 计算user1 和 user2 ...
- Python--如何计算皮尔逊相关系数(Pearson correlation coefficient)
皮尔逊系数 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation ...
- Python三种方法计算皮尔逊相关系数以及实现给定数据集,返回数据集中每个特征和标签的相关系数
特征预处理完之后,我们需要选择有意义的特征作为输入机器学习的算法和模型进行训练 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数( ...
- pyspark 计算 皮尔逊相关系数
from pyspark.ml.linalg import Vectors from pyspark.ml.stat import Correlationfrom pyspark.sql import ...
- 皮尔逊相关系数的计算(python代码版)
皮尔逊相关系数的计算(python代码版) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 fro ...
- python二维散点分布图_深入理解皮尔逊相关系数amp;python代码
1.常见理解误区 (1)计算出变量A和变量B的皮尔逊相关系数为0,不代表A和B之间没有相关性,只能说明A和B之间不存在线性相关关系. 例:温度和冰淇淋销量之间的散点图像如下,可以发现大致成二次函数图像 ...
最新文章
- 学了编译原理能否用 Java 写一个编译器或解释器?
- python在中小学教学中的应用-在python程序中的进程操作
- Response_案例1_路径_相对路径
- centenos安装mysql,Cento7 安装mycat和mycat-eye
- HighCharts: 设置时间图x轴的宽度
- 如何让大数据从发现价值到创造价值
- 移动端媒体尺寸_网络推广外包浅析提升移动端网站建设效率有哪些网络推广外包技巧-企服...
- Activate Windows server 2003 in VMware
- coreos安装php,window_win10系统运行wps无响应的解决方案,wps是我们在日常办公中经常会 - phpStudy...
- Exchange Server 2010高可用性配置
- 怎么在线制作gif动图?推荐一款gif表情包在线制作生成器
- 必备单品,FSearch
- PMP 学习笔记 第8章 项目质量管理
- 使用Fluxion搭建钓鱼热点破解WiFi密码
- 微信小程序真机调试连接不到后台服务器,解决微信小程序wepy真机预览跟本地表现不一样,数据变化了视图没变化...
- 跟李沐学AI:实用机器学习 | 第五章
- 笔记本电脑应用商店服务器错误,Windows10系统无法打开这个应用商店解决方法
- 面试了 15 位来自 985/211 高校的 2020 届研究生,思考许久,熬夜赶出了这篇文章...
- 数据库的行列互换问题
- Android如何制作.9图片