皮尔逊相关系数 定义+python代码实现 (与王印讨论公式)

标签: python相关性系数皮尔逊系数
2016-10-25 20:59 153人阅读 评论(0) 收藏 举报
 分类:
集体智慧编程

版权声明:本文为博主原创文章,未经博主允许不得转载。

目录(?)[+]

皮尔逊相关系数

定义

皮尔逊相关系数判断两组数据与某一直线拟合程度的一种度量 
公式及其计算过程如下

 

python代码实现

'''
@copyright Programming Collective Intelligence
返回p1和p2的皮尔逊相关系数
prefs是一个二维矩阵字典,如下图所示
(名字,电影)  movie1   movie2p1      4.5      5.0p2      3.0      1.5
'''
def simPearson(prefs, p1, p2):#得到双方都曾评价过得物品列表si={}for item in prefs[p1]:for item in prefs[p2]:si[item] = 1#得到列表元素的个数n = len(si)#如果两者没有共同之处,则返回1if n == 0: return 1#对所有偏好求和sum1 = sum([prefs[p1][it] for it in si])sum2 = sum([prefs[p2][it] for it in si])#求平方和sum1Sq = sum([pow(prefs[p1][it], 2) for it in si])sum2Sq = sum([pow(prefs[p2][it], 2) for it in si])#求乘积之和pSum = sum([prefs[p1][it] * prefs[p2][it] for it in si])#计算皮尔逊评价值num = pSum - (sum1 * sum2) / nden = sqrt((sum1Sq-pow(sum1, 2) / n) * (sum2Sq - pow(sum2, 2) / n))if den == 0: return 0r = num / denreturn rhttp://blog.csdn.net/maxiaotiaoti/article/details/52927047
  相关图书:《零基础学数据结构第二版》,机械工业出版社,2014。《CC++数据结构与算法速学速用大辞典》,中国铁道出版社

皮尔逊相关系数 定义+python代码实现 (与王印讨论公式)相关推荐

  1. python二维散点分布图_深入理解皮尔逊相关系数amp;python代码

    1.常见理解误区 (1)计算出变量A和变量B的皮尔逊相关系数为0,不代表A和B之间没有相关性,只能说明A和B之间不存在线性相关关系. 例:温度和冰淇淋销量之间的散点图像如下,可以发现大致成二次函数图像 ...

  2. 每日一练:Python代码绘制航海王草帽路飞,打饭阿姨也能跟着学会的Turtle海龟绘图系列

    Turtle 海龟绘图系列 - Python 代码绘制航海王草帽路飞 第一章:程序运行 ① 效果展示 - 轮廓描绘 ② 效果展示 - 颜色填充 第二章:实现过程 ① 绘图数据下载 ② 海龟绘图配置项 ...

  3. Python 代码绘制航海王四皇大妈(BIG MOM) - 门卫大爷也能跟着学会的Turtle海龟绘图系列

    Turtle 海龟绘图系列 - Python 代码绘制航海王四皇大妈 BIG MOM 第一章:程序运行 ① 效果展示1 ② 效果展示2 第二章:实现过程 ① 绘图数据下载 ② 海龟绘图配置项 ③ 本地 ...

  4. 特征计算 - Jaccard 相似系数与 Python 代码实现

    Jaccard 相似系数又称为Jaccard相似性度量(Jaccard系数,Jaccard 指数,Jaccard index).用于比较有限样本集之间的相似性与差异性.Jaccard系数值越大,样本相 ...

  5. 皮尔逊相关系数R的代码实现

    皮尔逊相关系数代码实现 ①直接用numpy的corrcoef方法 from math import sqrt import numpy as npx = [2,7,18,88,157, 90,177, ...

  6. 皮尔逊相关系数丨Pearson’s correlation coefficient

    皮尔逊相关系数丨Pearson's correlation coefficient 皮尔逊相关系数丨Pearson's correlation coefficient 什么是相关系数 相关系数与相关距 ...

  7. 机器学习笔记——皮尔逊相关系数

    在学到相关性度量的时候,有一个系数用来度量相似性(距离),这个系数叫做皮尔逊系数,其实在统计学的时候就已经学过了,只是当时不知道还能用到机器学习中来,这更加让我觉得机器学习离不开统计学了. 皮尔逊相关 ...

  8. rust(25)-皮尔逊相关系数

    皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient ...

  9. 相似度计算(2)——皮尔逊相关系数

    皮尔逊相关系数 一.定义   皮尔逊相关系数( Pearson correlation coefficient,PC),又称皮尔逊积矩相关系数(Pearson product-moment corre ...

最新文章

  1. FreeRTOS 临界段和开关中断
  2. 10 种机器学习算法的要点
  3. Delphi中调用API函数经验点滴(二)
  4. 【简记】HTML CSS 的一些要点(不定时更新)
  5. cpu使用率_漫话性能:CPU使用率
  6. 配置所需要的依赖_配置spring所需要的jar包
  7. HTML/CSS 练习
  8. B/S----验证方式及练习
  9. 【软件工程】对于Why Software Development Methodologies Suck(为什么软件开发方法论让你觉得糟糕)问题的探讨
  10. c++程序员面试宝典
  11. powerDesign导出word操作步骤
  12. 计算机日志存储在哪里,Win7系统日志存放位置的更改
  13. ansible当中模块的使用
  14. ubuntu16.04 caffe /usr/bin/ld : cannot find -lxxx (xxx代表不同的库名称)
  15. 微信小程序 之 mpvue
  16. 企业家故事|香港最后一位少爷,走了(下)
  17. xshell用ssh连接kali虚拟机超详细
  18. 电脑被黑客远程入侵了,该怎么办啊
  19. 交流永磁同步电机的弱磁控制
  20. 博客论坛自动采集器 - 蓝天采集器源码

热门文章

  1. android开发rn插件,在Android原生应用中嵌入React Native
  2. 计算机网络:NAT基本原理
  3. Java高并发编程(六):重入锁
  4. Java高并发编程(二):Java并发机制的底层实现机制
  5. php分页预览函数,PHP分页函数的简单示例
  6. 彩超探头频率高低的区别_超声波液位开关和液位开关的区别,它们的工作原理分别是什么?...
  7. php 字节序,Linux_Linux中网络字节序和主机字节序,主机字节序就是我们平常说的 - phpStudy...
  8. 一次完整的HTTP事务过程--超详细!
  9. Linux 中使用 KVM
  10. FreeMarker手册pdf