皮尔森相关系数(Pearson correlation coefficient)也叫皮尔森积差相关系数(Pearson product-moment correlation coefficient),是用来反应两个变量相似程度的统计量。或者说可以用来计算两个向量的相似度(在基于向量空间模型的文本分类、用户喜好推荐系统中都有应用)。

目前工作中由于比较学生对两个考点的掌握情况的概率做统计来推荐合适的学习内容。

我太笨,读书少,看不懂,只能记者,留着当作业。

公式是这样的:

公式分解:

python 的实现:

# Input: 2 objects
# Output: Pearson Correlation Score
def pearson_correlation(object1, object2):values = range(len(object1))# Summation over all attributes for both objectssum_object1 = sum([float(object1[i]) for i in values]) sum_object2 = sum([float(object2[i]) for i in values])# Sum the squaressquare_sum1 = sum([pow(object1[i],2) for i in values])square_sum2 = sum([pow(object2[i],2) for i in values])# Add up the productsproduct = sum([object1[i]*object2[i] for i in values])#Calculate Pearson Correlation scorenumerator = product - (sum_object1*sum_object2/len(object1))denominator = ((square_sum1 - pow(sum_object1,2)/len(object1)) * (square_sum2 - pow(sum_object2,2)/len(object1))) ** 0.5# Can"t have division by 0if denominator == 0:return 0result = numerator/denominatorreturn result

等有时间写个 C# 的算法。

内容来源参考:

http://mines.humanoriented.com/classes/2010/fall/csci568/portfolio_exports/sphilip/pear.html

https://segmentfault.com/q/1010000000094674

http://www.cnblogs.com/zhangchaoyang/articles/2631907.html

转载于:https://www.cnblogs.com/easeyeah/p/pearson.html

记录皮尔逊相关系数-相似性比较算法相关推荐

  1. 推荐算法-皮尔逊相关系数的相似度

    探索相似性度量 基于用的推荐程序的一个重要的部分是用户相似度(UserSimilarity)实现.基于用户的推荐非常依赖这个组件.如果对用户的相似性缺乏可靠有效的定义,这类推荐方法是没有意义的.这也适 ...

  2. 推荐系统入门学习(二)【余弦相似度|皮尔逊相关系数】

    搭建你的第一个推荐系统 初识推荐系统 最初的推荐系统,作用是过滤垃圾邮件.今日机器学习算法的发展,朴素贝叶斯.神经网络已然成为了过滤垃圾邮件的好手.但是在30年前,算法还没有如今使用得广泛的时候,&q ...

  3. 基于用户的协同过滤和皮尔逊相关系数

    基于用户的协同过滤和皮尔逊相关系数 2012 年 11 月 05 日 isnowfy algorithm, web frameborder="0" hspace="0&q ...

  4. 皮尔逊相关系数 定义+python代码实现 (与王印讨论公式)

    皮尔逊相关系数 定义+python代码实现 (与王印讨论公式) 标签: python相关性系数皮尔逊系数 2016-10-25 20:59 153人阅读 评论(0) 收藏 举报  分类: 集体智慧编程 ...

  5. 机器学习笔记——皮尔逊相关系数

    在学到相关性度量的时候,有一个系数用来度量相似性(距离),这个系数叫做皮尔逊系数,其实在统计学的时候就已经学过了,只是当时不知道还能用到机器学习中来,这更加让我觉得机器学习离不开统计学了. 皮尔逊相关 ...

  6. python二维散点分布图_深入理解皮尔逊相关系数amp;python代码

    1.常见理解误区 (1)计算出变量A和变量B的皮尔逊相关系数为0,不代表A和B之间没有相关性,只能说明A和B之间不存在线性相关关系. 例:温度和冰淇淋销量之间的散点图像如下,可以发现大致成二次函数图像 ...

  7. 皮尔逊相关系数实现相似K线及其性能优化

    皮尔逊相关系数实现相似K线及其性能优化 概念介绍 相似K线是验证"历史总会重演"的一个经典产品,目前许多炒股软件都开始陆陆续续提供相似K线功能.如下图是某产品的相似K线效果图: 投 ...

  8. 利用协方差,皮尔逊相关系数和斯皮尔曼相关系数确定变量间的关系

    利用协方差,皮尔逊相关系数和斯皮尔曼相关系数确定变量间的关系 https://www.toutiao.com/i6550915552490029576/ 数据集中的变量之间可能存在复杂且未知的关系.重 ...

  9. Python三种方法计算皮尔逊相关系数以及实现给定数据集,返回数据集中每个特征和标签的相关系数

    特征预处理完之后,我们需要选择有意义的特征作为输入机器学习的算法和模型进行训练 在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数( ...

最新文章

  1. 影著协公布的使用费收取标准
  2. 硬盘重装Ubuntu12.04的感受
  3. python大佬养成计划----HTML网页设计一
  4. oracle RAC信息,Oracle 查看 RAC GI 版本信息
  5. 【Android休眠】之PowerKey唤醒源实现【转】
  6. 通过@Import注解把类注入容器的四种方式
  7. 混合云存储阵列 > 产品简介 > 应用场景 > 双活容灾
  8. php获取excel数据并添加数据库,如何使用phpexcel读取数据并将其插入数据库?
  9. systemd.conf翻译
  10. numpy与pandas各种功能及其对比(超全)
  11. [org/springframework/jdbc/support/sql-error-codes.xml]
  12. 解决iOS app集成共享QQ场地,微信的朋友,朋友等功能圈,不能采用苹果公司的审计问题...
  13. macOS devtools安装github包失败解决
  14. 云计算平台能够提供计算服务器,云计算平台提供了什么服务器
  15. 学习笔记(4):零基础掌握 Python 入门到实战-深入浅出字符串(二)
  16. 在网站优化中怎么做好关键词密度?
  17. Python 让多图排版更加美观
  18. BottomNavigationBar+viewpager底部导航切换,出现 Fragment already added
  19. Windows上使用VLC插件的方式在IE浏览器上播放RTSP视频流
  20. mysql 加上天数_MySQL Datetime添加天数?

热门文章

  1. 实用比较,帮你决策到底选择Vue还是Angular4、5
  2. CodeForces 839D - Winter is here | Codeforces Round #428 (Div. 2)
  3. 基于 Android NDK 的学习之旅-----JNI 数据类型
  4. Java日志性能那些事
  5. Nagios Apache报Internal Server Error错误的解决方法
  6. 使用TMG2010企业版组建大型***网络之3-配置NLB
  7. 终端服务器超过了 最大连接数
  8. 张书兰 (帮别人名字作诗)
  9. The import com.google cannot be resolved解决方法
  10. JSP中文乱码分析和解决