除了欧几里得距离,还有一种更复杂一些的方法可以用来判断人们兴趣的相似度(相似一定发生在两个之间)。那就是皮尔逊相关系数,该相关系数是判断两组数据与某一直线拟合程度的一种度量。它在数据不是很规范(normalized)的时候(比如,某影评者对影片的评价总是相对于平均水平偏离很大时),会倾向于给出更好的结果。

如果某人总是倾向于给出比另一个人高的分值,而二者的分差又始终保持一致,也即二者呈线性关系,则会得到较高的皮尔逊相关度。

ρX,Y=cov(X,Y)D(X)−−−−−√D(Y)−−−−−√

\rho_{X,Y}=\frac{\text{cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}

对应与 numpy 库中的 np.corrcoef() 函数。

np.corrcoef(X, Y)[0][1]

机器学习基础(三十三)—— 皮尔逊相关度评价相关推荐

  1. 机器学习基础(十三)—— regularization validation

    (1)无论是正则化(regularization)还是校验(validation)都是一种模型选择方法: (2)regularization:经验风险(EinE_{in})+ regularizer ...

  2. 机器学习知识点(三十三)机器学习入门的数学基础

    三类:1)多元微积分:2)线性袋鼠,主要是关于矩阵方面的:3)概率论和统计学:4)几何学: 下面的题要能解出,才能更好理解机器学习中的内容. 涉及的相关数学知识点,在机器学习知识点系列上都有介绍,不过 ...

  3. 机器学习(三十三)——价值函数的近似表示

    价值函数的近似表示 之前的内容都是讲解一些强化学习的基础理论,这些知识只能解决一些中小规模的问题.很多价值函数需要用一张大表来存储.当获取某一状态或行为的价值的时候,通常需要一个查表操作(Table ...

  4. [系统安全] 三十三.恶意代码检测(3)基于机器学习的恶意代码检测技术

    您可能之前看到过我写的类似文章,为什么还要重复撰写呢?只是想更好地帮助初学者了解病毒逆向分析和系统安全,更加成体系且不破坏之前的系列.因此,我重新开设了这个专栏,准备系统整理和深入学习系统安全.逆向分 ...

  5. Python机器学习基础篇三《无监督学习与预处理》

    前言 前期回顾: Python机器学习基础篇二<为什么用Python进行机器学习> 上面这篇里面写了文本和序列相关. 我们要讨论的第二种机器学习算法是无监督学习算法.无监督学习包括没有已知 ...

  6. [Python从零到壹] 三十三.图像处理基础篇之什么是图像处理和OpenCV配置

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  7. 机器学习基础(五):计算学习理论(PAC学习、有限假设空间、VC维、Rademacher复杂度、稳定性)

    5.计算学习理论 计算学习理论computational learning theory:研究关于机器学习的基础理论 几个常用不等式: 5.1 PAC学习 概率近似正确(PAC)Probably Ap ...

  8. 【机器学习基础】(三):理解逻辑回归及二分类、多分类代码实践

    本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...

  9. [Python人工智能] 三.theano实现分类神经网络及机器学习基础

    从本篇文章开始,作者正式开始研究Python深度学习.神经网络及人工智能相关知识.前两篇文章讲解了神经网络基础概念.Theano库的安装过程及基础用法.theano实现回归神经网络,这篇文章主要讲解机 ...

最新文章

  1. Android桌面组件App Widget开发三步走
  2. 学习笔记(40):Python实战编程-文本
  3. SmartCode 常见问题
  4. 创建SQL函数计算员工加班时间
  5. 算成绩啦(洛谷P5740、P5741题题解,Java语言描述)
  6. linux脚本怎么退出while,linux中的while命令
  7. Django学习入门步骤 教程步骤 python
  8. 关于hadoop HDFS进行读写文件操作的问题
  9. cad卸载_盘点那些年用过的神级CAD插件,每一款都舍不得卸载
  10. 基于NXP i.MX8 Ethercat实时运动控制器设计 Linux+xenomai+igh+rtnet
  11. 微信小程序开发工具下载安装
  12. isilon域环境配置
  13. 去水印原理_图片去水印|视频去水印
  14. javaweb重定向——登录页面跳转到首页
  15. android应用程序开发需要掌握的基础知识
  16. 检测mysql字符正确_mysql字符集的测试
  17. VMware XP安装安装程序没有找到硬盘驱动器
  18. 前阿里政委张丽俊:人,是CEO最重要的一课
  19. Apache安装和配置详细
  20. 推荐一个在线画图软件

热门文章

  1. html5文字收起,科技常识:HTML5给汉字加拼音收起展开组件的实现代码
  2. mysql数据结合使用_MySQL数据行操作
  3. anaconda tensorflow import PIL 报错的解决方法
  4. 如何排查mysql数据乱码_如何解决MYSQL数据库中文乱码问题?
  5. PAT Basic 1011
  6. Java集合类的整理
  7. monkey测试小记
  8. Python基础之初识类和对象
  9. 数组的常用方法 Array;
  10. 关于OCR,做个记录。