相似度计算的三种方式
相似度计算的三种方式
欧几里德评价
欧几里得度量(euclidean metric)(也称欧式距离)是一个通常采用的距离定义,指在m维空间中两个点之间的真实距离,或者向量的自然长度(即该点到原点的距离)。
0ρ = sqrt( (x1-x2)^2+(y1-y2)^2 )
similarity = 1/(op + 1)
最终的similarity就是相似度评价的值
皮尔逊相关评价
皮尔逊相关系数是一种度量两个变量间相关程度的方法。它是一个介于 1 和 -1 之间的值,其中,1 表示变量完全正相关, 0 表示无关,-1 表示完全负相关。
相关公式:
皮尔逊相关的约束条件
从以上解释, 也可以理解皮尔逊相关的约束条件:
1 两个变量间有线性关系
2 变量是连续变量
3 变量均符合正态分布,且二元分布也符合正态分布
4 两变量独立
在实践统计中,一般只输出两个系数,一个是相关系数,也就是计算出来的相关系数大小,在-1到1之间;另一个是独立样本检验系数,用来检验样本一致性.
适用范围
适用于A的评价普遍高于B的评价
Tanimoto分值
公式如下图所示:
度量两个集合之间的相似程度的方法。
A=[1,2,3,4]
B=[1,2,7]
C = A & B = [1,2]
T = Nc / ( Na + Nb -Nc) = len(c) / ( len(a) + len(b) - len(c)) = 2 / (4+3-2) = 0.4
可以用户计算用户之间的相似程度
相关资料
http://www.tuicool.com/articles/vuiU3uu
http://blog.sina.com.cn/s/blog_618985870101jmnp.html
相似度计算的三种方式相关推荐
- 含根式的定积分计算_三种方式计算不定积分∫x√(x+1)dx。
原标题:三种方式计算不定积分∫x√(x+1)dx. 主要内容: 通过根式换元.分项凑分以及分部积分法等相关知识,介绍不定积分∫x√(x+1)dx的三种计算方法和步骤. 根式换元法: 设√(x+1)=t ...
- 盛大游戏技术总监徐峥:Unity引擎使用的三种方式
在5月13日Unite 2017 案例分享专场上,盛大游戏技术总监徐峥分享了使用Unity引擎的三种方式,以下为详细内容: 大家好,我先简单介绍一下我自己,我是盛大游戏的技术总监徐峥.我今天想分享的主 ...
- 网络知识入门,用户如何连接互联网,ADSL调制解调器的妙用,PPP上网的三种方式(十二)
互联网与家庭网络的区别 互联网是一个遍布世界的巨大而复杂的系统,但其基本工作方式却出奇地简单.和家庭.公司网络一样,互联网也是通过路由器来转发包的, 而且路由器的基本结构和工作方式也并没有什 ...
- 【简单总结】句子相似度计算的几种方法
[简单总结]句子相似度计算的几种方法 1.句子相似度介绍: 句子相似度–指的是两个句子之间相似的程度.在NLP中有很大的用处,譬如对话系统,文本分类.信息检索.语义分析等,它可以为我们提供检索信息更快 ...
- 音视频从入门到精通——FFmpeg 播放器实现音视频同步的三种方式
老人们经常说,播放器对音频和视频的播放没有绝对的静态的同步,只有相对的动态的同步,实际上音视频同步就是一个"你追我赶"的过程. 音视频的同步方式有 3 种,即:音视频分别向系统时钟 ...
- 边缘计算的三种模式:MEC、微云和雾计算
本文来自雷锋网 随着万物互联的泛在化发展,近年来,边缘计算(Edge Computing)的热度持续上升,大有和云计算分庭抗礼的架势. IDC预计,2020年全球将有超过500亿的终端与设备联网,超过 ...
- java 异步事件_处理异步事件的三种方式
在网站开发中,异步事件是项目必然需要处理的一个环节,也因为前端框架的兴起,通过框架实现的 SPA 已经是快速建构网站的标配了,一部获取数据也就成了不可或缺的一环:本文来就讲一讲 JavaScript ...
- 日常生活中怎样利用计算机的,数据存储与管理在日常生活中的三种方式
数据存储与管理在使用的时候还是有很多的技术性要求需要我们不断的学习和实践.下面是在长时间的市场积累中总结出来的一些关于数据存储与管理的技巧. 过去20年里,计算领域发生了很大的变化,无论如何变化,计算 ...
- Qt三种方式实现FTP上传功能
FTP协议 FTP的中文名称是"文件传输协议",是File Transfer Protocol三个英文单词的缩写.FTP协议是TCP/IP协议组中的协议之一,其传输效率非常高,在网 ...
最新文章
- 【linux】串口编程(三)——错误处理
- 前后端分离业务逻辑常用封装函数(一)
- python中data.find_all爬取网站为空列表_Python网络爬虫之Scrapy 框架-分布式【第二十九节】...
- android设备局域网中快速搜索之cling方式
- PIC单片机精通_异步串口通讯实例与细节
- tensorflow RNN循环神经网络 (分类例子)-【老鱼学tensorflow】
- LeetCode 1289. 下降路径最小和 II(DP)
- 微服务精华问答 | 为什么需要微服务?
- C#设计模式之18-备忘录模式
- 建议设计日常多逛,多学习的网站
- 一篇文章告诉你如何寻找水王(数组中存在超过一半的数字)
- 使用Windows service创建一个简单的定时器
- 如何在服务器运行脚本精灵,脚本精灵循环方式教程
- 手把手教你 1:win7下安装SQL Server2005开发版步骤
- 【vijos】在vijos的自己的域中创建题目
- mbr转gpt 无损 linux,磁盘MBR改成GPT|MBR无损转换GPT分区
- Vmware虚拟机和主机之间复制、粘贴内容、拖拽文件的详细方法
- python学习第八天---用Django框架创建可重用注册登录系统
- java windows 打印机_使用Java中的客户端计算机打印机(不是部署应用程序的服务器)进行打印...
- web学习入门资源总结