欧几里德距离的相似度 —— Euclidean Distance-based Similarity
欧几里德距离的相似度 —— Euclidean Distance-based Similarity
欧几里德距离计算相似度是所有相似度计算里面最简单、最易理解的方法。它以经过人们一致评价的物品为坐标轴,然后将参与评价的人绘制到坐标系上,并计算他们彼此之间的直线距离。
图中用户A和用户B分别对项目X、Y进行了评分。用户A对项目X的评分为2,对项目Y的评分为4,表示到坐标系中为坐标点A(1.8, 4);同样用户B对项目X、Y的评分表示为坐标点B(4.5, 2.5),因此他们之间的欧几里德距离(直线距离)为:sqrt((B.x - A.x)^2 + (A.y - B.y)^2)
计算出来的欧几里德距离是一个大于0的数,为了使其更能体现用户之间的相似度,可以把它规约到(0, 1]之间,具体做法为:1 / (1 + d)。参见Table2
只要至少有一个共同评分项,就能用欧几里德距离计算相似度;如果没有共同评分项,那么欧几里德距离也就失去了作用。其实照常理理解,如果没有共同评分项,那么意味着这两个用户或物品根本不相似。
二维的公式
d = sqrt((x1-x2)^2+(y1-y2)^2)
三维的公式
d=sqrt(x1-x2)^2+(y1-y2)^2+(z1-z2)^2)
推广到n维空间,
欧氏距离的公式
d=sqrt( ∑(xi1-xi2)^2 ) 这里i=1,2..n
xi1表示第一个点的第i维坐标,xi2表示第二个点的第i维坐标
n维欧氏空间是一个点集,它的每个点可以表示为(x(1),x(2),...x(n)),其中x(i)(i=1,2...n)是实数,称为x的第i个坐标,两个点x和y=(y(1),y(2)...y(n))之间的距离d(x,y)定义为上面的公式.
欧几里德距离的相似度 —— Euclidean Distance-based Similarity相关推荐
- 相似度度量:欧氏距离与余弦相似度(Similarity Measurement Euclidean Distance Cosine Similarity)...
在<机器学习---文本特征提取之词袋模型(Machine Learning Text Feature Extraction Bag of Words)>一文中,我们通过计算文本特征向量之间 ...
- 计算相似度评价值体系:欧几里德距离和皮尔逊相关度
本文参考学习集体智慧编程内容记录. 欧几里德距离评价: 计算相似度评价值的一个非常简单的方式是使用欧几里德距离评价方法.它以经过人们一直评价的物品为坐标轴,然后将参与评价的人绘制到图上,并考察它们彼此 ...
- 机器学习中的数学——距离定义(五):标准化的欧几里得距离(Standardized Euclidean Distance)
分类目录:<机器学习中的数学>总目录 相关文章: · 距离定义:基础知识 · 距离定义(一):欧几里得距离(Euclidean Distance) · 距离定义(二):曼哈顿距离(Manh ...
- python 欧氏距离(Euclidean Distance) 曼和顿距离等距离
原文:https://www.cnblogs.com/denny402/p/7027954.html 1. 欧氏距离(Euclidean Distance) 欧氏距离是最易于理解的一种距 ...
- 图像检索中的相似度度量:EMD距离(Earth Mover's Distance)
EMD距离即Earth Mover's Distance,是由2000年IJCV期刊文章<The Earth Mover's Distance as a Metric for Image Ret ...
- Euclidean distance(欧式距离)和 Frobenius norm(弗洛贝尼乌斯范数)
文章目录 一.欧氏距离 二.弗罗贝尼乌斯范数 一.欧氏距离 如果来两张图片经过训练的分类器提取的 high-level features 在 Euclidean distance(欧氏距离)接近,就认 ...
- 距离和相似度度量方法
http://blog.csdn.net/pipisorry/article/details/45651315 在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别.最 ...
- 【机器学习】全面归纳距离和相似度方法(7种)
距离(distance,差异程度).相似度(similarity,相似程度)方法可以看作是以某种的距离函数计算元素间的距离,这些方法作为机器学习的基础概念,广泛应用于如:Kmeans聚类.协同过滤推荐 ...
- 【机器学习基础】机器学习中“距离与相似度”计算汇总
写在前面 涵盖了常用到的距离与相似度计算方式,其中包括欧几里得距离.标准化欧几里得距离.曼哈顿距离.汉明距离.切比雪夫距离.马氏距离.兰氏距离.闵科夫斯基距离.编辑距离.余弦相似度.杰卡德相似度.Di ...
最新文章
- 淘宝获取单笔订单信息服务端调用API及流程
- 转载:oracle RAC集群启动和关闭
- Linux CPU信息
- beanstalkd php扩展,PHP操作Beanstalkd队列(1)安装与基础
- spark从入门到精通spark内存管理详解- 堆内堆外内存管理
- python 线程中出现执行错乱_多处理会导致Python崩溃,并在调用fork()时在另一个线程中出现错误...
- Vs + Qt 编译 .ui 文件
- 漫谈IBM Power VM历史及其特点
- 15条常用的视频音频编辑脚本命令(mencoder/ffmpeg等)
- 最新版Spring Cloud Alibaba微服务架构-Openfeign服务调用篇
- 0909 学习操作系统
- 【Python-3.3】字典存储调查问卷
- 更新CentOS中的python(从2.6.X到2.7.X)
- hdfs文件系统无法在网页上显示
- 驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred
- Linux平台下使用AdventNet ManageEngine OpUtils监控网络
- @JsonView的使用
- mysql根据15位或者18位身份证号计算年龄的自定义函数
- LeetCode-70.爬楼梯
- Linux软件 绑定硬件ID 做加密 cryptopp RSA-encryption