文章目录

  • 前言
  • 一、基础距离
    • 曼哈顿距离(Manhattan)
    • 欧几里得距离(Euclidean)
  • 二、高级距离
    • 马氏距离(Mahalanobis Distance)
    • 2.余弦距离(cosine distance)
  • 三,类内距离和类间距离

前言

检测点到目标的的距离通常作为算法的分类或判别依据,被用作评定数据之间的相似度指标


提示:以下是本篇文章正文内容,下面案例可供参考

一、基础距离

假设两点如下图所示:

曼哈顿距离(Manhattan)


欧几里得距离(Euclidean)


二、高级距离

马氏距离(Mahalanobis Distance)

马氏距离是度量学习中一种常用的距离指标,同欧氏距离、曼哈顿距离、汉明距离等一样被用作评定数据之间的相似度指标。

马氏距离(Mahalanobis Distance)是一种距离的度量,可以看作是欧氏距离的一种修正,修正了欧式距离中各个维度尺度不一致且相关的问题。
举例:欧式距离近就一定相似?

先举个比较常用的例子,身高和体重,这两个变量拥有不同的单位标准,也就是有不同的scale。比如身高用毫米计算,而体重用千克计算,显然差10mm的身高与差10kg的体重是完全不同的。但在普通的欧氏距离中,这将会算作相同的差距。

再例如:像下图一样,A与B相对于原点的距离是相同的。但是由于样本总体沿着横轴分布,所以B点更有可能是这个样本中的点,而A则更有可能是离群点。这种情况下,欧几里得距离显然不是一个好的度量方式。
马氏距离只需要将变量按照主成分进行旋转,让维度间相互独立,然后进行标准化,让维度同分布就OK了

由主成分分析可知,由于主成分就是特征向量方向,每个方向的方差就是对应的特征值,所以只需要按照特征向量的方向旋转,然后缩放特征值倍就可以了,可以得到以下的结果:


离群点就被成功分离,这时候的欧式距离就是马氏距离。

2.余弦距离(cosine distance)

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。


三,类内距离和类间距离

一、定义
类内距离(intra-class):同一类各模式样本点间的均方距离
类间距离(inter-class):顾名思义不同类间的距离
在Triplet loss中会遇到 intra-class distances 是指同一个个体在不同摄像机下的距离



评定数据之间的相似度指标----距离相关推荐

  1. ML:图像数据、字符串数据等计算相似度常用的十种方法(余弦相似性、皮尔逊、闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离、马氏距离、汉明距离、编辑距离、杰卡德相似系数、相对熵/KL散度、Helli

    ML:图像数据.字符串数据等计算相似度常用的十种方法(余弦相似性.皮尔逊.闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离.马氏距离.汉明距离.编辑距离.杰卡德相似系数.相对熵/KL散度.Helli ...

  2. 相似度(距离计算)汇总

    1 前言 在数据挖掘中,我们经常需要计算样本之间的相似度(Similarity ),我们通常的做法是计算样本之间的距离,本文对 距离计算方法做以下总结. 2 距离计算方法 A 欧式距离Euclidea ...

  3. 高维向量的相似度判定-距离产生了,美还在吗

    高维向量的相似度判定-距离产生了,美还在吗 向量的显式距离 汉明距离-Hamming distance:变量差异计数器 曼哈顿距离-Manhattan Distance:变量差异累加器 欧氏距离-Eu ...

  4. 衡量两个概率分布之间的差异性的指标

    衡量两个概率分布之间的差异性的指标 衡量两个概率分布之间的差异性的指标 KL散度(Kullback–Leibler divergence) JS散度(Jensen-Shannon divergence ...

  5. 生活质量衡量系统_数据质量与数据质量八个维度指标

    数据质量与数据质量八个维度指标 数据的质量直接影响着数据的价值,并且直接影响着数据分析的结果以及我们以此做出的决策的质量.质量不高的数据不仅仅是数据本身的问题,还会影响着企业经营管理决策:错误的数据还 ...

  6. python 两个word文档之间的相似度_如何用 word2vec 计算两个句子之间的相似度?

    现在是2018年7月,在这里总结这个问题下已有的答案,并补充一些2017年以来这方面研究的新进展. 从大类上分,计算句子相似度的方法可以分为两类: 1)无监督的方法,即不使用额外的标注数据,常用的方法 ...

  7. 图像相似度匹配——距离大全

    说明: PIL.Image读取图片并resize同一尺寸 scipy.spatial.distance库计算距离(也可用sklearn.metrics.pairwise_distances) 距离越小 ...

  8. 耦合协调度指标如何分析?

    一.应用 耦合协调度模型用于分析事物的协调发展水平.耦合度指两个或两个以上系统之间的相互作用影响,实现协调发展的动态关联关系,可以反映系统之间的相互依赖相互制约程度.协调度指耦合相互作用关系中良性耦合 ...

  9. AMOS分析技术:模型整体拟合度指标

    基础准备 上篇文章,草堂君介绍了如何检验结构方程模型的拟合效果,包括整体模型拟合度指标.测量模型质量指标和结构模型质量指标,其中分析测量模型和结构模型质量的方法是我们前面介绍过的因子分析和路径分析,大 ...

  10. 使用face_recognition:摄像头实时给人脸打马赛克、疲劳检测、活体检测(张嘴检测)、计算两张人脸之间的相似度、人脸校准

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 使用face_recognition进行摄像头实时给人脸打马赛 ...

最新文章

  1. 【组合数学】指数生成函数 ( 指数生成函数性质 | 指数生成函数求解多重集排列 )
  2. [专栏目录]-环境搭建安装问题笔记目录
  3. centos查看当前目录文件夹的大小与tar解压到指定目录
  4. IOS-UISearchBar
  5. C++ template<typename> 模板怎么用
  6. 饥饿游戏3:嘲笑鸟(上)[The Hunger Games:Mockingjay - Part 1]
  7. 腾讯云静态网站托管基本操作
  8. Kettle之Carte最佳实践
  9. 【唐诗学习】五、山水田园诗派代表
  10. 基于Cortex-A53内核Linux系统gec6818开发板的电子自助点餐设计
  11. 什么是着色器/Threejs如何使用着色器/Threejs使用着色器实现平面网格的动态效果案例
  12. 互联网,就是一家007的大茶馆
  13. 远程桌面控制公司内网电脑修改PPT
  14. 2022国产敏捷开发项目管理软件趋势
  15. 数据库分表分库策略和原则
  16. 作业视频辅导 SS2023 HW4:信号卷积分解
  17. 90年三本程序员,8年5跳,年薪4万变92万
  18. kali国内更新源+中文输入法安装+SSH
  19. anaconda安装tar.gz包
  20. 130万奖金池!目标检测、3D点云检测与跟踪、L4规划控制等赛事全面启动!国家智能网联汽车创新中心ICV创新算法攻关任务来了...

热门文章

  1. 查看APP用到的图片方法
  2. Android静默安装
  3. 一个类windows系统的效果图
  4. 观察者模式Java内存管理进阶篇——如何避免内存泄漏
  5. C++复合类型-指针变量
  6. BZOJ2160 拉拉队排练
  7. [FJOI2014] 石子合并问题
  8. koa配合axios做接口
  9. 如何优化及安全设置Linux系统
  10. qt 定义一个长度的数组_6.8 C++字符数组