二、距离向量

1)欧氏距离

欧式距离是最容易值观理解的距离度量方法。

2)曼哈顿距离

在曼哈顿街区要从一个十字路口开车到另一个十字路口,驾驶距离显然不是两点之前的直线距离。这个实际的驾驶距离就是"曼哈顿距离"。曼哈顿距离也称“城市街区距离”。

3)切比雪夫距离

国际象棋中,国王可以直行、横行、斜行,所以国王走一步可以移动到相邻8个方格中的任意一个。国王从格子(x1,y1)走到格子(x2,y2)最少需要走多少步?这个距离就叫做切比雪夫距离。

4)闵可夫斯基距离

闵氏距离不是一种距离,而是一组距离的定义,是对多个距离度量公式的概括性的表示。

两个n维变量a(x11,x12,…x1n)与b(x21,x22,…,x2n)间的闵可夫斯基距离定义为:

其中p是一个变参数:

  • p=1的时候,就是曼哈顿距离;
  • p=2的时候,就是欧式距离;
  • p→∞的时候,就是切比雪夫距离。

就是根据参数p的不同,闵氏距离可以表示某一种类/种的距离。

但是:

闵氏距离、曼哈顿距离、欧式距离和切比雪夫距离都存在明显的缺点

  • 将各个分两的量纲,也就是“单位”相同看待了。
  • 未考虑各个分量的分布(期望、方差等)可能是不同的。

5)标准化欧氏距离

标准化欧式距离是针对欧式距离的缺点而做的一种改进

思路:既然数据各维分两的分布不一样,那就先将各个分量都”标准化“到均值、方差等。

Sk表示各个维度的标准差

如果将方差的倒数看成一个权重,也可以称之为加权欧式距离

6)余弦距离

几何中,夹角余弦可用来衡量两个向量方向的差异;机器学习中,借用这一概念来衡量样本向量之间的差异。

夹角余弦取值范围为[-1,1]。余弦越大表示两个向量的夹角越小,余弦越小表示两向量的夹角越大。当两个向量的方向重合时余弦取最大值1,当两个向量的方向完全相反余弦取最小值-1。

结果越趋近于1越正相关,越趋近于-1则越负相关,越趋近于0说越无相关。

7)汉明距离

两个等长字符串s1与s2的汉明距离为:将其中一个变成为另一个所需要作的最小替换次数。

汉明重量:是字符串相对于同样长度的零字符串的汉明距离,也就是说,它是字符串中非零的元素个数:对于二进制字符串来说,就是 1 的个数,所以 11101 的汉明重量是 4。因此,如果向量空间中的元素a和b之间的汉明距离等于它们汉明重量的差a-b。

8)杰卡德距离

杰卡德相似系数:两个集合A和B的交集元素在A和B的并集所占的比例,称为两个集合的杰卡德相似系数,用符号J(A,B)表示:

杰卡德距离:与杰卡德相似系数相反,用两个集合中的不同元素占所有元素的比例来衡量两个集合的区分度:

9)马氏距离

下图有两个正态分布图,它们的均值分别为a和b,但方差不一样,则图中的A点离哪个总体更近?或者说A有更大的概率属于谁?显然,A离左边的更近,A属于左边总体的概率更大,尽管A与a的欧式距离远一些。这就是马氏距离的直观解释。

马氏距离是一种基于样本分布的距离

马氏距离是由印度统计学家马哈拉诺比斯提出的,表示数据的协方差距离。它是一种有效的计算两个位置样本集的相似度的方法。

与欧式距离不同的是,它考虑到各种特性之间的联系,即独立于测量尺度。

**马氏距离定义:**设总体G为m维总体(考察m个指标),均值向量为μ=(μ1,μ2,… …,μm,)`,协方差阵为∑=(σij),

则样本X=(X1,X2,… …,Xm,)`与总体G的马氏距离定义为:

马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为∑的随机变量的差异程度:如果协方差矩阵为单位矩阵,马氏距离就简化为欧式距离;如果协方差矩阵为对角矩阵,则其也可称为正规化的欧式距离。

马氏距离特性:

1.量纲无关,排除变量之间的相关性的干扰;

2.马氏距离的计算是建立在总体样本的基础上的,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同;

3 .计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离计算即可。

4.还有一种情况,满足了条件总体样本数大于样本的维数,但是协方差矩阵的逆矩阵仍然不存在,比如三个样本点(3,4),(5,6),(7,8),这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下,也采用欧式距离计算。

距离向量(欧式距离、曼哈顿距离等)相关推荐

  1. ML:图像数据、字符串数据等计算相似度常用的十种方法(余弦相似性、皮尔逊、闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离、马氏距离、汉明距离、编辑距离、杰卡德相似系数、相对熵/KL散度、Helli

    ML:图像数据.字符串数据等计算相似度常用的十种方法(余弦相似性.皮尔逊.闵可夫斯基距离/曼哈顿距离/欧氏距离/切比雪夫距离.马氏距离.汉明距离.编辑距离.杰卡德相似系数.相对熵/KL散度.Helli ...

  2. 曼哈顿距离,欧式距离,余弦距离

    1.曼哈顿距离 曼哈顿距离,叫出租车距离的.具见上图黄线,应该就能明白. 计算距离最简单的方法是曼哈顿距离.假设,先考虑二维情况,只有两个乐队 x 和 y,用户A的评价为(x1,y1),用户B的评价为 ...

  3. 曼哈顿距离,欧式距离,明式距离,切比雪夫距离区别

    根据我浅薄的知识,以及粗浅的语言,随意总结一下. 1.曼哈顿距离 曼哈顿距离又称Manhattan distance,还见到过更加形象的,叫出租车距离的.具体贴一张图,应该就能明白. 上图摘自维基百科 ...

  4. 曼哈顿距离,欧式距离,明式距离,切比雪夫距离以及马氏距离

    1.曼哈顿距离 曼哈顿距离又称Manhattan distance,还见到过更加形象的,叫出租车距离的.具体贴一张图,应该就能明白. 上图摘自维基百科,红蓝黄皆为曼哈顿距离,绿色为欧式距离. 2.欧式 ...

  5. 数据的距离度量 一、欧式距离,曼哈顿距离,闵氏距离,切比雪夫距离,兰氏距离,马氏距离

    数据的距离度量 一.欧式距离,曼哈顿距离,闵氏距离,切比雪夫距离,兰氏距离,马氏距离 前言 欧式距离 标准欧式距离 曼哈顿距离 闵氏距离 切比雪夫距离 兰氏距离 马氏距离 前言 本篇记录一下常用的数据 ...

  6. 详解曼哈顿距离欧式距离切比雪夫距离

    详解曼哈顿&欧式距离&切比雪夫距离 曼哈顿距离 基本概念:出租车几何或曼哈顿距离(Manhattan Distance)是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空 ...

  7. 为什么不可以使用哈曼顿距离_K-means真的不能使用曼哈顿距离吗?

    问题 说到k-means聚类算法,想必大家已经对它很熟悉了,它是基于距离计算的经典无监督算法,但是有一次在我接受面试时,面试官问了我一个问题:"k-means为什么不能使用曼哈顿距离计算,而 ...

  8. 欧几里得距离和曼哈顿距离

    在k-means或kNN,我们常用欧氏距离来计算最近的邻居之间的距离,有时也用曼哈顿距离,请对比下这两种距离的差别. 欧式距离 曼哈顿距离 可以定义曼哈顿距离的正式意义为L1-距离或城市区块距离,也就 ...

  9. 欧几里得距离,曼哈顿距离,切比雪夫距离

    1.欧几里得距离(欧式距离) 它是在m维空间中两个点之间的真实距离.在二维和三维空间中的欧氏距离的就是两点之间的距离(简单来说就是两点之间直线最短的那段距离).相关联的范数称为欧几里得范数,也称 L2 ...

  10. 欧氏距离,曼哈顿距离,闵可夫斯基距离,马氏距离,汉明距离

    欧氏距离 欧氏距离( Euclidean distance)是一个通常采用的距离定义,它是在N维空间中两个点之间的真实距离. 曼哈顿距离 曼哈顿距离是种使用在几何度量空间的几何学用语,用以标明两个点在 ...

最新文章

  1. ​卷积层和分类层,哪个更重要?
  2. Zabbix字符集乱码及Centos7补全设置
  3. Multi-thread--C++11中std::unique_lock的使用
  4. Linux下testlink安装
  5. EasyBert,基于Pytorch的Bert应用
  6. Android Camera 运行流程
  7. dxf geojson 转换_如何将Shapefile(Shp)文件转换为AutoCAD(Dwg、Dxf)文件?
  8. excel表格如何设置双面打印的方法
  9. 深度学习入门学习路线及好课推荐
  10. MMQ 开源免费 同时支持分布式架构和数据持久化、规则引擎、ACL的MQTT broker。
  11. Java 对象 的 比较 - 细节狂魔
  12. 如何让搜狗收录方法分享
  13. 动态与静态Shape
  14. c语言中要让音乐暂停还用什么指令,【Android】Broadcast控制音乐暂停继续等
  15. UE4 材质学习 (01-第一个材质)
  16. 免费换背景app、在线修改图片像素、在线照片压缩网站
  17. week15作业A ZJM 与霍格沃兹
  18. rar格式压缩包无法下载,zip可以下载
  19. 费马小定理(应用+拓展)
  20. AFL源码分析之afl-clang-fast(学习笔记)

热门文章

  1. 信息化与工业化两化融合的时代
  2. 阿玛尼美妆宣布跨性别名模VALENTINA SAMPAIO成为品牌新晋代言人
  3. qt-help学习之路(1)QT与C++ 笔记
  4. 蓝桥杯之FBI树问题
  5. 当代最值得收藏的画家作品_当代最具收藏潜力的实力派画家——徐九龙先生经典作品...
  6. 利用 QGIS 载入和处理 S-57 电子海图数据
  7. spring容器启动事件监听
  8. 极坐标下交换积分次序的方法
  9. 黑裙安装-yellowcong
  10. 到底什么才是真正的距离