学习笔记5——距离度量(欧氏距离、马氏距离、闵氏距离、曼哈顿距离等)
参考:深度学习中常用的几种距离度量算法 - 简书 (jianshu.com)
常见的9种距离度量方法-电子发烧友网 (elecfans.com)
1.欧氏距离
欧式距离并不是尺度不变的,因此所计算的距离可能会根据特征的单位发生倾斜。通常,在使用欧式距离度量之前,需要对数据进行归一化处理。 此外,随着数据维数的增加,欧氏距离的作用也就越小。这与维数灾难(curse of dimensionality)有关。
用例:当你拥有低维数据且向量的大小非常重要时,欧式距离的效果非常好。如果在低维数据上使用欧式距离,则如 k-NN 和 HDBSCAN 之类的方法可达到开箱即用的效果。
2.曼哈顿距离(城市街区距离,不是两点之间的距离)
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离:
尽管曼哈顿距离在高维数据中似乎可以工作,但它比欧式距离直观性差,尤其是在高维数据中使用时。此外,由于它可能不是最短路径,有可能比欧氏距离给出一个更高的距离值。 用例:当数据集具有离散或二进制属性时,曼哈顿距离似乎工作得很好,因为它考虑了在这些属性的值中实际可以采用的路径。以欧式距离为例,它会在两个向量之间形成一条直线,但实际上这是不可能的。
3.切比雪夫距离(两点之间某一维度的最大值)
切比雪夫距离通常用于特定的用例,这使得它很难像欧氏距离那样作为通用的距离度量。因此,在确定适合用例时才使用它。
用例:切比雪夫距离用于提取从一个方块移动到另一个方块所需的最小移动次数。此外,在允许无限制八向移动的游戏中,这可能是有用的方法。在实践中,切比雪夫距离经常用于仓库物流,因为它非常类似于起重机移动一个物体的时间。
4.闵可夫斯基距离(一组距离)
闵氏距离与它们所代表的距离度量有相同的缺点,因此,对哈顿距离、欧几里得距离和切比雪夫距离等度量标准有个好的理解非常重要。此外,参数 p 的使用可能很麻烦,因为根据用例,查找正确的 p 值在计算上效率低。
用例:p 的积极一面是可迭代,并找到最适合用例的距离度量。它允许在距离度量上有很大的灵活性。
5.马氏距离(与量纲无关)
马氏距离用于度量两个坐标点之间的距离关系,表示数据的协方差距离。与欧氏距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。
6.汉明距离
2个字符串之间一个字符串变为另一个字符串所需要做的最小字符替换次数,用来衡量编码的复杂程度。
例如:
1011101与1001001之间的汉明距离是2。
2143896与2233796之间的汉明距离是3。
学习笔记5——距离度量(欧氏距离、马氏距离、闵氏距离、曼哈顿距离等)相关推荐
- 机器学习理论《统计学习方法》学习笔记:第十章 隐马尔可夫模型(HMM)
第十章 隐马尔可夫模型(HMM) 摘要 隐马尔可夫模型的基本概念 前言 生成模型和判别模型 马尔可夫过程 马尔可夫链 马尔可夫模型 隐马尔可夫模型 隐马尔可夫模型的三个问题 第一 概率计算 第二 学习 ...
- 学习笔记——数据的度量
抽样 概率抽样(随机抽样):可以推断总体. 遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本.具有随机性,不能有带有主观性.概率抽样与等概率抽样是不同的概念.总体中每个单位被抽中的概率 ...
- 机器学习 基础理论 学习笔记 (6)异常值检测和处理
1.异常值定义 异常值是指样本中的个别值,其数值明显偏离它所属样本集的其余观测值. 异常值分析是检验数据是否有录入错误以及含有不合常理的数据.忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据 ...
- K邻近算法概述、欧式距离、Scikit-learn使用 、kNN邻近算法距离度量、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、余弦距离、汉明距离、杰卡德距离、马氏距离
一.K-邻近算法概述 K邻近算(K Nearest Neighbor算法,KNN算法):如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别 ...
- 距离度量:闵氏、欧式、马氏、余弦、汉明等
目录 1. 闵氏距离(Minkowski Distance) 2. 欧式距离(Euclidean Distance) 3. 标准化欧式距离(Standardized Euclidean distanc ...
- 距离度量的方法,欧式距离,切比雪夫距离、马氏距离、巴氏距离,曼哈顿距离
距离度量的方法有欧式距离,切比雪夫距离.马氏距离.巴氏距离,曼哈顿距离等: 用欧氏距离(也称欧几里德度量),高中所学的两点距离公式就是欧氏距离在二维空间上的公式,也就是欧氏距离的n的值为2的情况. 二 ...
- 欧氏距离,曼哈顿距离,闵可夫斯基距离,马氏距离,汉明距离
欧氏距离 欧氏距离( Euclidean distance)是一个通常采用的距离定义,它是在N维空间中两个点之间的真实距离. 曼哈顿距离 曼哈顿距离是种使用在几何度量空间的几何学用语,用以标明两个点在 ...
- 深度学习工作笔记002---曼哈顿距离_欧氏距离
JAVA技术交流QQ群:170933152 出租车几何或曼哈顿距离(Manhattan Distance)是由十九世纪的赫尔曼·闵可夫斯基所创词汇 ,是种使用在几何度量空间的几何学用语,用以标明两个点 ...
- 机器学习中有哪些距离度量方式
点击标题下「AI搞事情」可快速关注 本文涉及到的距离度量方法: 欧氏距离 曼哈顿距离 闵氏距离 切比雪夫距离 标准化欧氏距离 马氏距离 汉明距离 编辑距离 DTW距离 杰卡德相似系数 余弦距离 皮尔逊 ...
- 行人重识别综述学习笔记
文章目录 <行人重识别研究综述> 摘要: 1 行人重识别概述 1.1 背景与研究意义 1.2 研究现状 1.3 评价标准 2 基于图像的行人重识别研究(传统+深度) 2.1 特征表达方法 ...
最新文章
- 真正实现与人更类似的智能!Jeff Hawkins:创造机器智能的路线图
- python中import与input_python : import详解。
- C++程序内存分配方式(堆与栈)
- 软考解析:2017年上半年下午试卷
- 2020年8月小程序互联网发展研究报告
- 正在东京、首尔开DevDays
- Linux软中断、tasklet和工作队列
- 微信小程序 1 ~ Hello 微信小程序
- 客户端软件 大华_大华“飞燕”,一款主打稳定WiFi的路由器!
- poj 3714 Raid
- JAVA设计模式之3-抽象工厂模式
- 苹果投影仪_无线投屏才是真正的王道,明基智能商务投影仪E580
- linux学习命令总结⑩⑦
- 学习爬虫的第三天 (bs4 \ urllib \ xlwt \ re 的练习爬取豆瓣top250保存成excel格式)
- selenium实现12306全自动购票
- 遭遇应用程序正常初始化失败
- OpenCV-白平衡(灰度世界算法)
- 《周一清晨的领导课》读书笔记
- 技术总结--android篇(四)--工具类总结
- 好萌的泰国小萝莉,搞得我也想学uke了