现实生活中,我们经常提到距离这个词,本文谈的相似度就是基于距离定义的,当两个向量之间的距离特别小时,就说这俩个向量相似度高,反之相似度不高。所以,衡量相似度的指标就是距离度量。

经常使用的相似度计算公式有:欧几里得相似度、余弦相似度、皮尔逊相似度、曼哈顿相似度。

(1)欧几里得相似度:

import numpy as np
def eculidDisSim(x,y):'''欧几里得相似度'''return np.sqrt(sum(pow(a-b,2) for a,b in zip(x,y)))
if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=eculidDisSim(a,b)

(2)余弦相似度:

import numpy as np
def cosSim(x,y):'''余弦相似度'''tmp=np.sum(x*y)non=np.linalg.norm(x)*np.linalg.norm(y)return np.round(tmp/float(non),9)if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=cosSim(a,b)

(3)皮尔逊(pearsonr)相似度:

from scipy.stats import pearsonr
import numpy as np
def pearsonrSim(x,y):'''皮尔森相似度'''return pearsonr(x,y)[0]if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=pearsonrSim(a,b)

(4)曼哈顿相似度:

import numpy as np
def manhattanDisSim(x,y):'''曼哈顿相似度'''return sum(abs(a-b) for a,b in zip(x,y))if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=manhattanDisSim(a,b)

python实现词语相似度计算分析_相似度计算的方法及Python实现相关推荐

  1. python爬取岗位数据并分析_区块链岗位薪资高,Python爬取300个区块链岗位分析,龙虎榜出炉...

    原创: 菜鸟哥 菜鸟学Python 最近区块链技术再次被大家热议,既然区块链受到如此高的关注,我们就不妨去采集数据分析看看,目前所有与区块链相关的招聘信息吧. 1数据的爬取 首先是对于数据的爬取,由于 ...

  2. python图像融合算法_图像融合质量评价方法的python代码实现——MS-SSIM

    图像融合质量评价方法的python代码实现--MS-SSIM 图像融合质量评价方法的python代码实现--MS-SSIM 文章目录 1 前言 2 MS-SSIM介绍 2 MS-SSIM的代码 2.1 ...

  3. 基于python的数据爬取与分析_基于Python的网站数据爬取与分析的技术实现策略

    欧阳元东 摘要:Python为网页数据爬取和数据分析提供了很多工具包.基于Python的BeautifulSoup可以快速高效地爬取网站数据,Pandas工具能方便灵活地清洗分析数据,调用Python ...

  4. python金融实务从入门到精通_免费下载中-华尔街学堂:python金融实务从入门到精通,数据实战分析视频教程下载 价值599元...

    华尔街学堂:python金融实务从入门到精通 [4.5G] ┣━━第0章 课时 1 学员须知 [145.5M] ┃ ┗━━课时 2 课程讲义及学习资料 [145.5M] ┃ ┣━━data [92.3 ...

  5. python 流式计算框架_流式计算的三种框架:Storm、Spark和Flink

    我们知道,大数据的计算模式主要分为批量计算(batch computing).流式计算(stream computing).交互计算(interactive computing).图计算(graph ...

  6. python有趣小项目源码分析_推荐 10 个有趣的 Python 项目

    想成为一个优秀的开发者,没有捷径可走,势必要花费大量时间在键盘后. 而不断地进行各种小项目开发,可以为之后的大开发项目积攒经验,做好准备. 但不少人都在为开发什么项目而苦恼,因此,我为大家准备了10个 ...

  7. python简单小游戏赌大小分析_用Python设计一个经典小游戏:猜大小

    原标题:用Python设计一个经典小游戏:猜大小 本文主要介绍如何用Python设计一个经典小游戏:猜大小. 游戏规则: 初始本金是1000元,默认赔率是1倍,赢了,获得一倍金额,输了,扣除1倍金额. ...

  8. python中的数据分析库有哪些_全网最全数据分析师干货-python篇

    作者:胖熊酱 著作权归作者所有.AI开发者获得授权转载,禁止二次转载 https://zhuanlan.zhihu.com/p/79873148 注:封面图片来自网络 最近正在准备面试,故整理了很多面 ...

  9. python协同过滤电影推荐的论文_协同过滤?教你用Python实现协同过滤

    提到ALS相信大家应该都不会觉得陌生,它是协同过滤的一种,并被集成到Spark的Mllib库中.本文就ALS的基本原理进行讲解,并手把手.肩并肩地带您实现这一算法. 协同过滤?教你用Python实现协 ...

最新文章

  1. js编码java解码_js编码处理(转)
  2. 解决:安装jenkins时web界面出现jenkins实例似乎已离线问题
  3. Python实例浅谈之三Python与C/C++相互调用
  4. 写出python中的六种数据类型_python 数据类型1
  5. 如何使用IDEA 显示一个类的所有方法?与eclipse的outline视图类似
  6. php俄罗斯方块代码,[原创]Matlab做的俄罗斯方块(含代码)
  7. 08_MySQL DQL_SQL99标准中的多表查询(内连接)
  8. jsp解决mysql乱码_解决mysql+jsp出现乱码的问题
  9. a4纸网页打印 table_打印模板不愁人,你还在打印单调的A4纸吗?
  10. 耳语(Whisper) app数据泄露致9亿个私密自白曝光:该怎么办?
  11. 东华理工专科计算机应用,计算机专业考研:东华理工大学计算机应用技术专业介绍...
  12. 关闭浏览器后Session失效原因分析
  13. 通过反射获取类的完整结构(1)--属性方法
  14. Oracle 同音字查询,对外汉语汉字教学
  15. 常用符号大全 特殊符号
  16. 最简单日柱推算法_怎样推算大运、小运、流年和命宫?
  17. 用python预测小孩的身高_python按公式预测身高
  18. Day51:HEIL AI
  19. 内网安全(四)---横向渗透:PTHPTKPTT
  20. python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化

热门文章

  1. antd table排序 vue_商品品牌业务之Vue编写前端页面
  2. 检验例题_高考必考|化学工艺流程之物质的分离提纯及检验鉴别,轻松拿分
  3. Java实现qq截图工具
  4. 前端全栈大佬是如何使用javaScript实现一个焦点图
  5. 如何查看node的版本及安装的位置?
  6. All your files have been encrypted
  7. ExtJs的Reader
  8. 怎么得到scrollTop
  9. 今天发现新大陆:haml和Emmet
  10. Day1 了解web前端