python实现词语相似度计算分析_相似度计算的方法及Python实现
现实生活中,我们经常提到距离这个词,本文谈的相似度就是基于距离定义的,当两个向量之间的距离特别小时,就说这俩个向量相似度高,反之相似度不高。所以,衡量相似度的指标就是距离度量。
经常使用的相似度计算公式有:欧几里得相似度、余弦相似度、皮尔逊相似度、曼哈顿相似度。
(1)欧几里得相似度:
import numpy as np
def eculidDisSim(x,y):'''欧几里得相似度'''return np.sqrt(sum(pow(a-b,2) for a,b in zip(x,y)))
if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=eculidDisSim(a,b)
(2)余弦相似度:
import numpy as np
def cosSim(x,y):'''余弦相似度'''tmp=np.sum(x*y)non=np.linalg.norm(x)*np.linalg.norm(y)return np.round(tmp/float(non),9)if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=cosSim(a,b)
(3)皮尔逊(pearsonr)相似度:
from scipy.stats import pearsonr
import numpy as np
def pearsonrSim(x,y):'''皮尔森相似度'''return pearsonr(x,y)[0]if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=pearsonrSim(a,b)
(4)曼哈顿相似度:
import numpy as np
def manhattanDisSim(x,y):'''曼哈顿相似度'''return sum(abs(a-b) for a,b in zip(x,y))if __name__=='__main__':a=np.array([1,2,3])b=np.array([6,5,4])sim=manhattanDisSim(a,b)
python实现词语相似度计算分析_相似度计算的方法及Python实现相关推荐
- python爬取岗位数据并分析_区块链岗位薪资高,Python爬取300个区块链岗位分析,龙虎榜出炉...
原创: 菜鸟哥 菜鸟学Python 最近区块链技术再次被大家热议,既然区块链受到如此高的关注,我们就不妨去采集数据分析看看,目前所有与区块链相关的招聘信息吧. 1数据的爬取 首先是对于数据的爬取,由于 ...
- python图像融合算法_图像融合质量评价方法的python代码实现——MS-SSIM
图像融合质量评价方法的python代码实现--MS-SSIM 图像融合质量评价方法的python代码实现--MS-SSIM 文章目录 1 前言 2 MS-SSIM介绍 2 MS-SSIM的代码 2.1 ...
- 基于python的数据爬取与分析_基于Python的网站数据爬取与分析的技术实现策略
欧阳元东 摘要:Python为网页数据爬取和数据分析提供了很多工具包.基于Python的BeautifulSoup可以快速高效地爬取网站数据,Pandas工具能方便灵活地清洗分析数据,调用Python ...
- python金融实务从入门到精通_免费下载中-华尔街学堂:python金融实务从入门到精通,数据实战分析视频教程下载 价值599元...
华尔街学堂:python金融实务从入门到精通 [4.5G] ┣━━第0章 课时 1 学员须知 [145.5M] ┃ ┗━━课时 2 课程讲义及学习资料 [145.5M] ┃ ┣━━data [92.3 ...
- python 流式计算框架_流式计算的三种框架:Storm、Spark和Flink
我们知道,大数据的计算模式主要分为批量计算(batch computing).流式计算(stream computing).交互计算(interactive computing).图计算(graph ...
- python有趣小项目源码分析_推荐 10 个有趣的 Python 项目
想成为一个优秀的开发者,没有捷径可走,势必要花费大量时间在键盘后. 而不断地进行各种小项目开发,可以为之后的大开发项目积攒经验,做好准备. 但不少人都在为开发什么项目而苦恼,因此,我为大家准备了10个 ...
- python简单小游戏赌大小分析_用Python设计一个经典小游戏:猜大小
原标题:用Python设计一个经典小游戏:猜大小 本文主要介绍如何用Python设计一个经典小游戏:猜大小. 游戏规则: 初始本金是1000元,默认赔率是1倍,赢了,获得一倍金额,输了,扣除1倍金额. ...
- python中的数据分析库有哪些_全网最全数据分析师干货-python篇
作者:胖熊酱 著作权归作者所有.AI开发者获得授权转载,禁止二次转载 https://zhuanlan.zhihu.com/p/79873148 注:封面图片来自网络 最近正在准备面试,故整理了很多面 ...
- python协同过滤电影推荐的论文_协同过滤?教你用Python实现协同过滤
提到ALS相信大家应该都不会觉得陌生,它是协同过滤的一种,并被集成到Spark的Mllib库中.本文就ALS的基本原理进行讲解,并手把手.肩并肩地带您实现这一算法. 协同过滤?教你用Python实现协 ...
最新文章
- js编码java解码_js编码处理(转)
- 解决:安装jenkins时web界面出现jenkins实例似乎已离线问题
- Python实例浅谈之三Python与C/C++相互调用
- 写出python中的六种数据类型_python 数据类型1
- 如何使用IDEA 显示一个类的所有方法?与eclipse的outline视图类似
- php俄罗斯方块代码,[原创]Matlab做的俄罗斯方块(含代码)
- 08_MySQL DQL_SQL99标准中的多表查询(内连接)
- jsp解决mysql乱码_解决mysql+jsp出现乱码的问题
- a4纸网页打印 table_打印模板不愁人,你还在打印单调的A4纸吗?
- 耳语(Whisper) app数据泄露致9亿个私密自白曝光:该怎么办?
- 东华理工专科计算机应用,计算机专业考研:东华理工大学计算机应用技术专业介绍...
- 关闭浏览器后Session失效原因分析
- 通过反射获取类的完整结构(1)--属性方法
- Oracle 同音字查询,对外汉语汉字教学
- 常用符号大全 特殊符号
- 最简单日柱推算法_怎样推算大运、小运、流年和命宫?
- 用python预测小孩的身高_python按公式预测身高
- Day51:HEIL AI
- 内网安全(四)---横向渗透:PTHPTKPTT
- python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化