余弦相似度常用在文本分类、图片分类等应用中,来计算两个文本或两个图像之间的相似度。


余弦相似度的取值范围在-1到1之间。余弦值越接近1,也就是两个向量越相似,完全相同时数值为1;相反反向时为-1;正交或不相关是为0。

求余弦相似度需要用到np.linalg.norm 操作,来求向量的范式,默认是L2范式,等同于求向量的欧式距离。

import numpy as np
t1  = np.array([-0.4,0.8,0.5,-0.2,0.3])
t2  = np.array([-0.5,0.4,-0.2,0.7,-0.1])def cos_sim(a, b):a_norm = np.linalg.norm(a)b_norm = np.linalg.norm(b)cos = np.dot(a,b)/(a_norm * b_norm)return cos
print(cos_sim(t1,t2))

转载来源

python计算余弦相似度相关推荐

  1. python用余弦相似度计算英文文本相似度

    reference:https://blog.csdn.net/u012160689/article/details/15341303 # -*- coding:utf-8 -*- # 余弦计算相似度 ...

  2. python根据词向量计算相似度_如何使用gensim的word2vec模型和python计算句子相似度...

    如何使用gensim的word2vec模型和python计算句子相似度 根据Gensim Word2Vec,我可以使用gensim包中的word2vec模型来计算2个单词之间的相似度. 例如 trai ...

  3. 过滤豆瓣租房小组中介贴之 python 实现余弦相似度(转)

    为什么80%的码农都做不了架构师?>>>    前几天做了个微信找房机器人, 爬取豆瓣租房小组的时候发现很多伪装的中介帖,如下这种格式: 可月付 无中介 方庄地铁附近 芳城园一区单间 ...

  4. php数据分析引擎,PHP数据分析引擎计算余弦相似度算法示例

    php 的 PHP数据分析引擎计算余弦相似度算法示例 本文实例讲述了PHP数据分析引擎计算余弦相似度算法.分享给大家供大家参考,具体如下: 关于余弦相似度的相关介绍可参考百度百科: /** * 数据分 ...

  5. pytorch计算余弦相似度

    在pytorch中,可以使用torch.cosine_similarity函数对两个向量或者张量计算余弦相似度.先看一下pytorch源码对该函数的定义: class CosineSimilarity ...

  6. NLP-文本匹配-2016:MaLSTM(ManhaĴan LSTM,孪生神经网络模型)【语句相似度计算:用于文本对比,内容推荐,重复内容判断】【将原本的计算余弦相似度改为一个线性层来计算相似度】

    <MaLSTM原始论文:Siamese Recurrent Architectures for Learning Sentence Similarity> MaLSTM模型(ManhaĴa ...

  7. 相似度算法 php,PHP计算余弦相似度算法

    这篇文章主要介绍了PHP数据分析引擎计算余弦相似度算法,结合具体实例形式分析了php计算余弦相似度的操作步骤与相关实现技巧,需要的朋友可以参考下 本文实例讲述了PHP数据分析引擎计算余弦相似度算法.分 ...

  8. java计算余弦相似度

    您可以使用以下java代码来计算余弦相似度 import java.util.List;public class CosineSimilarity {public static double cosi ...

  9. python用角度计算余弦值_Python 使用sklearn计算余弦相似度

    背景 在计算相似度时,常常用到余弦夹角来判断相似度,Cosine(余弦相似度)取值范围[-1,1],当两个向量的方向重合时夹角余弦取最大值1,当两个向量的方向完全相反夹角余弦取最小值-1,两个方向正交 ...

  10. 使用Keras计算余弦相似度(Cosine Similarity)

    因为Merge函数在Keras新版本中已经不再使用了,在计算批次余弦相似度时,需要自定义函数.余弦相似度定义如下: 要计算两个向量相似度有如下步骤: 分别计算两个向量l2范式,计算两个向量的点乘 点乘 ...

最新文章

  1. 浅谈Java throw, throws, try catch异常处理
  2. 全套CRC校验的算法
  3. 优先级反转和解决方法
  4. exe4j打包成可执行程序
  5. 软考安全工程师历年真题汇总
  6. 简练软考知识点整理-估算成本过程
  7. 华为云应用服务网格最佳实践之从Spring Cloud 到 Istio
  8. HDU 4081 Qin Shi Huang's National Road System
  9. 百度MP3音乐API接口及应用
  10. Android Sutiod报错:Dx unsupported class file version 52.0(解决)
  11. Codeforces Round #449 (Div. 2) B Chtholly's request (预处理)
  12. python+selenium常见坑
  13. VS2017 离线安装包下载
  14. 计算机操作系统核心知识点总结面试笔试要点
  15. ShadowGun Shaders
  16. android 出错信息为:Class 'Anonymous class derived from Handler' must either be declared abstract or imple
  17. 树莓派3B制作无线wifi(桥接模式)
  18. 郑捷 机器学习算法与编程实践 --ID3决策树 python3 代码
  19. [LOJ575]不等关系
  20. CUDA学习:Windows下的CUDA环境配置

热门文章

  1. 外国人入境日本 后天起须留指印头像
  2. bootstrap登录模板
  3. CSS Cascading Style Sheets 层叠样式表:CSS了解 (一)
  4. Matlab函数psf2otf()的python实现
  5. Java XLS 转 XLSX
  6. Unity3dC#分布式游戏服务器ET框架介绍-组件式设计(转)
  7. 业务:金融科技行业分析
  8. 中国遥感数据查询网址
  9. 在立创商城上快速制作PCB原理图库
  10. 快速保存网页资料——fireshot与PDFdownload