通过使用wordnet文本匹配,我意识到wordnet只能将一个单词与一个单词进行匹配。它不能将一个单词与一个短语相匹配。在

如你所见,我有两个清单。在list1=['fruit', 'world']

list2=[u'domain', u'creation Year', u'world Tournament Silver', u'relation', u'existence', u'id', u'publication',

u'third Commander', u'management Region', u'ra', u'Earthquake', u'final Publication Year', u'creation Christian Bishop',

u'Planet', u'management Position', u'Race', u'world', u'first Publication Year', u'main Domain',

u'golden Globe Award', u'ist', u'race', u'world Tournament Bronze', u'top Level Domain', u'lower Earth Orbit Payload']

列表2由单个单词和短语组成。比如关系、管理职位。。。。。。在

目前我使用wordnet来查找相似性

^{pr2}$

结果是:(0.125, u'fruit', u'sphere')

(0.16666666666666666, u'fruit', u'relation')

(0.14285714285714285, u'fruit', u'being')

(0.3157894736842105, u'fruit', u'Idaho')

(0.4444444444444444, u'fruit', u'publication')

(0.25, u'fruit', u'radium')

(0.25, u'fruit', u'earthquake')

(0.625, u'fruit', u'planet')

(0.125, u'fruit', u'race')

(0.6666666666666666, u'fruit', u'universe')

(0.125, u'fruit', u'race')

(0.15384615384615385, u'universe', u'sphere')

(0.2222222222222222, u'universe', u'relation')

(0.18181818181818182, u'universe', u'being')

(0.375, u'universe', u'Idaho')

(0.5333333333333333, u'universe', u'publication')

(0.3076923076923077, u'universe', u'radium')

(0.3076923076923077, u'universe', u'earthquake')

(0.7692307692307693, u'universe', u'planet')

(0.15384615384615385, u'universe', u'race')

(1.0, u'universe', u'universe')

(0.15384615384615385, u'universe', u'race')

问题是wordnet只比较单个单词,而不比较列表2中单个单词与短语之间的相似度。在such as 'world' VS 'world Tournament Silver'

'world' VS 'world Tournament Bronze'

'world' VS 'createion Year'

.......................

那么如何解决这个问题呢?在

python词组语义相似度_文本匹配,语义相似度,匹配相似短语/单词python语义wordNet模糊匹配...相关推荐

  1. python余弦相似度_推荐系统01--余弦相似度

    今天,我们来聊聊协同过滤中的相似度计算方法有哪些. 相似度的本质 推荐系统中,推荐算法分为两个门派,一个是机器学习派,另一个就是相似度门派.机器学习派是后起之秀,而相似度派则是泰山北斗,以致撑起来推荐 ...

  2. python求近似值_python 已知一个字符,在一个list中找出近似值或相似值实现模糊匹配...

    已知一个元素,在一个list中找出相似的元素 使用场景: 已知一个其它来源的字符串, 它有可能是不完全与我数据库中相应的字符串匹配的,因此,我需要将其转为适合我数据库中的字符串 使用场景太绕了, 直接 ...

  3. java 圈复杂度_详解圈复杂度

    详解圈复杂度 圈复杂度概念 圈复杂度(Cyclomatic complexity,简写CC)也称为条件复杂度,是一种代码复杂度的衡量标准.由托马斯·J·麦凯布(Thomas J. McCabe, Sr ...

  4. 32岁了学python来的及吗_为什么每个人都应该在2020年学习Python?

    如今每个人都在谈论 Python,包括那些曾经对 Python 嗤之以鼻的人.本文作者 Javinpaul 原是一名 Java 狂热粉,他以前还曾号召大家学习 Java 而不是 Python.如今他的 ...

  5. java能测圈复杂度_[Java教程]圈复杂度

    [Java教程]圈复杂度 0 2015-12-02 13:00:42 Cyclomatic Complexity 1. 概念 a. 圈复杂度是一种衡量代码复杂程度的标准. b. 圈复杂度高的害处: 圈 ...

  6. python做erp系统教程_“python2.7教程廖雪峰“刚开始学openERP Python,如何快速入门?...

    为什么廖雪峰的JS教程不如Python 教程 娃娃哈 廖雪峰python教程在哪 这是他的网址:www.liaoxuefeng.com 这是python专有python2.7,python3,可供选择 ...

  7. python好用的软件_【分享|10款超好用的辅助Python的软件,初学者请查收!】- 环球网校...

    [摘要]在这个科学技术高速发展的时代,越来越多的人都开始选择学习编程软件,那么首先被大家选择的编程软件就是python,也用在各行各业之中,并被大家所熟知,所以也有越来越多的python学习者关注Py ...

  8. python print end报错_下面代码的输出结果是 for i in Python: print(i,end= )_学小易找答案...

    [单选题]关于Python字符串,以下选项中描述错误的是 [单选题]以下程序的输出结果是: lcat =["狮子","猎豹","虎猫",&q ...

  9. is在python中是什么意思_【IT专家】关键字:is和=在python中有什么区别

    本文由我司收集整编,推荐下载,如有疑问,请与我司联系 关键字: is 和 = 在 python 中有什么区别 关键字: is 和 = 在 python 中有什么区别 [ 英 ]What is the ...

最新文章

  1. An RFC destination could not be specified for the logical system QI3CLNT504
  2. 数学的威力:一个方程提升中国卫星图像质量30%
  3. 7月份Github上最热门的Java开源项目
  4. 全网最细Docker安装Minio,填满最新版大坑(强烈推荐收藏)
  5. 【啊哈!算法】算法6:只有五行的Floyd最短路算法
  6. Centos 安装最新版git
  7. 图解数据结构(04) -- 哈希表
  8. 马斯洛人类需求金字塔理论
  9. 破解封杀ADSL路由器解决办法全面剖析
  10. SpringBoot_快速实战搭建项目
  11. High Reward Low Risk Strategies
  12. Gentoo Linux+KDE Plasma桌面安装教程
  13. 将进酒计算机应用技术学院信息门户,《将进酒》信息化教学设计
  14. 数据库实验三 数据查询二
  15. c++实现猜单词游戏
  16. 魔蝎座提供伤感QQ日志_一转身可能就是一世
  17. 利用计算机教学的体会,利用多媒体教学设备心得体会
  18. 织梦CMS仿某中国作文网源码 范文论文网模板 带会员系统+支付接口+整站数据
  19. pytest合集(14)— allure快速入门
  20. 人体检测技术之红外对管

热门文章

  1. Veeam虚拟化备份
  2. puppet 学习总结(1)——puppet 入门详解
  3. Redis学习总结(18)——Redis 常见的使用场景汇总
  4. 淘宝的开源分布式文件系统TFS
  5. php删除树结构文件,树型结构列出目录中所有文件的php代码
  6. 计算机组成原理第二章测试题,计算机组成原理第二章习题答案.doc
  7. 在Linux系统中应用su和sudo
  8. HTML-CSS-JS Prettify报错Node.js was not found 解决方法
  9. wcf双工通讯遇到的问题
  10. Linux VFS的主要的数据结构