Python提供fuzzywuzzy模块,不仅可用于计算两个字符串之间的相似度,而且还提供排序接口能从大量候选集中找到最相似的句子。

(1)安装

pip install fuzzywuzzy

(2)接口说明

两个模块:fuzz, process,fuzz主要用于两字符串之间匹配,process主要用于搜索排序。

fuzz.ratio(s1,s2)直接计算s2和s2之间的相似度,返回值为0-100,100表示完全相同;

fuzz.partial_ratio(S1,S2)部分匹配,如果S1是S2的子串依然返回100;

fuzz.token_sort_ratio(S1,S2)只比较S1,S2单词是否相同,不考虑词语之间的顺序;

fuzz.token_set_ratio(S1,S2)相比fuzz.token_sort_ratio不考虑词语出现的次数;

process.extract(S1, ListS,limit=n),表示从列表ListS中找出Top n与S1最相似的句子;

process.extractOne(S1,ListS),返回最相似的一个

1

2

3

4

5

6

7

8

9

10

11

(3)使用

from fuzzywuzzy import fuzz

a = 'a b c'

b = ' a c b '

c = 'a c'

fuzz.ratio(a, c)

>> 75

fuzz.ratio(b, c)

>> 60

fuzz.partial_ratio(a, c)

>> 67

fuzz.partial_ratio(b, c)

>> 100

fuzz.token_sort_ratio(a, c)

>> 75

fuzz.token_sort_ratio(b, c)

>> 75

fuzz.token_set_ratio(a, c)

>> 100

fuzz.token_set_ratio(b, c)

>> 100

---------------------

简单易用的字符串模糊匹配库Fuzzywuzzy

简单易用的字符串模糊匹配库Fuzzywuzzy 阅读目录 FuzzyWuzzy 简介 安装 用法 已知移植 FuzzyWuzzy 简介 FuzzyWuzzy 是一个简单易用的模糊字符串匹配工具包.它依 ...

C++实现的字符串模糊匹配

C++基本没有正则表达式功能,当然像Boost里提供了正则.本文来源于博客园园友的一篇文章,请看: C/C++ 字符串模糊匹配 很早之前就看过这篇文章,原作者的需求很明确.代码实现也很好. 之所以又写 ...

流动python - 字符串KMP匹配

首先我们看一下简单的字符串匹配. 你可以把文本字符串s固定,模式字符串p从s对齐的左边缘,作为承担部分完全一致,匹配成功,失败将是模式字符串p整体向右1地点,继续检查对齐部分,重复. #朴素匹配 de ...

mybatis字符串模糊匹配

1.  参数中直接加入%%,注意不需要加两个单引号,加了就会出错,因为系统会自动为字符串类型加上两个单引号

.NET ->> 分享一个字符串模糊匹配指数的方法

链接: http://www.tsjensen.com/blog/post/2011/05/27/Four+Functions+For+Finding+Fuzzy+String+Matches+In+ ...

python模糊匹配之fuzzywuzzy

fuzzywyzzy 是python下一个模糊匹配的模块.首先要安装fuzzywuzzy 示例: from fuzzywuzzy import fuzz from fuzzywuzzy import ...

python中RabbitMQ的使用(路由键模糊匹配)

路由键模糊匹配 使用正则表达式进行匹配.其中“#”表示所有.全部的意思:“*”只匹配到一个词. 匹配规则: 路由键:routings = [ 'happy.work',  'happy.life' , ...

HDU 2585 Hotel(字符串的模糊匹配+递归)

Problem Description Last year summer Max traveled to California for his vacation. He had a great tim ...

mysql 两张表字段模糊匹配--字符串拼接函数

concat(A,B,C,...)  拼接字符串 例如concat('123','***','345')  =>123***345 SELECT concat( substr(t1.CODE, ...

随机推荐

eclipse maven spring mvc el表达式无效

http://www.myexception.cn/javascript/2031310.html

Oracle-记录学习

--select name,count(id) from work_test group by name having count(id)>1--select upper(name),t.*,l ...

Java与WCF交互(一)补充:用WSImport生成WSDL的Java客户端代码

在一 文中,我描述了用axis2的一个Eclipse控件生成WCF的Java客户端代理类,后来有朋友建议用Xfire.CXF,一 ...

LINUX搭建SVN客户端和多个项目的权限分组管理

搭建SVN服务,有效的管理代码,以下三步可以快速搞定.1.安装 #yum install subversion 判断是否安装成功 1 #subversion -v svnserve, version ...

将String转换为其表示的路径画到屏幕上

关于这个问题,我已经在另一篇blog中有所提及: CoreText精彩文字轮廓绘制动画的一点改进 不过原有的转换代码使用Obj-C写的,在这里我们尝试将其转换为Swift语言,然后利用它实现一个测试小 ...

基于.NetCore的Redis5.0.3(最新版)快速入门、源码解析、集群搭建与SDK使用【原创】

1.[基础]redis能带给我们什么福利 Redis(Remote Dictionary Server)官网:https://redis.io/ Redis命令:https://redis.io/co ...

AndrewNG Deep learning课程笔记 - CNN

参考, An Intuitive Explanation of Convolutional Neural Networks http://www.hackcv.com/index.php/archiv ...

微信公众号UX分析—— 学生作业小结

1. 不足: 1. 权威性:个人帐号,显得不够正式. 2. 排版问题: + 没有必要的外接端口,界面设计极度缺少排版.哪怕是个人公众号都不至于如此,更何况这是一个学校的教务平台. 3. 反应不及时或无 ...

win10 Java环境变量,hadoop 环境变量

妈呀,今天又重装了系统.需要装上java环境. 安装环境老百度,然后老掉坑.(path 路经) 1,新建环境变量 JAVA_HOME 2, 新建 CLASSPATH 环境变量 .;%JAVA_HOME ...

python模糊匹配_python 字符串模糊匹配 Fuzzywuzzy相关推荐

  1. python贪婪匹配_python re模块匹配贪婪和非贪婪模式详解

    python re模块匹配贪婪和非贪婪模式详解 这篇文章主要介绍了python re模块匹配贪婪和非贪婪模式详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友 ...

  2. python输出举例_python字符串格式化输出及相关操作代码举例

    字符串的格式化 Python 支持格式化字符串的输出 .尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中.在   Python 中,字符串格式化使 ...

  3. python isalnum函数_Python 字符串 (isdigit, isalnum,isnumeric)转

    Python isdigit() 方法检测字符串是否只由数字组成. 语法 isdigit()方法语法: str.isdigit() 参数 无. 返回值 如果字符串只包含数字则返回 True 否则返回 ...

  4. python 字符匹配_python 中如何匹配字符串

    python 中如何匹配字符串? 1. re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none.import re line="th ...

  5. python实现括号匹配_python实现括号匹配

    主要的思路: 首先设置两个列表分别存放的是各种括号的开括号和闭括号,然后遍历给定的字符串,分如下几种情况: 1.字符串首字符出现在闭括号列表中,直接结束,输出错误 2.字符串长度不为偶数,直接结束,输 ...

  6. python字典模糊查找_python字典模糊查询-女性时尚流行美容健康娱乐mv-ida网

    女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页  > 高级搜索 access中的 模糊 查询 ...

  7. python正则匹配_Python正则表达式只匹配一次

    我正在尝试创建一个简单的降价乳胶转换器,只是为了学习 python和基本的正则表达式,但我不知道试图弄清楚为什么下面的代码不起作用: re.sub (r'\[\*\](.*?)\[\*\]: ?(.* ...

  8. python完全匹配_python如何精确匹配

    各位大虾好! 小弟有一个文件里面是这个样子:data_center = { access_key = { ak = "this is ak", sk = "this is ...

  9. python忽略大小写_Python字符串忽略大小写实现搜索和替换

    为了针对字符串操作忽略大小写,我们可以使用re模块的时候利用re.IGNORECASE标记参数来达到效果,示例如下: #!/usr/bin/env python3 # _*_coding:utf-8_ ...

  10. php正则匹配任意字符串,正则表达式匹配任意字符(包括换行符)

    正则表达式中,"."(点符号)匹配的是除了换行符"\n"以外的所有字符.但有时候我们需要匹配包括换行符在内的字符,经过一番搜索,发现了几种正则表达式匹配任意字符 ...

最新文章

  1. 时间计时android程序,Android 时间计时器控件 Chronometer
  2. ServerSocket
  3. js 根据模板动态添加行
  4. java密码查询回显和修改流程_[求助]数据库信息如何回显在我的程序界面中
  5. Thinking in Java 14.3.3递归计数
  6. 微分几何笔记(8) —— 切向量,切空间
  7. Matlab fspecial函数
  8. debian sid 安装 sopcast
  9. 腾讯云学生服务器+wordpress搭建个人网站
  10. CentOS7安装Pure-ftpd
  11. 搞金融不能用mysql_金融行业数据库何去何从
  12. 新零售mysql设计(采购表 入库信息表 入库商品表)
  13. Python爬虫响应码为404错误
  14. Mapped Statements collection does not contain value for XXX错误
  15. Electron 初探
  16. 服务器swap占用过高,主机swap区使用率过高
  17. CDA Level I 模拟题(2)【附答案解析】
  18. 计算机与网络连接需要什么设置,如何设置宽带连接,详细教您如何设置宽带连接...
  19. 4G AI 智能模块 - MT8788 (I500P)
  20. 营业执照OCR识别/营业执照识别优势

热门文章

  1. 2022百度之星程序设计大赛 - 复赛 1003 最大值
  2. 只需8招,搞定Pandas数据筛选与查询
  3. platform.pk8,platform.x509.pem生成keystore的方法
  4. 关于GBK编码及C语言中文输出问题
  5. 在LUA中使用异步IO的思考
  6. 文本的编码格式: ANSI、ASCII、UTF8、UNICODE、GB2312、UCS-2、UTF16
  7. OpenCV3计算机视觉:Python实现 读书笔记-第二章
  8. 智慧旅游系统总体设计方案
  9. HBase权威指南(百度云免费下载)
  10. 怎么制作自己的数据集