Py之distance:distance的简介、安装、使用方法之详细攻略
Py之distance:distance的简介、安装、使用方法之详细攻略
目录
distance的简介
distance的安装
distance的使用方法
1、编辑距离、汉明距离、sorensen相似系数、jaccard系数、ifast_comp
distance的简介
这个包为计算任意序列之间的相似性提供了帮助。包括Levenshtein、Hamming、Jaccard和Sorensen distance,以及一些bonuses。所有的距离计算都是用纯Python实现的,而且大多数都是用C语言实现的。
distance的安装
pip install distance
distance的使用方法
1、编辑距离、汉明距离、sorensen相似系数、jaccard系数、ifast_comp
import distance#T1、编辑距离
levenshtein_res01=distance.levenshtein("lenvestein", "levenshtein")#如果您的语言中的声音和字形之间没有一对一的映射,或者如果您想比较的不是字形,而是音节或音素,则可以传入字符元组:
#比较字符串列表对于计算句子、段落等之间的相似性也很有用:
sent1 = ['the', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
sent2 = ['the', 'lazy', 'fox', 'jumps', 'over', 'the', 'crazy', 'dog']
levenshtein_res02=distance.levenshtein(sent1, sent2)levenshtein_res03=distance.nlevenshtein("abc", "acd", method=1) # shortest alignment
levenshtein_res04=distance.nlevenshtein("abc", "acd", method=2) # longest alignmentprint(levenshtein_res01,levenshtein_res02,levenshtein_res03,levenshtein_res04)#T2、汉明距离
'''
Hamming距离和Levenshtein距离可以被标准化,这样就可以有意义地比较几种距离测量的结果。
Levenshtein有两种策略:要么以序列间最短比对的长度作为因子,要么以较长比对的长度作为因子。
'''
hamming_res01=distance.hamming("hamming", "hamning")
hamming_res02=distance.hamming("fat", "cat", normalized=True)print(hamming_res01,hamming_res02)#T3、sorensen相似系数
sorensen_res=distance.sorensen("decide", "resize")
print(sorensen_res)#T4、jaccard系数
jaccard_res=distance.jaccard("decide", "resize")
print(jaccard_res)#T5、ifast_comp
'''
ifast_comp的效率特别高,可以处理100万个tokens而没有问题
两个方便的迭代器ilevenshtein和ifast_comp,用于从一长串序列中筛选接近参考序列的序列。它们都返回一系列元组(距离、序列)。
'''
tokens = ["fo", "bar", "foob", "foo", "fooba", "foobar"]
sorted(distance.ifast_comp("foo", tokens))
Py之distance:distance的简介、安装、使用方法之详细攻略相关推荐
- Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略
Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...
- Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介、使用方法之详细攻略
Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介.使用方法之详细攻略 目录 glob库的简介 glob库的使用方法 1.单个字符通配符:用问号(?)匹配任何单个的字符.
- Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...
- sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略
sklearn之XGBModel:XGBModel之feature_importances_.plot_importance的简介.使用方法之详细攻略 目录 feature_importances_ ...
- Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略
Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...
- sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略
sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...
- Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略
Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...
- Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略
Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径
- Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...
- Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略
Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...
最新文章
- C++ explicit关键字详解(转载)
- 2018年WiFi、5G和蓝牙的发展以及与VR/AR的联系
- ubuntu获取程序的帮助_如何在Raspberry Pi树莓派上安装Ubuntu
- 微信小程序swiper图片尺寸_微信小程序之swiper轮播图中的图片自适应高度的方法...
- ELK日志系统的写入优化
- mysql8建立表格报错
- android开发方法数,Android减少App方法数
- 用 convert2rhel 工具将 CentOS 迁移至 RHEL
- 智能一代云平台(二十四):已安装的Nginx上安装echo插件
- 【bug】VUE:Cannot read property '_withTask' of undefined
- 毕业设计管理系统(JAVA毕业设计)
- Rufus——启动盘创建工具
- android模拟器mac版本下载,TapTap安卓模拟器for Mac-TapTap模拟器Mac版下载 V1.8.3-PC6苹果网...
- 谷歌浏览器设置默认Flash
- 基于融云直播 SDK,快速实现连麦布局(内附代码)
- 用Python来判断输入的身份证号的性别
- ffmpeg常用操作 - 录屏 - 转码
- DINO Emerging Properties in Self-Supervised Vision Transformers 论文阅读
- 把FIL放在哪里最值钱
- live2d_二次元 | live2d为你的网站博客增加萌萌哒的看板娘
热门文章
- linux 下部署Python项目
- YOLO3实现目标检测(VS2015+OPENCV3.4.2+YOLO3+CUDA10.0+CUDNN7.5)
- python和perl区别_对比平台--Perl与Python之间的差异
- 高通软件发布版本简称
- Webpack入门教程三
- 自动化运维工具SaltStack详细部署
- [Node.js]DNS模块
- 本机向windows服务器传输文件的三种方法
- WINDOWS 蓝屏错误代码说明一览表
- 程序员究竟能干多少年?用数据说话!