Py之distance:distance的简介、安装、使用方法之详细攻略

目录

distance的简介

distance的安装

distance的使用方法

1、编辑距离、汉明距离、sorensen相似系数、jaccard系数、ifast_comp


distance的简介

这个包为计算任意序列之间的相似性提供了帮助。包括Levenshtein、Hamming、Jaccard和Sorensen distance,以及一些bonuses。所有的距离计算都是用纯Python实现的,而且大多数都是用C语言实现的。

distance的安装

pip install distance

distance的使用方法

1、编辑距离、汉明距离、sorensen相似系数、jaccard系数、ifast_comp


import distance#T1、编辑距离
levenshtein_res01=distance.levenshtein("lenvestein", "levenshtein")#如果您的语言中的声音和字形之间没有一对一的映射,或者如果您想比较的不是字形,而是音节或音素,则可以传入字符元组:
#比较字符串列表对于计算句子、段落等之间的相似性也很有用:
sent1 = ['the', 'quick', 'brown', 'fox', 'jumps', 'over', 'the', 'lazy', 'dog']
sent2 = ['the', 'lazy', 'fox', 'jumps', 'over', 'the', 'crazy', 'dog']
levenshtein_res02=distance.levenshtein(sent1, sent2)levenshtein_res03=distance.nlevenshtein("abc", "acd", method=1)  # shortest alignment
levenshtein_res04=distance.nlevenshtein("abc", "acd", method=2)  # longest alignmentprint(levenshtein_res01,levenshtein_res02,levenshtein_res03,levenshtein_res04)#T2、汉明距离
'''
Hamming距离和Levenshtein距离可以被标准化,这样就可以有意义地比较几种距离测量的结果。
Levenshtein有两种策略:要么以序列间最短比对的长度作为因子,要么以较长比对的长度作为因子。
'''
hamming_res01=distance.hamming("hamming", "hamning")
hamming_res02=distance.hamming("fat", "cat", normalized=True)print(hamming_res01,hamming_res02)#T3、sorensen相似系数
sorensen_res=distance.sorensen("decide", "resize")
print(sorensen_res)#T4、jaccard系数
jaccard_res=distance.jaccard("decide", "resize")
print(jaccard_res)#T5、ifast_comp
'''
ifast_comp的效率特别高,可以处理100万个tokens而没有问题
两个方便的迭代器ilevenshtein和ifast_comp,用于从一长串序列中筛选接近参考序列的序列。它们都返回一系列元组(距离、序列)。
'''
tokens = ["fo", "bar", "foob", "foo", "fooba", "foobar"]
sorted(distance.ifast_comp("foo", tokens))

Py之distance:distance的简介、安装、使用方法之详细攻略相关推荐

  1. Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介、使用方法之详细攻略

    Py之matplotlib.pyplot:matplotlib.pyplot的plt.legend函数的简介.使用方法之详细攻略 目录 matplotlib.pyplot的plt.legend函数的简 ...

  2. Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介、使用方法之详细攻略

    Py之glob: glob库文件名模式匹配+返回所有匹配的文件路径列表库的简介.使用方法之详细攻略 目录 glob库的简介 glob库的使用方法 1.单个字符通配符:用问号(?)匹配任何单个的字符.

  3. Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的RobustScaler 函数的简介及使用方法之详细攻略 目录 sklearn中的RobustScaler 函数的简介及使用方法 sklearn中的R ...

  4. sklearn之XGBModel:XGBModel之feature_importances_、plot_importance的简介、使用方法之详细攻略

    sklearn之XGBModel:XGBModel之feature_importances_.plot_importance的简介.使用方法之详细攻略 目录 feature_importances_ ...

  5. Python语言学习:Python常用自带库(imageio、pickle)简介、使用方法之详细攻略

    Python语言学习:Python常用自带库(imageio.pickle)简介.使用方法之详细攻略 目录 imageio简介及其常见使用方法 pickle简介及其常见使用方法 简介 使用方法 简介及 ...

  6. sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform、transform、inverse_transform简介、使用方法之详细攻略

    sklearn:sklearn.preprocessing.StandardScaler函数的fit_transform.transform.inverse_transform简介.使用方法之详细攻略 ...

  7. Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ、负载均衡、F5、Nginx、容器)的简介、使用方法之详细攻略

    Computer:互联网开放平台项目知识补充之开发-运维-网络-网关等术语(DMZ.负载均衡.F5.Nginx.容器)的简介.使用方法之详细攻略 目录 DMZ(隔离区)的简介及其使用方法 1.DMZ区 ...

  8. Python编程语言学习:包导入和模块搜索路径简介、使用方法之详细攻略

    Python编程语言学习:包导入和模块搜索路径简介.使用方法之详细攻略 目录 包导入和模块搜索路径简介 1.Pyhon搜索模块路径的机制 2.自定义配置搜索路径

  9. Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn.preprocessing中的StandardScaler函数的简介及使用方法之详细攻略 目录 sklearn.preprocessing中的Stand ...

  10. Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略

    Python之 sklearn:sklearn中的train_test_split函数的简介及使用方法之详细攻略 目录 sklearn中的train_test_split函数的简介 train_tes ...

最新文章

  1. C++ explicit关键字详解(转载)
  2. 2018年WiFi、5G和蓝牙的发展以及与VR/AR的联系
  3. ubuntu获取程序的帮助_如何在Raspberry Pi树莓派上安装Ubuntu
  4. 微信小程序swiper图片尺寸_微信小程序之swiper轮播图中的图片自适应高度的方法...
  5. ELK日志系统的写入优化
  6. mysql8建立表格报错
  7. android开发方法数,Android减少App方法数
  8. 用 convert2rhel 工具将 CentOS 迁移至 RHEL
  9. 智能一代云平台(二十四):已安装的Nginx上安装echo插件
  10. 【bug】VUE:Cannot read property '_withTask' of undefined
  11. 毕业设计管理系统(JAVA毕业设计)
  12. Rufus——启动盘创建工具
  13. android模拟器mac版本下载,TapTap安卓模拟器for Mac-TapTap模拟器Mac版下载 V1.8.3-PC6苹果网...
  14. 谷歌浏览器设置默认Flash
  15. 基于融云直播 SDK,快速实现连麦布局(内附代码)
  16. 用Python来判断输入的身份证号的性别
  17. ffmpeg常用操作 - 录屏 - 转码
  18. DINO Emerging Properties in Self-Supervised Vision Transformers 论文阅读
  19. 把FIL放在哪里最值钱
  20. live2d_二次元 | live2d为你的网站博客增加萌萌哒的看板娘

热门文章

  1. linux 下部署Python项目
  2. YOLO3实现目标检测(VS2015+OPENCV3.4.2+YOLO3+CUDA10.0+CUDNN7.5)
  3. python和perl区别_对比平台--Perl与Python之间的差异
  4. 高通软件发布版本简称
  5. Webpack入门教程三
  6. 自动化运维工具SaltStack详细部署
  7. [Node.js]DNS模块
  8. 本机向windows服务器传输文件的三种方法
  9. WINDOWS 蓝屏错误代码说明一览表
  10. 程序员究竟能干多少年?用数据说话!