python 文本词汇,句子校正

但是,事实上,spell已经过时了,现在一般使用

from autocorrect import Speller

查看源代码

class Speller:def __init__(self, threshold=0, lang='en'):self.threshold = thresholdtarfile = os.path.join(PATH, 'data/{}.tar.gz'.format(lang))self.nlp_data = load_from_tar(tarfile)self.lang = langif threshold > 0:print('Original number of words: {}'.format(len(self.nlp_data)))self.nlp_data = {k: v for k, v in self.nlp_data.items() if v > threshold}print('After applying threshold: {}'.format(len(self.nlp_data)))def existing(self, words):"""{'the', 'teh'} => {'the'}"""return set(word for word in wordsif word in self.nlp_data)def autocorrect_word(self, word):"""most likely correction for everything up to a double typo"""w = Word(word, self.lang)candidates = (self.existing([word]) or self.existing(w.typos()) or self.existing(w.double_typos()) or [word])return max(candidates, key=self.nlp_data.get)def autocorrect_sentence(self, sentence):return re.sub(word_regexes[self.lang],lambda match: self.autocorrect_word(match.group(0)),sentence)__call__ = autocorrect_sentence

因此,我们可以使用

from autocorrect import Speller
correct=Speller()
correct.autocorrect_sentence(yoursentence)
correct.autocorrect_word(yourword)

python 文本词汇,句子校正 autocorrect库的使用相关推荐

  1. python 文本处理库_推荐8种目前Python使用率最高的文本处理工具

    前言 文本处理一般包括词性标注,句法分析,关键词提取,文本分类,情感分析等等,这是针对中 文的,如果是对于英文来说,只需要基本的tokenize.本文为大家提供了以下这些工具包.我整理了Python的 ...

  2. python文本分析库_8种Python文本处理工具集

    文本处理一般包括词性标注,句法分析,关键词提取,文本分类,情感分析等等,这是针对中文的,如果是对于英文来说,只需要基本的tokenize.本文为大家提供了以下这些工具包. 1.Jieba [结巴中文分 ...

  3. Python:文本分析必备—搜狗词库

    全文阅读:Python:文本分析必备-搜狗词库| 连享会主页 目录 1. 引言 2. 词典的妙用 3. 搜狗词库的下载 3.1 抓取12个页面链接 3.2 爬取所有词库名称和下载链接 3.3 下载细胞 ...

  4. python语音转文字库_py库:文本转为语音(pywin32、pyttsx)

    http://blog.csdn.net/marksinoberg/article/details/52137547 Python 文本转语音 文本转为语音(使用Speech API) 需要安装 py ...

  5. python统计txt文件中不同文字出现的次数_Python统计文本词汇出现次数的实例代码...

    问题描述 有时在遇到一个文本需要统计文本内词汇的次数 的时候 ,可以用一个简单的python程序来实现. 解决方案 首先需要的是一个文本文件(.txt)格式(文本内词汇以空格分隔),因为需要的是一个程 ...

  6. Zhon库:Python文本处理利器!详细攻略带你玩转!

    Zhon库:Python文本处理利器!详细攻略带你玩转! 如果你经常使用Python进行文本处理,那么Zhon库绝对是你不能错过的一个工具库.Zhong库提供了一系列有用的Unicode字符集合,包括 ...

  7. 【Python文本处理】基于运动路线记录GPX文件的基础运动速度求解,并转为SRT字幕格式(不需要安装三方库)

    [Python文本处理]基于运动路线记录GPX文件的基础运动速度求解,并转为SRT字幕格式(不需要安装三方库) 解析 GPX文件格式 GPX文件本身其实就是坐标.海拔.时间.心率等综合性的xml文件 ...

  8. python文本相似度分析_文本相似度分析(基于jieba和gensim)

    ##基础概念 本文在进行文本相似度分析过程分为以下几个部分进行, 文本分词 语料库制作 算法训练 结果预测 分析过程主要用两个包来实现jieba,gensim jieba:主要实现分词过程 gensi ...

  9. python文本结构化处理_在Python中标记非结构化文本数据

    python文本结构化处理 Labelled data has been a crucial demand for supervised machine learning leading to a n ...

最新文章

  1. 博士申请 | 香港中文大学王思博助理教授招收图表示学习方向全奖博士生
  2. js图表控件:highcharts的应用(二)
  3. 高性能NIO框架Netty入门篇
  4. MySQL alter
  5. 【目标检测_keypoint based 方法系列】基于关键点的目标检测
  6. python全景图像拼接_超详讲解图像拼接/全景图原理和应用 | 附源码
  7. ubuntu 12.04 lts搭建android 编译环境
  8. 经典算法题每日演练——第十八题 外排序
  9. [热门]Android系统特质 不需要太多剩余内存
  10. openGauss支持国密SM3和SM4算法
  11. word中字号与磅值(pt字体)的对应关系
  12. Vscode,Open a folder or workspace…(File -> Open Folder)解决方案
  13. Lumerical官方案例、FDTD时域有限差分法仿真学习(八)——光纤布拉格光栅(Fiber Bragg gratings)
  14. html5 csss透明,详解CSS透明opacity和IE各版本透明度滤镜filter的最准确用法
  15. 【清华夏令营2016模拟5.31】图森破
  16. wind 10 安装node环境
  17. 点云法线估计:C++实现
  18. 怎么写竞品分析报告(思路):
  19. 51单片机学习随笔(1)
  20. Spark 图计算实战

热门文章

  1. 如何实现两个笔记本电脑间的文件传输
  2. 攻防世界 forgot
  3. 用C语言复现用贪吃蛇游戏(二)完结
  4. 大疆遥控器向手机充电
  5. OpenLayers基础:在IIS中部署并启用CGI
  6. 如何在Excel中进行趋势分析
  7. C#的System.Diagnostics.Trace.WriteLine 写入文件
  8. 可兼容H27U1G8F2CTR的物料AFND1G08U3-CKA
  9. [蓝桥杯][算法提高VIP]我们的征途是星辰大海
  10. 齐治堡垒机ShtermClient-2.1.1命令执行漏洞(CNVD-2019-09593)分析