前几天帮师兄弄一个错词库,网上找了半天都没有,就自己动手浏览各大论坛、贴吧,自己鼓捣了一个极少的错词库,相对十分简陋,共200+的错词,分成两个txt文档,有需要的可以拿来下载使用。

文件格式:错误-正确\t[错误]例句\t[正确]例句\n

例子:结帐-结账 喝的差不多了人家来[结帐]喝的差不多了人家来[结账]

传送门:https://github.com/Rrbsmoy/NLP/tree/master/Typos_Analysis/WrongWords

错别字分析——自建错词库相关推荐

  1. es自建搜索词库_【ES从入门到实战】二十三、全文检索-ElasticSearch-分词-自定义扩展词库...

    接第22节 3).自定义词库 ik 分词器默认的分词并不能满足我们的需求,对于一些新的网络用语,ik 分词器就会无法准确的进行分词识别,比如: POST _analyze { "analyz ...

  2. es自建搜索词库_ElasticSearch-IK拓展自定义词库(2):HTTP请求动态热词内容方式...

    上一章节(https://my.oschina.net/jsonyang/blog/1643032)我们介绍了使用热词文件形式拓展词库,这样的好处是方便简单,但是如果公司运营人员来直接管理这个东西的话 ...

  3. 情感分析_积极消极词库

    import jiebaimport numpy as np # 打开词典文件,返回列表def open_dict(Dict='hahah',path = 'C:\E\Textming\Textmin ...

  4. 关键词词库制作-搜索词分析工具

    关键词词库制作 关键词词库是一种帮助SEO和SEM优化的工具,它可以帮助您确定关键词的流行程度.竞争程度.搜索意图和其他相关信息等等.以下是一些关键词词库制作的方法: 收集关键词:首先需要收集相关的关 ...

  5. ik分词和jieba分词哪个好_Python 中文 文本分析 实战:jieba分词+自定义词典补充+停用词词库补充+词频统计...

    最近项目需要,实现文本的词频分析,折腾了几天才完成任务,有点成就感,最后整理总结一下这部分的内容,希望更多同僚受益. 一.使用前准备 环境:Python3.6 安装结巴:pip install ji ...

  6. Python:文本分析必备—搜狗词库

    全文阅读:Python:文本分析必备-搜狗词库| 连享会主页 目录 1. 引言 2. 词典的妙用 3. 搜狗词库的下载 3.1 抓取12个页面链接 3.2 爬取所有词库名称和下载链接 3.3 下载细胞 ...

  7. Google原生输入法LatinIME词库构建流程分析(二)

    在Google原生输入法LatinIME词库构建流程分析(一) 中分析LatinIME构建流程进行到了dict_trie->dict_list_->init_list这一步,然后就是构建N ...

  8. 知网 - 情感分析用词语集(beta版)- 情感词库

    找了很久的资源,免费的东西很多人收费下载,分享一下 http://www.keenage.com/html/c_index.html 也有很多其他的情感词库,知乎推荐 https://www.zhih ...

  9. Google原生输入法LatinIME词库构建流程分析--相关数据结构分析

    其实输入法词库相关数据结构的定义基本上都在头文件dictdef.h文件中,进入到代码目录cpp下. 初始化字库,首先读取txt文件内容到数据结构lemma_arr和valid_hzs中,lemma_a ...

最新文章

  1. javascript高级程序设计笔记
  2. iptables连接跟踪ip_conntrack
  3. sprint周期总结
  4. VBoxManage命令详解
  5. 【Linux网络编程】TCP 和 UDP 数据报格式详解
  6. 判断用户的参数(条件测试语句)
  7. 深度学习(06)-- Network in Network(NIN)
  8. 读人是基础,看人是关键,做人最重要
  9. mysql 数据迁移_【AWS 功能】Mysql 数据库迁移至Amazon RDS方案
  10. java 自定义解码_[求助],java如何使用自定义注解对入参进行解密?
  11. 电脑硬盘数据线_这40种电脑故障的排除技巧你都掌握了吗?
  12. ESP8266使用方法
  13. 洛谷P3144 [USACO16OPEN]关闭农场Closing the Farm_Silver
  14. 15.卷2(进程间通信)---门
  15. Java正则表达式【详解】
  16. 【AI视野·今日CV 计算机视觉论文速览 第186期】Fri, 6 Nov 2020
  17. SQL学习之使用order by 按照指定顺序排序或自定义顺序排序
  18. 如何取消(或关闭)win2003中的ie增强安全配置
  19. linux之U盘安装
  20. 先行一步,7 大技术创新和突破,阿里云把 Serverless 领域的这些难题都给解了

热门文章

  1. python汇率转换代码_RMB汇率转换
  2. Web前端面试指导(完结)
  3. Android调用系统相机拍照像素太低以及内存溢出问题
  4. 她26岁成中科大博导:我是工作上灭绝师太,生活中女汉子
  5. 奥泰AOT可视化人工智能区块链操作系统在硅谷立项
  6. Linux系统运行时参数命令--网络IO性能监控
  7. lda plda主题模型
  8. 观察DNF的伤害计算公式
  9. (附源码)Python宿舍管理系统 毕业设计231642
  10. Qt ASSERT:QMetaObjectPrivate::get(smeta)-revision= 7in file kernel\qobject.cpp,line 2646