paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.

mmseg默认词库只能是文件格式...不好维护..要是不个词库放的个数据库里面走好维护兰..
要实现2个目标..:
1.禁用默认词库,仅仅使用自定义词库
2.词库从数据库读取,而不使用默认的文件方式,方便维护..

作者Attilax  艾龙,  EMAIL:1466519819@qq.com 
来源:attilax的专栏
地址:http://blog.csdn.net/attilax

Dictionary.getInstance("")来的禁用默认词库,无效果...
查看Dictionary.loadDic 源码...看来无法通过dic = Dictionary.getInstance("");的方式来禁用它的默认词库...

只好扩展Dictionary了..new 了一个class,继承了Dictionary,重写loadDic方法...change 孪一瓦方法的..visiablity...这个方法虽然能行,要overwrite一瓦方法了.麻烦.半路儿上放弃...

换个丝路,不个哪加载的词库在给他卸除孪走ok兰吗.haha...
dic = Dictionary.getInstance();

//delete default words
Map<Character, CharNode> dict=dic.getDict();
Set set=dict.keySet();
Iterator<Character> it = set.iterator();  
while (it.hasNext()) {  
Character key = it.next();  
//  String val=String.valueOf( dict.get(key));
 CharNode cn=dict.get(key);
 cn.ktWordTails=new   KeyTree();  
}

这样,走 禁用孪默认词库兰...完成孪1半儿兰..

词库从数据库读取到list,如何不个这个List动态加载到mmseg呢??

List<String> li=new ArrayList<String>();
li.add("上学好");
li.add("卖衣裳");

for(String word:li)
{
if(word.trim().length()==0 || word.length()<2)
continue;
String line=word;

CharNode cn = dict.get(line.charAt(0));
if(cn == null) {
cn = new CharNode();
dict.put(line.charAt(0), cn);
}else
cn.addWordTail(dic.tail(line));

}

扎实ok兰..哈

paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.相关推荐

  1. es自建搜索词库_ElasticSearch-IK拓展自定义词库(2):HTTP请求动态热词内容方式...

    上一章节(https://my.oschina.net/jsonyang/blog/1643032)我们介绍了使用热词文件形式拓展词库,这样的好处是方便简单,但是如果公司运营人员来直接管理这个东西的话 ...

  2. linux编译动态库未定义,自定义动态库 对‘*’未定义的引用解决方法

    自定义动态库 对'*'未定义的引用 本帖最后由 longruliang 于 2015-05-25 16:02:26 编辑 自己编写了一个串口方面的动态库,想写一个测试程序,在编译的时候冒出对'*'未定 ...

  3. python默认词云颜色_Python 绘制词云

    1. 准备 安装好python,安装时包含pip 包管理工具 pip install jieba pip install matplotlib import matplotlib.pyplot as ...

  4. linux添加自己的库,Linux学习笔记——例叙makefile 增加自定义共享库

    Linux学习笔记--例说makefile 增加自定义共享库 0.前言 从学习C语言开始就慢慢开始接触makefile,查阅了很多的makefile的资料但总感觉没有真正掌握makefile,如果自己 ...

  5. 结巴分词完全禁用默认词库(仅使用自定义词库)

    有时候需要使用自定义的词库,不使用默认的词库.比如做敏感词分词时, 完全禁用掉默认词库. jieba 分词里面可以这样处理,通过set_dictionary 来设置自定义词库,从而禁用掉默认词库. i ...

  6. 白话Elasticsearch29-IK中文分词之IK分词器配置文件+自定义词库

    文章目录 概述 ik配置文件 IK自定义词库 自定义词库 Step1 : 新建自定义分词库 Step2 : 添加到ik的配置文件中 Step3 :重启es ,查看分词 自定义停用词库 Step1 : ...

  7. wordcloud库的常规方法及词云绘制实例

    对一文本wordclound.txt进行词云绘制 import jieba import wordcloud f = open("wordcloudeg.txt","r& ...

  8. IKAnalyzer 添加扩展词库和自定义词

    原文链接http://blog.csdn.net/whzhaochao/article/details/50130605 IKanalyzer分词器 IK分词器源码位置 http://git.osch ...

  9. ElasticSearch 中文分词器ik的安装、测试、使用、自定义词库、热更新词库

    文章目录 # 实验环境 # ik分词器的下载.安装.测试 ## 安装方法一:使用elasticsearch-plugin 安装 ## 安装方法二:下载编译好的包进行安装 1.下载 2.安装 3.重启` ...

  10. Elasticsearch学习1 入门进阶 Linux系统下操作安装Elasticsearch Kibana 初步检索 SearchAPI Query DSL ki分词库 自定义词库

    文章目录 一.全文检索-Elasticsearch 1.Elasticsearch简介 2.全文搜索引擎 二.docker安装 1.elasticsearch启动 2.kibana启动 三.[入门]初 ...

最新文章

  1. OSChina 周六乱弹 —— 胖点其实挺好
  2. 深入理解LSM-Tree
  3. hive的udf,udaf,udtf各自依賴兩種class(转载+分析整理)
  4. 先弄个XML解析器代码抄一抄 慢慢研究 O(∩_∩)O哈哈~
  5. gin redis 链接不上_Redis 高并发问题,及解决方案!
  6. (转)一台服务器安装两个tomcat6 服务的解决方案
  7. b站在线解析_一个小工具,教你如何轻松下载B站上喜欢的视频!
  8. 线段树专辑—— pku 3468 A Simple Problem with Integers
  9. [51nod1232]完美数
  10. mysql group 最大值_MySQL groupwise最大值为字段的长度
  11. 抢占氢能产业发展风口,上海重塑能源集团股份有限公司助推行业发展
  12. 太牛了!某大佬程序猿北漂16年,从睡天桥到身价数千万,衣锦还乡重庆住豪宅!...
  13. 富途出海淘金:泡沫翻涌 焦虑不止
  14. DOS时代往事的回忆
  15. 感冒了吃什么药好的快服用三九感冒灵的同时多喝白开水
  16. java里short,int,long,float,double范围及可写位数
  17. 2021 年 9 项优秀在线电话会议服务比较(带免费选项)
  18. 希尔伯特变换(Hilbert Transform)的性质
  19. 服务器响应状态码statusCode
  20. 【转载】一句话实现五彩LINUX

热门文章

  1. 基于FTP服务器搭建yum源
  2. TCP为什么是3次握手而不是2次或者4次或者更多次?
  3. EasyIcon:免费图标搜索和下载平台
  4. 如何在CHROME里调试前端代码?
  5. Oracle导入导出之dmp
  6. Heartbeat+DRBD+NFS 构建高可用的文件系统
  7. 二十年后的回眸(1)——报到上班
  8. Mootools 1.4 官方网站的API使用说明存在错误
  9. 苹果或弃用Java 称Java已经过时
  10. HNOI2013 切糕