paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.
paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.
mmseg默认词库只能是文件格式...不好维护..要是不个词库放的个数据库里面走好维护兰..
要实现2个目标..:
1.禁用默认词库,仅仅使用自定义词库
2.词库从数据库读取,而不使用默认的文件方式,方便维护..
作者Attilax 艾龙, EMAIL:1466519819@qq.com
来源:attilax的专栏
地址:http://blog.csdn.net/attilax
Dictionary.getInstance("")来的禁用默认词库,无效果...
查看Dictionary.loadDic 源码...看来无法通过dic = Dictionary.getInstance("");的方式来禁用它的默认词库...
只好扩展Dictionary了..new 了一个class,继承了Dictionary,重写loadDic方法...change 孪一瓦方法的..visiablity...这个方法虽然能行,要overwrite一瓦方法了.麻烦.半路儿上放弃...
换个丝路,不个哪加载的词库在给他卸除孪走ok兰吗.haha...
dic = Dictionary.getInstance();
//delete default words
Map<Character, CharNode> dict=dic.getDict();
Set set=dict.keySet();
Iterator<Character> it = set.iterator();
while (it.hasNext()) {
Character key = it.next();
// String val=String.valueOf( dict.get(key));
CharNode cn=dict.get(key);
cn.ktWordTails=new KeyTree();
}
这样,走 禁用孪默认词库兰...完成孪1半儿兰..
词库从数据库读取到list,如何不个这个List动态加载到mmseg呢??
List<String> li=new ArrayList<String>();
li.add("上学好");
li.add("卖衣裳");
for(String word:li)
{
if(word.trim().length()==0 || word.length()<2)
continue;
String line=word;
CharNode cn = dict.get(line.charAt(0));
if(cn == null) {
cn = new CharNode();
dict.put(line.charAt(0), cn);
}else
cn.addWordTail(dic.tail(line));
}
扎实ok兰..哈
paip..禁用mmseg 的默认词库. . 仅仅使用自定义词库from数据库.相关推荐
- es自建搜索词库_ElasticSearch-IK拓展自定义词库(2):HTTP请求动态热词内容方式...
上一章节(https://my.oschina.net/jsonyang/blog/1643032)我们介绍了使用热词文件形式拓展词库,这样的好处是方便简单,但是如果公司运营人员来直接管理这个东西的话 ...
- linux编译动态库未定义,自定义动态库 对‘*’未定义的引用解决方法
自定义动态库 对'*'未定义的引用 本帖最后由 longruliang 于 2015-05-25 16:02:26 编辑 自己编写了一个串口方面的动态库,想写一个测试程序,在编译的时候冒出对'*'未定 ...
- python默认词云颜色_Python 绘制词云
1. 准备 安装好python,安装时包含pip 包管理工具 pip install jieba pip install matplotlib import matplotlib.pyplot as ...
- linux添加自己的库,Linux学习笔记——例叙makefile 增加自定义共享库
Linux学习笔记--例说makefile 增加自定义共享库 0.前言 从学习C语言开始就慢慢开始接触makefile,查阅了很多的makefile的资料但总感觉没有真正掌握makefile,如果自己 ...
- 结巴分词完全禁用默认词库(仅使用自定义词库)
有时候需要使用自定义的词库,不使用默认的词库.比如做敏感词分词时, 完全禁用掉默认词库. jieba 分词里面可以这样处理,通过set_dictionary 来设置自定义词库,从而禁用掉默认词库. i ...
- 白话Elasticsearch29-IK中文分词之IK分词器配置文件+自定义词库
文章目录 概述 ik配置文件 IK自定义词库 自定义词库 Step1 : 新建自定义分词库 Step2 : 添加到ik的配置文件中 Step3 :重启es ,查看分词 自定义停用词库 Step1 : ...
- wordcloud库的常规方法及词云绘制实例
对一文本wordclound.txt进行词云绘制 import jieba import wordcloud f = open("wordcloudeg.txt","r& ...
- IKAnalyzer 添加扩展词库和自定义词
原文链接http://blog.csdn.net/whzhaochao/article/details/50130605 IKanalyzer分词器 IK分词器源码位置 http://git.osch ...
- ElasticSearch 中文分词器ik的安装、测试、使用、自定义词库、热更新词库
文章目录 # 实验环境 # ik分词器的下载.安装.测试 ## 安装方法一:使用elasticsearch-plugin 安装 ## 安装方法二:下载编译好的包进行安装 1.下载 2.安装 3.重启` ...
- Elasticsearch学习1 入门进阶 Linux系统下操作安装Elasticsearch Kibana 初步检索 SearchAPI Query DSL ki分词库 自定义词库
文章目录 一.全文检索-Elasticsearch 1.Elasticsearch简介 2.全文搜索引擎 二.docker安装 1.elasticsearch启动 2.kibana启动 三.[入门]初 ...
最新文章
- OSChina 周六乱弹 —— 胖点其实挺好
- 深入理解LSM-Tree
- hive的udf,udaf,udtf各自依賴兩種class(转载+分析整理)
- 先弄个XML解析器代码抄一抄 慢慢研究 O(∩_∩)O哈哈~
- gin redis 链接不上_Redis 高并发问题,及解决方案!
- (转)一台服务器安装两个tomcat6 服务的解决方案
- b站在线解析_一个小工具,教你如何轻松下载B站上喜欢的视频!
- 线段树专辑—— pku 3468 A Simple Problem with Integers
- [51nod1232]完美数
- mysql group 最大值_MySQL groupwise最大值为字段的长度
- 抢占氢能产业发展风口,上海重塑能源集团股份有限公司助推行业发展
- 太牛了!某大佬程序猿北漂16年,从睡天桥到身价数千万,衣锦还乡重庆住豪宅!...
- 富途出海淘金:泡沫翻涌 焦虑不止
- DOS时代往事的回忆
- 感冒了吃什么药好的快服用三九感冒灵的同时多喝白开水
- java里short,int,long,float,double范围及可写位数
- 2021 年 9 项优秀在线电话会议服务比较(带免费选项)
- 希尔伯特变换(Hilbert Transform)的性质
- 服务器响应状态码statusCode
- 【转载】一句话实现五彩LINUX