Java之IK 分词器
什么是IK 分词器?
分词:即把一段中文或者别的划分成一个个的关键字,在搜索时候会把自己所需的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词,比如“我是李铁”会被分为"我”“是”“李”"铁”,不符合要求的,所以需要安装中文分词器ik来解决这个问题。
如果要使用中文,建议使用ik分词器 !
K提供了两个分词算法:ik smat 和ik max word,其中 ik smat 为最少切分ik max word为最细粒度划分!一会我们测试!
安装 IK 分词器插件
1.地址:https://github.com/medcl/elasticsearch-analysis-ik
2.下载完毕放入elasticsearch中
3.重启elasticsearch,观察启动日志
ik插件被加载
4.测试插件 elasticsearch-plugin
5.使用 kibana 测试
查看不同分词器效果
ik_smart 最少切分
ik_max_word 为最细力度划分,穷尽词库的可能
6.测试 “受人尊敬的李铁”
7.李铁被分开
自己需要的词,需要手动添加到字典中
8.重启elasticsearch,加载了 litie.dic
9.重新访问 Kibana
Java之IK 分词器相关推荐
- 跟益达学Solr5之使用IK分词器
在Solr中该如何使用IK分词器呢,这是小伙伴们问的频率比较高的一个问题,今晚特此更新此篇博客.其实之前我在其他博客里已经使用了IK分词器,只是我没做详细说明. 在schema.xml配置中其实有很多 ...
- requirednew基于xml配置日志不回滚_Elasticsearch配置IK分词器的远程词库
在生活中很多很多地方都涉及到了全文检索,最常见的就好比日常使用到的百度搜索等搜索引擎,也都是基于全文检索来实现的:全文检索种类较多,就好比Elasticsearch.Sorl等. 为Ealsticse ...
- 11大Java开源中文分词器的使用方法和分词效果对比
2019独角兽企业重金招聘Python工程师标准>>> 本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了1 ...
- elastic ik分词搜索_php环境下使用elasticSearch+ik分词器进行全文搜索
php中文网最新课程 每日17点准时技术干货分享 首先需要说明的一点是,如果需要启用ik分词器,那么分词器的版本必须与es版本一致,即6.3.0的分词器需要同样6.3.0版本的es支持. 安装java ...
- 7安装ik分词器_Solr7全文检索+IK分词
1. 概述 介绍Solr之前,就不得不提业界大名鼎鼎的Lucene.Lucene是一个完全用Java编写 的高性能.跨平台的全文搜索引擎工具包,能满足几乎所有软件项目的搜索需求.Lucene是Apac ...
- ik mysql热加载分词_Elasticsearch 之(25)重写IK分词器源码来基于mysql热更新词库...
热更新在上一节< IK分词器配置文件讲解以及自定义词库>自定义词库,每次都是在es的扩展词典中,手动添加新词语,很坑 (1)每次添加完,都要重启es才能生效,非常麻烦 (2)es是分布式的 ...
- ElasticSearch中文分词器-IK分词器的使用
IK分词器的使用 首先我们通过Postman发送GET请求查询分词效果 GET http://localhost:9200/_analyze {"text":"农业银行& ...
- es ik分词热更新MySQL,ElasticSearch(25)- 改IK分词器源码来基于mysql热更新词库
代码地址 已经修改过的支持定期从数据库中提取新词库,来实现热更新.代码: https://github.com/csy512889371/learndemo/tree/master/elasticse ...
- solr4.10和solr5.x ik分词器配置,(Deprecated--2017-04-23)
A:配置IK-Analyzer: 1.下载wltea-IK-Analyzer-2012FF-master,将IK-Analyzer-2012FF\dist中的IKAnalyzer2012_FF.jar ...
最新文章
- 关于LUA+Unity开发_toLua篇【二】
- 关于“做一个聊天+信息分享客户端”的设想(SNS?)
- ASM模型对人脸特征点的检测
- SAP官方帮助网站,help.sap.com 背后那些事儿
- Android使用adb命令安装应用-连接usb
- python之__name__
- LeetCode之Ransom Note
- NUMA与英特尔下一代Xeon处理器学习心得(4)
- git-下载与安装windows版本与linux版本
- 法国 计算机 转专业,在法国留学怎样换专业
- 一款可以安利的MarkDown编辑器
- linux下载搜狗命令,搜狗输入法linux安装 以及 12个依赖包下载链接分享(示例代码)...
- html如何在手机打开,HTML怎么在手机打开
- 初探信息科学中“三个世界”模型
- mapgis矢量化怎么打分数_MAPGIS矢量化步骤
- 三款适用于企业建站的CMS建站系统
- 查看linux下eclipse进程,Linux环境安装Eclipse工具开发
- 本地音乐如何导入apple_如何将自己的音乐添加到Apple Music
- 网站被黑怎么查被入侵原因和日志
- 计算机维修培训教材,计算机芯片级维中心(芯片级维修培训教材)b.doc
热门文章
- Python计算机视觉编程第九章——图像分割
- 智能扫地机器人好用吗?优选扫地机器人排名推荐
- AgentWeb , 一个简洁易用的 Android Web 库
- 用H5和原生JS制作一款简单的视频播放器
- MVC3.0 中Razor 学习 cshtml文件
- .Net Core MVC引入static静态变量到.cshtml页面
- 编程改变W ndows其他软件,手机运行x86应用 能否改变W10M系统的命运?
- Android基础知识(十)之多媒体
- vscode python环境变量_VScode配置Python开发环境
- 每天一例多线程[day18]-----ThreadPoolExecutor