什么是IK 分词器?

分词:即把一段中文或者别的划分成一个个的关键字,在搜索时候会把自己所需的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词,比如“我是李铁”会被分为"我”“是”“李”"铁”,不符合要求的,所以需要安装中文分词器ik来解决这个问题。
如果要使用中文,建议使用ik分词器 !
K提供了两个分词算法:ik smat 和ik max word,其中 ik smat 为最少切分ik max word为最细粒度划分!一会我们测试!

安装 IK 分词器插件

1.地址:https://github.com/medcl/elasticsearch-analysis-ik

2.下载完毕放入elasticsearch中

3.重启elasticsearch,观察启动日志

ik插件被加载
4.测试插件 elasticsearch-plugin

5.使用 kibana 测试

查看不同分词器效果

ik_smart 最少切分

ik_max_word 为最细力度划分,穷尽词库的可能

6.测试 “受人尊敬的李铁”

7.李铁被分开

自己需要的词,需要手动添加到字典中


8.重启elasticsearch,加载了 litie.dic

9.重新访问 Kibana

Java之IK 分词器相关推荐

  1. 跟益达学Solr5之使用IK分词器

    在Solr中该如何使用IK分词器呢,这是小伙伴们问的频率比较高的一个问题,今晚特此更新此篇博客.其实之前我在其他博客里已经使用了IK分词器,只是我没做详细说明. 在schema.xml配置中其实有很多 ...

  2. requirednew基于xml配置日志不回滚_Elasticsearch配置IK分词器的远程词库

    在生活中很多很多地方都涉及到了全文检索,最常见的就好比日常使用到的百度搜索等搜索引擎,也都是基于全文检索来实现的:全文检索种类较多,就好比Elasticsearch.Sorl等. 为Ealsticse ...

  3. 11大Java开源中文分词器的使用方法和分词效果对比

    2019独角兽企业重金招聘Python工程师标准>>> 本文的目标有两个: 1.学会使用11大Java开源中文分词器 2.对比分析11大Java开源中文分词器的分词效果 本文给出了1 ...

  4. elastic ik分词搜索_php环境下使用elasticSearch+ik分词器进行全文搜索

    php中文网最新课程 每日17点准时技术干货分享 首先需要说明的一点是,如果需要启用ik分词器,那么分词器的版本必须与es版本一致,即6.3.0的分词器需要同样6.3.0版本的es支持. 安装java ...

  5. 7安装ik分词器_Solr7全文检索+IK分词

    1. 概述 介绍Solr之前,就不得不提业界大名鼎鼎的Lucene.Lucene是一个完全用Java编写 的高性能.跨平台的全文搜索引擎工具包,能满足几乎所有软件项目的搜索需求.Lucene是Apac ...

  6. ik mysql热加载分词_Elasticsearch 之(25)重写IK分词器源码来基于mysql热更新词库...

    热更新在上一节< IK分词器配置文件讲解以及自定义词库>自定义词库,每次都是在es的扩展词典中,手动添加新词语,很坑 (1)每次添加完,都要重启es才能生效,非常麻烦 (2)es是分布式的 ...

  7. ElasticSearch中文分词器-IK分词器的使用

    IK分词器的使用 首先我们通过Postman发送GET请求查询分词效果 GET http://localhost:9200/_analyze {"text":"农业银行& ...

  8. es ik分词热更新MySQL,ElasticSearch(25)- 改IK分词器源码来基于mysql热更新词库

    代码地址 已经修改过的支持定期从数据库中提取新词库,来实现热更新.代码: https://github.com/csy512889371/learndemo/tree/master/elasticse ...

  9. solr4.10和solr5.x ik分词器配置,(Deprecated--2017-04-23)

    A:配置IK-Analyzer: 1.下载wltea-IK-Analyzer-2012FF-master,将IK-Analyzer-2012FF\dist中的IKAnalyzer2012_FF.jar ...

最新文章

  1. 关于LUA+Unity开发_toLua篇【二】
  2. 关于“做一个聊天+信息分享客户端”的设想(SNS?)
  3. ASM模型对人脸特征点的检测
  4. SAP官方帮助网站,help.sap.com 背后那些事儿
  5. Android使用adb命令安装应用-连接usb
  6. python之__name__
  7. LeetCode之Ransom Note
  8. NUMA与英特尔下一代Xeon处理器学习心得(4)
  9. git-下载与安装windows版本与linux版本
  10. 法国 计算机 转专业,在法国留学怎样换专业
  11. 一款可以安利的MarkDown编辑器
  12. linux下载搜狗命令,搜狗输入法linux安装 以及 12个依赖包下载链接分享(示例代码)...
  13. html如何在手机打开,HTML怎么在手机打开
  14. 初探信息科学中“三个世界”模型
  15. mapgis矢量化怎么打分数_MAPGIS矢量化步骤
  16. 三款适用于企业建站的CMS建站系统
  17. 查看linux下eclipse进程,Linux环境安装Eclipse工具开发
  18. 本地音乐如何导入apple_如何将自己的音乐添加到Apple Music
  19. 网站被黑怎么查被入侵原因和日志
  20. 计算机维修培训教材,计算机芯片级维中心(芯片级维修培训教材)b.doc

热门文章

  1. Python计算机视觉编程第九章——图像分割
  2. 智能扫地机器人好用吗?优选扫地机器人排名推荐
  3. AgentWeb , 一个简洁易用的 Android Web 库
  4. 用H5和原生JS制作一款简单的视频播放器
  5. MVC3.0 中Razor 学习 cshtml文件
  6. .Net Core MVC引入static静态变量到.cshtml页面
  7. 编程改变W ndows其他软件,手机运行x86应用 能否改变W10M系统的命运?
  8. Android基础知识(十)之多媒体
  9. vscode python环境变量_VScode配置Python开发环境
  10. 每天一例多线程[day18]-----ThreadPoolExecutor