IK使用
IK有两种颗粒度的拆分:

  1. ik_smart: 会做最粗粒度的拆分

  2. ik_max_word: 会将文本做最细粒度的拆分

GET /_analyze

{"text":"中华人民共和国国徽","analyzer":"ik_smart"
}

ik_smart分词结果:

{"tokens" : [{"token" : "中华人民共和国","start_offset" : 0,"end_offset" : 7,"type" : "CN_WORD","position" : 0},{"token" : "国徽","start_offset" : 7,"end_offset" : 9,"type" : "CN_WORD","position" : 1}]
}

GET /_analyze

{"text":"中华人民共和国国徽","analyzer":"ik_max_word"
}

ik_max_word分词结果

{"tokens" : [{"token" : "中华人民共和国","start_offset" : 0,"end_offset" : 7,"type" : "CN_WORD","position" : 0},{"token" : "中华人民","start_offset" : 0,"end_offset" : 4,"type" : "CN_WORD","position" : 1},{"token" : "中华","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 2},{"token" : "华人","start_offset" : 1,"end_offset" : 3,"type" : "CN_WORD","position" : 3},{"token" : "人民共和国","start_offset" : 2,"end_offset" : 7,"type" : "CN_WORD","position" : 4},{"token" : "人民","start_offset" : 2,"end_offset" : 4,"type" : "CN_WORD","position" : 5},{"token" : "共和国","start_offset" : 4,"end_offset" : 7,"type" : "CN_WORD","position" : 6},{"token" : "共和","start_offset" : 4,"end_offset" : 6,"type" : "CN_WORD","position" : 7},{"token" : "国","start_offset" : 6,"end_offset" : 7,"type" : "CN_CHAR","position" : 8},{"token" : "国徽","start_offset" : 7,"end_offset" : 9,"type" : "CN_WORD","position" : 9}]
}

ES的ik分词器ik_smart和ik_max_word区别相关推荐

  1. 拾忆Elasticsearch01:Elasticsearch概述及相关ES、IK分词器等下载安装

    为了防止老年痴呆记不住学过的Elasticsearch,在这里写点blog回顾一下 写在前面,建议下载以下出现的Elasticsearch版本,我之前下的7.6.1在这里找不到对应的springboo ...

  2. window10下安装Elasticsearch(es)和IK分词器

    1 安装Elasticsearch 7.x  1.1 下载地址 https://www.elastic.co/cn/downloads/elasticsearch 1.2 下载后解压的目录结构 Ela ...

  3. Elasticsearch7.x安装(ES,kibana,ik分词器)Windows环境下

    1安装ES 1.1将ES安装包解压,解压目录用户可以自定义.如下图所示: 解压后如下图所示: 1.2 进入ES解压后目录找到配置文件elasticsearch.yml,修改相应配置,如下图所示: el ...

  4. es 安装 ik 分词器

    (1)在github上下载 ik的源码  (找星多的那个) 下载地址:https://github.com/medcl/elasticsearch-analysis-ik (2)注意版本的对应 : i ...

  5. es修改IK分词器源码 mysql热词动态更新(报错解决x3)

    最近在公司遇到的一个问题,给elasticsearch配置ik热部署mysql词库. 我是参照下面这个博客来做的 https://www.cnblogs.com/xiaoxiaoliu/p/11218 ...

  6. es ik 词库添加词语_Elasticsearch配置IK分词器的远程词库

    在生活中很多很多地方都涉及到了全文检索,最常见的就好比日常使用到的百度搜索等搜索引擎,也都是基于全文检索来实现的:全文检索种类较多,就好比Elasticsearch.Sorl等. 为Ealsticse ...

  7. 04.ElasticSearch之IK分词器的安装与使用

    ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...

  8. elasticsearch学习(六):IK分词器

    1.IK分词器简介 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始IKAnalyzer已经推出 了3个大版本.最初,它是以开源项目L ...

  9. requirednew基于xml配置日志不回滚_Elasticsearch配置IK分词器的远程词库

    在生活中很多很多地方都涉及到了全文检索,最常见的就好比日常使用到的百度搜索等搜索引擎,也都是基于全文检索来实现的:全文检索种类较多,就好比Elasticsearch.Sorl等. 为Ealsticse ...

最新文章

  1. 装机人员工具_吕梁采购气伏式包装机-哪家好-强盛包装机械
  2. SourceTree 基本介绍
  3. YbtOJ#883-最大的割【带修线性基】
  4. 一个简单的crontab
  5. 安装eclipse及android,Eclipse Android 安装
  6. codevs1842 递归第一次
  7. 海康SDK方式对接摄像头
  8. html添加购买按钮,萤火小程序商城给前端和商品组件增加“购买”按钮的方法...
  9. android原生桌面,谷歌官方出品的安卓原生桌面App 轻松干掉你手机上臃肿的的桌面!...
  10. java 2的n次方_Java程序练习-计算2的N次方 | 学步园
  11. 大厂团队Leader实战秘诀:工程师成长最重要的8项技能
  12. java邮件增加签名_Java对文件添加数字签名
  13. 中国菜刀使用教程--ctf 文件上传
  14. 黑客软件大众化 【爆吧机的出现】杨丞琳贴吧遭网友攻陷
  15. dz每个php模板页文件,dz模板引擎分析
  16. 秀米点一点教程丨如何用秀米SVG做出图文先缩后展的效果
  17. windows驱动开发第12课(R3与R0通信之写入数据)
  18. UG创建图纸明细表失败的情况
  19. dgen模拟器 linux,game_box: GameBox 是一款游戏家用机模拟器,本项目基于Qt,可在windous\mac\linux等多平台使用。...
  20. 如何使用Logger命令将消息添加到Linux日志文件

热门文章

  1. 拼多多助农 商业之外的底色
  2. MVC 3.0 学习笔记(Razor CSHTML))
  3. java读取本地图片_java 怎么才能读取本地磁盘中的图片并传给前端(URL)
  4. html 增加选项,添加标签——给定标签选项
  5. AutoService+javaPoet+maven+注解自动生成java代码
  6. html中怎么制作太阳月亮交替,CSS3 简单的地球/太阳/月亮动画
  7. 从0开始学c语言-总结01-c语言的粗略认识和快捷键
  8. 3DMark将加入DLSS 测试人工智能强化反锯齿效果
  9. COVID-19疫苗到底是如何杀死新冠病毒的?
  10. 安卓10不支持qmc解码_Root神器支持安卓10 面具Magisk v20.4+Magisk Manager v7.5.1