分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一一个匹配操作,默认的中文分词是将每个字看成一个词(不使用用IK分词器的情况下),比如“张三丰学java”会被分为”张”,”三”,”丰”,”学” ,“java”,这显然是不符合要求的,所以我们需要安装中文分词器ik来解决这个问题。

IK提供了两个分词算法: ik_smart和ik_max_word ,其中ik_smart为最少切分, ik_max_word为最细粒度划分!

1、下载

版本要与ElasticSearch版本对应

下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases

2、安装

ik文件夹是自己创建的,解压即可(但是我们需要解压到ElasticSearch的plugins目录ik文件夹下)

3、重启ElasticSearch

加载了IK分词器

4、使用 ElasticSearch安装补录/bin/elasticsearch-plugin 可以查看插件

E:\ElasticSearch\elasticsearch-7.6.1\bin>elasticsearch-plugin list

5、使用kibana测试

ik_smart:最少切分

ik_max_word:最细粒度划分(穷尽词库的可能)

从上面看,感觉分词都比较正常,但是绝大多数情况下满足不了我们所需要的分词,那么,我们需要手动将该词添加到分词器的词典当中

6、添加自定义的词添加到扩展字典中

elasticsearch目录/plugins/ik/config/IKAnalyzer.cfg.xml

打开 IKAnalyzer.cfg.xml 文件,扩展字典

(这里没有演示创建多个字典,有兴趣的可以去搜一下)

如果我们直接搜“叽哩咕”的话,默认的分词器,可能不会任务它是一个词语,可能会给我们分开,我们可以测试一下

创建字典文件,添加字典内容

重启ElasticSearch,再次使用kibana测试

注意

创建索引时 ,默认分词器使用standard, 要使用ik分词器,创建索引时配置中文分词器

例如

PUT example
{"mappings": {"properties": {"name":{"type": "text","analyzer": "ik_max_word" // ik分词器}}}
}

IK分词器(elasticsearch插件)相关推荐

  1. ElasticSearch学习 ④ IK分词器(elasticsearch插件)+自定义字典

    ES默认的分词器把中文每个字看作一个词,比如说:"我爱喝水"会被划分为"我","爱","喝","水" ...

  2. 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程

    docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...

  3. ElasticSearch——IK分词器的下载及使用

    ElasticSearch--IK分词器的下载及使用 1.什么是IK分词器 ElasticSearch 几种常用分词器如下: 分词器 分词方式 StandardAnalyzer 单字分词 CJKAna ...

  4. Elasticsearch安装IK分词器,kibana安装是基本使用,DSL语句入门

    文章目录 1. 安装IK分词器 2. Kibana安装和使用 2.1 ELK概述 2.2 Kibana下载 2.3 DSL语句 1. 安装IK分词器 ElasticSearch 默认采用的分词器, 是 ...

  5. 04.ElasticSearch之IK分词器的安装与使用

    ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...

  6. ElasticSearch用法和IK分词器

    ElasticSearch用法和IK分词器 ElasticSearch 是什么? 为什么选择ES? ES提供的能力 ES常用使用场景 ES架构 ES 基本概念 ES 数据类型 ElasticSearc ...

  7. ELK安装IK分词器

    我们在搜索的时候,都会对数据进行分词,英文的分词很简单,我们可以直接按照空格进行切分即可, 但是中文的分词太过复杂,例如:夏天太热,能穿多少穿多少,冬天太冷,能穿多少穿多少. 下雨地滑,还好我一把把车 ...

  8. 分页解决方案及IK分词器安装使用、分片交互过程

    一 分页 1.导入数据 DELETE us POST /_bulk { "create": { "_index": "us", " ...

  9. 2021年大数据ELK(八):Elasticsearch安装IK分词器插件

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...

最新文章

  1. Facebook加入AI芯片大战,挖走Google芯片产品开发负责人
  2. window系统安装hexo
  3. Git存管代码,实例演示
  4. EditPlus3.21注册码
  5. 双指针 - 长按键入
  6. (1)QlikView概要
  7. C++ 0x 使用可变参数模板类 实现 C# 的委托机制
  8. GTK实现文本翻页(dailyNote.c)
  9. 详解 :Spring Boot 最核心的 3 个注解
  10. 拓端tecdat|R语言用极大似然和梯度下降算法估计GARCH(p)过程
  11. centos引导过程中的故障排除
  12. 全国计算机b类一级考试试题题库,全国计算机等级考试模拟题:一级B试题(一)...
  13. PCI-PCIE中断机制之三
  14. CSS选择符(选择器)基础认识
  15. 职工考勤管理信息系统数据库课设_公司员工考勤管理信息系统的设计与实现
  16. java判断所有域名后缀_使用Java的IO操作,提取全世界所有的三位域名后缀
  17. C语言中exit(0)、exit(1)、exit(2)有什么不同?
  18. java截取视频第几秒与另一个秒之间生成gif
  19. 上山打老虎个人论坛源码
  20. python 窗体编程_python窗体编程

热门文章

  1. android 方法统计,Android 利用编译时 注入 统计App内所有方法执行时常,分析ANR
  2. PAT 乙级1005
  3. 2021数据技术嘉年华线上召开,万人观看,迎接国产数据库的耕获菑畬之年
  4. 一则非常巧合的ORA-15042恢复
  5. 如何在Oracle数据库内格式化SQL或PL/SQL ?
  6. 直播预告:电力行业互联网改革思路与应对方案
  7. 一招教你玩转SQL:通过找出数据的共同属性实现SQL需求
  8. 数据库流行度10月排行榜:Oracle 王者归来和 Redis 青云直上
  9. 如何消除代码山中那一大坨参数列表
  10. MPU:鸿蒙轻内核的任务栈的溢出检察官