IK分词器(elasticsearch插件)
分词:即把一段中文或者别的划分成一个个的关键字,我们在搜索时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一一个匹配操作,默认的中文分词是将每个字看成一个词(不使用用IK分词器的情况下),比如“张三丰学java”会被分为”张”,”三”,”丰”,”学” ,“java”,这显然是不符合要求的,所以我们需要安装中文分词器ik来解决这个问题。
IK提供了两个分词算法: ik_smart和ik_max_word ,其中ik_smart为最少切分, ik_max_word为最细粒度划分!
1、下载
版本要与ElasticSearch版本对应
下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases
2、安装
ik文件夹是自己创建的,解压即可(但是我们需要解压到ElasticSearch的plugins目录ik文件夹下)
3、重启ElasticSearch
加载了IK分词器
4、使用 ElasticSearch安装补录/bin/elasticsearch-plugin
可以查看插件
E:\ElasticSearch\elasticsearch-7.6.1\bin>elasticsearch-plugin list
5、使用kibana测试
ik_smart
:最少切分
ik_max_word
:最细粒度划分(穷尽词库的可能)
从上面看,感觉分词都比较正常,但是绝大多数情况下满足不了我们所需要的分词,那么,我们需要手动将该词添加到分词器的词典当中
6、添加自定义的词添加到扩展字典中
elasticsearch目录/plugins/ik/config/IKAnalyzer.cfg.xml
打开 IKAnalyzer.cfg.xml
文件,扩展字典
(这里没有演示创建多个字典,有兴趣的可以去搜一下)
如果我们直接搜“叽哩咕”的话,默认的分词器,可能不会任务它是一个词语,可能会给我们分开,我们可以测试一下
创建字典文件,添加字典内容
重启ElasticSearch,再次使用kibana测试
注意
创建索引时 ,默认分词器使用standard, 要使用ik分词器,创建索引时配置中文分词器
例如
PUT example
{"mappings": {"properties": {"name":{"type": "text","analyzer": "ik_max_word" // ik分词器}}}
}
IK分词器(elasticsearch插件)相关推荐
- ElasticSearch学习 ④ IK分词器(elasticsearch插件)+自定义字典
ES默认的分词器把中文每个字看作一个词,比如说:"我爱喝水"会被划分为"我","爱","喝","水" ...
- 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程
docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...
- ElasticSearch——IK分词器的下载及使用
ElasticSearch--IK分词器的下载及使用 1.什么是IK分词器 ElasticSearch 几种常用分词器如下: 分词器 分词方式 StandardAnalyzer 单字分词 CJKAna ...
- Elasticsearch安装IK分词器,kibana安装是基本使用,DSL语句入门
文章目录 1. 安装IK分词器 2. Kibana安装和使用 2.1 ELK概述 2.2 Kibana下载 2.3 DSL语句 1. 安装IK分词器 ElasticSearch 默认采用的分词器, 是 ...
- 04.ElasticSearch之IK分词器的安装与使用
ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...
- ElasticSearch用法和IK分词器
ElasticSearch用法和IK分词器 ElasticSearch 是什么? 为什么选择ES? ES提供的能力 ES常用使用场景 ES架构 ES 基本概念 ES 数据类型 ElasticSearc ...
- ELK安装IK分词器
我们在搜索的时候,都会对数据进行分词,英文的分词很简单,我们可以直接按照空格进行切分即可, 但是中文的分词太过复杂,例如:夏天太热,能穿多少穿多少,冬天太冷,能穿多少穿多少. 下雨地滑,还好我一把把车 ...
- 分页解决方案及IK分词器安装使用、分片交互过程
一 分页 1.导入数据 DELETE us POST /_bulk { "create": { "_index": "us", " ...
- 2021年大数据ELK(八):Elasticsearch安装IK分词器插件
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...
最新文章
- Facebook加入AI芯片大战,挖走Google芯片产品开发负责人
- window系统安装hexo
- Git存管代码,实例演示
- EditPlus3.21注册码
- 双指针 - 长按键入
- (1)QlikView概要
- C++ 0x 使用可变参数模板类 实现 C# 的委托机制
- GTK实现文本翻页(dailyNote.c)
- 详解 :Spring Boot 最核心的 3 个注解
- 拓端tecdat|R语言用极大似然和梯度下降算法估计GARCH(p)过程
- centos引导过程中的故障排除
- 全国计算机b类一级考试试题题库,全国计算机等级考试模拟题:一级B试题(一)...
- PCI-PCIE中断机制之三
- CSS选择符(选择器)基础认识
- 职工考勤管理信息系统数据库课设_公司员工考勤管理信息系统的设计与实现
- java判断所有域名后缀_使用Java的IO操作,提取全世界所有的三位域名后缀
- C语言中exit(0)、exit(1)、exit(2)有什么不同?
- java截取视频第几秒与另一个秒之间生成gif
- 上山打老虎个人论坛源码
- python 窗体编程_python窗体编程