目录标题

  • 前言
  • 1、安装IK分词器
    • 版本声明
    • 下载Elasticsearch IK分词器
    • 切换到shcms用户,并在es的安装目录下/plugins创建ik
    • 将下载的ik分词器上传并解压到该目录
    • 重启Elasticsearch
    • 重启Kibana
  • 2、测试分词效果
  • 3、指定IK分词器作为默认分词器

前言

CentOS 7下安装ElasticSearch7.6.1详细教程
ElasticSearch客户端Kibana7.6.1安装教程
ElasticSearch分词器IK安装教程
Elasticsearch-head插件安装教程

使用IK分词器对查询内容进行划分。

1、安装IK分词器

我们后续也需要使用Elasticsearch来进行中文分词,所以需要单独给Elasticsearch安装IK分词器插件。以下为具体安装步骤.

版本声明

CenOS:7;
JDK:1.8;
Elasticsearch:7.6.1;
Kibana:7.6.1;
IK:7.6.1;

注意:Elasticsearch和IK的版本需要对应。

下载Elasticsearch IK分词器

下载地址:
https://github.com/medcl/elasticsearch-analysis-ik/releases

注意:
IK的版本必须和Elasticsearch的版本对应,否则启动Elasticsearch的时候会报错。以下是我下载IK 8.1.2的版本,然后启动ES的时候报错如下:

切换到shcms用户,并在es的安装目录下/plugins创建ik

su shcms
mkdir -p /usr/local/es/elasticsearch-7.6.1/plugins/ik

将下载的ik分词器上传并解压到该目录

cd /opt/es/elasticsearch-7.6.1/plugins/ik
unzip  elasticsearch-analysis-ik-7.6.1.zip

重启Elasticsearch

1、先查询PID,然后杀死进程:

ps -ef | grep elasticsearch

2、切换es用户,启动es:

su shcmscd /opt/es/elasticsearch-7.6.1/bin./elasticsearch -d

启动ES之后,ES会自己加载IK插件,如果启动ES成功,说明IK安装成功:

重启Kibana

ES重启之后,ES的客户端Kibana也应该重启

1、root用户或者es用户都可以2、cd /opt/es/kibana-7.6.1-linux-x86_64/bin3、./kibana -d

2、测试分词效果

POST _analyze
{"analyzer":"standard",
"text":"我爱你中国"
}

不推荐使用standard模式 ,推荐使用ik模式。

POST _analyze
{"analyzer": "ik_smart",
"text": "中华人民共和国"}
#ik_smart:会做最粗粒度的拆分;

也不推荐使用最粗粒度。当我搜索“中华”的时候,是匹配不到数据的。

POST _analyze
{"analyzer":"ik_max_word",
"text":"中华人民共和国"
}
#ik_max_word:会将文本做最细粒度的拆分

3、指定IK分词器作为默认分词器

ES的默认分词设置是standard,这个在中文分词时就比较尴尬了,会单字拆分,比如我搜索关键词“清华大学”,这时候会按“清”,“华”,“大”,“学”去分词,然后搜出来的都是些“清清的河水”,“中华儿女”,“地大物博”,“学而不思则罔”之类的莫名其妙的结果,这里我们就想把这个分词方式修改一下,于是呢,就想到了ik分词器,有两种ik_smart和ik_max_word。
ik_smart会将“清华大学”整个分为一个词,而ik_max_word会将“清华大学”分为“清华大学”,“清华”和“大学”,按需选其中之一就可以了。
修改默认分词方法(这里修改school_index索引的默认分词为:ik_max_word):

PUT /school_index
{"settings" : {"index" : {"analysis.analyzer.default.type": "ik_max_word"
}
}
}

ElasticSearch分词器IK安装教程相关推荐

  1. elasticsearch分词器Jcseg安装手册

    Jcseg是什么? Jcseg是基于mmseg算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于Jetty的web服务器,方便各大语言 ...

  2. Elasticsearch(二) ik分词器的安装 以及 自定义分词

    ik分词器作为elasticsearch的一个插件,则是安装在es插件中. ik分词器的安装 1,创建ik分词目录上传与es相同版本的ik分词器插件,不同版本可能es启动 报错 在elasticsea ...

  3. 【Elasticsearch】es IK分词器的安装

    1.概述 [Elasticsearch]es 7.8.0 唐诗三百首写入 Elasticsearch 会发生什么 之前我们创建索引,查询数据,都是使用的默认的分词器,分词效果不太理想,会把text的字 ...

  4. 04.ElasticSearch之IK分词器的安装与使用

    ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...

  5. ElasticSearch 中文分词器ik的安装、测试、使用、自定义词库、热更新词库

    文章目录 # 实验环境 # ik分词器的下载.安装.测试 ## 安装方法一:使用elasticsearch-plugin 安装 ## 安装方法二:下载编译好的包进行安装 1.下载 2.安装 3.重启` ...

  6. elasticsearch IK分词器的安装、使用与扩展

    ES 的默认分词器(standard)不支持中文分词,满足不了平时的需求,所以需要用能够支持中文分词的 IK 分词器.而且 IK 分词器也是支持英文分词的. 本文介绍下IK分词器的安装.基本使用方法: ...

  7. 如何在Elasticsearch中安装中文分词器(IK+pinyin)

    如何在Elasticsearch中安装中文分词器(IK+pinyin) 如果直接使用Elasticsearch的朋友在处理中文内容的搜索时,肯定会遇到很尴尬的问题--中文词语被分成了一个一个的汉字,当 ...

  8. 本地elasticsearch中文分词器 ik分词器安装及使用

    ElasticSearch 内置了分词器,如标准分词器.简单分词器.空白词器等.但这些分词器对我们最常使用的中文并不友好,不能按我们的语言习惯进行分词. ik分词器就是一个标准的中文分词器.它可以根据 ...

  9. Elasticsearch 7.X 中文分词器 ik 使用,及词库的动态扩展

    一.ik中文分词器 上篇文章我们学习了ES集群分片和水平扩容,前面再使用的时候应该就会发现,在做match 匹配时,默认会进行分词,但当查询内容是中文时,分词效果是一个字被认定了一个词,这显然不符合我 ...

  10. 29_ElasticSearchIK中文分词器的安装和使用

    29_ElasticSearchIK中文分词器的安装和使用 更多干货 分布式实战(干货) spring cloud 实战(干货) mybatis 实战(干货) spring boot 实战(干货) R ...

最新文章

  1. 系统遇到并发瓶颈时的优化方向
  2. html post 发送两次,JS发送跨域Post请求出现两次请求的解决办法
  3. git 基于发布分支的开发
  4. 平凡的80后 不平凡的人生路
  5. Intel不挤牙膏了!10nm性能参数公布:提升43%
  6. c# 4.0(vs2010)新特性一览
  7. 浅析网站友情链接交换潜在问题有哪些?
  8. Java 集合类图(转)
  9. Patent Writing and cultivation of innovation thinking
  10. 如何恢复电脑系统桌面
  11. File类的构造方法
  12. idea 导出war包_使用IDEA实现远程代码DEBUG调试教程详解
  13. gdiplustypes min max找不到标识符_当年月销过万的比亚迪宋MAX,为何突然不香了?...
  14. matlab偶极矩电场强度分布图_课程设计用MATLAB模拟偶极子的电场分布.doc
  15. python为循环线条增加颜色_python – Matplotlib:如何将线条颜色设置为橙色,并指定线条标记?...
  16. nyoj71 独木舟上的旅行
  17. 【Python学习 】Python实现的FTP上传和下载功能
  18. element自定义邮箱和手机号校验规则
  19. 解决:IOS无法使用微软账号登录,显示“无法登录,请使用IMAP并重新登录“
  20. 【码云周刊第 10 期】放码过来,四个男人的带头冲锋!!(内附 PPT 下载链接)...

热门文章

  1. DevExpress项目升级总结
  2. CAJViwer安装提示:请求的操作需要提升
  3. python 关键词 抓取网页_python网络爬虫爬取网页内容
  4. C语言简单实现14个例题(谭浩强第四版)
  5. 翻转课堂融入计算机课,【计算机基础论文】大学计算机基础翻转课堂的构建思路(共3745字)...
  6. 使用XMLSerializer报错java.lang.NoClassDefFoundError: nu/xom/ParentNode
  7. winXP和win2003双系统下启动NTDETECT错误解决方法
  8. 举个栗子~Minitab 技巧(6):使用 T 检验 分析产品质量
  9. 模板库(七) - 字符串算法
  10. [02-27][08奥斯卡四项大奖][老无所依][DVD中英双字][已测][17:21]