Elasticsearch中安装IK分词器
Elasticsearch中默认的分词器对中文的支持不好,会分隔成一个一个的汉字。而IK分词器对中文的支持比较好一些,主要有两种模式“ik_smart”和“ik_max_word”。
Elasticsearch中文拆分测试:
curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"text":"在潭州教育学习"}'
#测试结果
{ "tokens" : [ { "token" : "在", "start_offset" : 0, "end_offset" : 1, "type" : "<IDEOGRAPHIC>", "position" : 0 }, { "token" : "潭", "start_offset" : 1, "end_offset" : 2, "type" : "<IDEOGRAPHIC>", "position" : 1 }, { "token" : "州", "start_offset" : 2, "end_offset" : 3, "type" : "<IDEOGRAPHIC>", "position" : 2 }, { "token" : "教", "start_offset" : 3, "end_offset" : 4, "type" : "<IDEOGRAPHIC>", "position" : 3 }, { "token" : "育", "start_offset" : 4, "end_offset" : 5, "type" : "<IDEOGRAPHIC>", "position" : 4 }, { "token" : "学", "start_offset" : 5, "end_offset" : 6, "type" : "<IDEOGRAPHIC>", "position" : 5 }, { "token" : "习", "start_offset" : 6, "end_offset" : 7, "type" : "<IDEOGRAPHIC>", "position" : 6 } ]
}
安装IK分词器
方法一:在线安装IK分词器,注意:必须保证centos系统是联网的。
IK分词器的GitHub地址,选择跟自己的Elasticsearch对应的版本,本文使用的版本是Elasticsearch6.1.1版本。
https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.1.4
找到IK分词器的6.1.1的地址然后使用elasticsearch-plugin命令安装:
bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.1.1/elasticsearch-analysis-ik-6.1.1.zip
方法二:离线安装IK分词器:
点击上面的IK分词器的地址现在IK分词器的安装包
640?wx_fmt=png
上传安装包到Linux服务器,然后解压到:
unzip elasticsearch-analysis-ik-6.1.1.zip -d plugins/analysis-ik
进入解压好的analysis-ik目录:
640?wx_fmt=png
将elasticsearch目录中的所有文件移动出来,删除elasticsearch目录:
[root@cdh1 analysis-ik]# mv elasticsearch/* ./
[root@cdh1 analysis-ik]# rm -fr elasticsearc
640?wx_fmt=png
启动elasticsearch:
[plus@cdh1 elasticsearch-6.1.1]$ bin/elasticsearch
640?wx_fmt=png
测试IK分词器的ik_smart模式:
curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"analyzer":"ik_smart","text":"在潭州教育学习"}' #测试结果
{ "tokens" : [ { "token" : "在", "start_offset" : 0, "end_offset" : 1, "type" : "CN_CHAR", "position" : 0 }, { "token" : "潭州", "start_offset" : 1, "end_offset" : 3, "type" : "CN_WORD", "position" : 1 }, { "token" : "教育", "start_offset" : 3, "end_offset" : 5, "type" : "CN_WORD", "position" : 2 }, { "token" : "学习", "start_offset" : 5, "end_offset" : 7, "type" : "CN_WORD", "position" : 3 } ]
}
ik_smart:会做最粗粒度的拆分,比如会将“在潭州教育学习”拆分为“在,潭州,教育,学习”。
测试IK分词器的ik_max_word模式:
curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"在潭州教育学习"}' #测试结果
{ "tokens" : [ { "token" : "在", "start_offset" : 0, "end_offset" : 1, "type" : "CN_CHAR", "position" : 0 }, { "token" : "潭州", "start_offset" : 1, "end_offset" : 3, "type" : "CN_WORD", "position" : 1 }, { "token" : "教育学", "start_offset" : 3, "end_offset" : 6, "type" : "CN_WORD", "position" : 2 }, { "token" : "教育", "start_offset" : 3, "end_offset" : 5, "type" : "CN_WORD", "position" : 3 }, { "token" : "学习", "start_offset" : 5, "end_offset" : 7, "type" : "CN_WORD", "position" : 4 } ]
}
ik_max_word:会将文本做最细粒度的拆分,比如会将“在潭州教育学习”拆分为“在,潭州。教育学,教育,学习”,会进行各种组合。
至此,Elasticsearch中搭建IK分词器成功!
Elasticsearch中安装IK分词器相关推荐
- 如何在Elasticsearch中安装中文分词器(IK+pinyin)
如何在Elasticsearch中安装中文分词器(IK+pinyin) 如果直接使用Elasticsearch的朋友在处理中文内容的搜索时,肯定会遇到很尴尬的问题--中文词语被分成了一个一个的汉字,当 ...
- Elasticsearch下安装ik分词器
安装ik分词器(必须安装maven) 上传相应jar包 解压到相应目录 unzip elasticsearch-analysis-ik-master.zip(zip包) cp -r elasticse ...
- Elasticsearch入门之从零开始安装ik分词器
起因 需要在ES中使用聚合进行统计分析,但是聚合字段值为中文,ES的默认分词器对于中文支持非常不友好:会把完整的中文词语拆分为一系列独立的汉字进行聚合,显然这并不是我的初衷.我们来看个实例: POST ...
- 2021年大数据ELK(八):Elasticsearch安装IK分词器插件
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...
- window10下安装Elasticsearch(es)和IK分词器
1 安装Elasticsearch 7.x 1.1 下载地址 https://www.elastic.co/cn/downloads/elasticsearch 1.2 下载后解压的目录结构 Ela ...
- 【javaWeb微服务架构项目——乐优商城day07】——Elasticsearch介绍和安装及使用(安装kibana,安装ik分词器,Spring Data Elasticsearch,高级查询)
文章目录 0.学习目标 1.Elasticsearch介绍和安装 1.1.简介 1.1.1.Elastic 1.1.2.Elasticsearch 1.1.3.版本 1.2.安装和配置 1.2.1.新 ...
- Elasticsearch安装IK分词器,kibana安装是基本使用,DSL语句入门
文章目录 1. 安装IK分词器 2. Kibana安装和使用 2.1 ELK概述 2.2 Kibana下载 2.3 DSL语句 1. 安装IK分词器 ElasticSearch 默认采用的分词器, 是 ...
- elasticsearch安装ik分词器
elasticsearch安装ik分词器 1. 修改docker-compose.yml文件,对es目录下的plugins文件夹进行文件映射 version: "2.2" volu ...
- 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程
docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...
最新文章
- IA32中栈帧结构图
- Sharepoint摸索之路
- vue data 值如何渲染_vue源码阅读复盘-watcher模块
- ICPC程序设计题解系列
- 【面试题】---前端需要掌握的知识点-----更新...
- 【图论】[BZOJ 1051]受欢迎的牛
- 今日制造怎么安装solidworks插件_PS插件安装后出现了登陆界面,无法使用怎么解决?保证一招搞定...
- 卡方检验检验水准矫正_医学统计学 第七章 卡方检验
- 供应链管理的终极目标
- java打印表格_如何在java中使用printf()打印出表格?
- python笔记:猜大小,随机数
- 0.4-如何使用DAP LINK 下载Hex程序?
- 极速办公(word)如何添加文字水印
- Quartz 任务调度全攻略【转】
- JSON和XML的区别
- Android闪退原因
- java插件相对布局,C#Winform中控件的布局思想
- visio2002无法安装(您必须首先安装Enterprise Architect Edition of visual Studio.Net2003)的解决方案
- 2016年4月1日作业
- 如何用Visual C#来创建、修改注册信息
热门文章
- 为什么L0正则化是一个NP难解问题?
- 处理器的计算能力如何计算
- 如何获取请求端真实IP和远程主机IP详解
- python画樱花(一)
- 基于HTML+CSS+JS+JQuery的京东商城
- 化工行业危化品实时监控/厂区监控解决方案:EasyGBS如何保障危化品安全生产?
- 【C++ Caffe】ubuntu下MNIST训练结果
- c语言else if设计一个成绩表,c语言 学生成绩管理系统设计学生成绩信息包括:学号,姓名,三门课程成绩(数学、英语和计算机)等。主要功能:(1) 计算各...
- STM32单片机使用ADC功能驱动手指检测心跳模块
- 阿里云--实人认证的接口