Elasticsearch中默认的分词器对中文的支持不好,会分隔成一个一个的汉字。而IK分词器对中文的支持比较好一些,主要有两种模式“ik_smart”和“ik_max_word”。

Elasticsearch中文拆分测试:

curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"text":"在潭州教育学习"}'
#测试结果
{   "tokens" : [  {   "token" : "在",  "start_offset" : 0,   "end_offset" : 1, "type" : "<IDEOGRAPHIC>", "position" : 0    },  {   "token" : "潭",  "start_offset" : 1,   "end_offset" : 2, "type" : "<IDEOGRAPHIC>", "position" : 1    },  {   "token" : "州",  "start_offset" : 2,   "end_offset" : 3, "type" : "<IDEOGRAPHIC>", "position" : 2    },  {   "token" : "教",  "start_offset" : 3,   "end_offset" : 4, "type" : "<IDEOGRAPHIC>", "position" : 3    },  {   "token" : "育",  "start_offset" : 4,   "end_offset" : 5, "type" : "<IDEOGRAPHIC>", "position" : 4    },  {   "token" : "学",  "start_offset" : 5,   "end_offset" : 6, "type" : "<IDEOGRAPHIC>", "position" : 5    },  {   "token" : "习",  "start_offset" : 6,   "end_offset" : 7, "type" : "<IDEOGRAPHIC>", "position" : 6    }   ]
}

安装IK分词器

方法一:在线安装IK分词器,注意:必须保证centos系统是联网的。

IK分词器的GitHub地址,选择跟自己的Elasticsearch对应的版本,本文使用的版本是Elasticsearch6.1.1版本。

https://github.com/medcl/elasticsearch-analysis-ik/releases?after=v6.1.4

找到IK分词器的6.1.1的地址然后使用elasticsearch-plugin命令安装:

bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.1.1/elasticsearch-analysis-ik-6.1.1.zip

方法二:离线安装IK分词器:

点击上面的IK分词器的地址现在IK分词器的安装包

640?wx_fmt=png

上传安装包到Linux服务器,然后解压到:

unzip elasticsearch-analysis-ik-6.1.1.zip -d plugins/analysis-ik

进入解压好的analysis-ik目录:

640?wx_fmt=png

将elasticsearch目录中的所有文件移动出来,删除elasticsearch目录:

[root@cdh1 analysis-ik]# mv elasticsearch/* ./
[root@cdh1 analysis-ik]# rm -fr elasticsearc

640?wx_fmt=png

启动elasticsearch:

[plus@cdh1 elasticsearch-6.1.1]$ bin/elasticsearch

640?wx_fmt=png

测试IK分词器的ik_smart模式:

curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"analyzer":"ik_smart","text":"在潭州教育学习"}'   #测试结果
{   "tokens" : [  {   "token" : "在",  "start_offset" : 0,   "end_offset" : 1, "type" : "CN_CHAR", "position" : 0    },  {   "token" : "潭州", "start_offset" : 1,   "end_offset" : 3, "type" : "CN_WORD", "position" : 1    },  {   "token" : "教育", "start_offset" : 3,   "end_offset" : 5, "type" : "CN_WORD", "position" : 2    },  {   "token" : "学习", "start_offset" : 5,   "end_offset" : 7, "type" : "CN_WORD", "position" : 3    }   ]
}

ik_smart:会做最粗粒度的拆分,比如会将“在潭州教育学习”拆分为“在,潭州,教育,学习”。

测试IK分词器的ik_max_word模式:

curl -H "Content-Type:application/json" -XGET 'http://192.168.20.131:9200/_analyze?pretty' -d '{"analyzer":"ik_max_word","text":"在潭州教育学习"}'    #测试结果
{   "tokens" : [  {   "token" : "在",  "start_offset" : 0,   "end_offset" : 1, "type" : "CN_CHAR", "position" : 0    },  {   "token" : "潭州", "start_offset" : 1,   "end_offset" : 3, "type" : "CN_WORD", "position" : 1    },  {   "token" : "教育学",    "start_offset" : 3,   "end_offset" : 6, "type" : "CN_WORD", "position" : 2    },  {   "token" : "教育", "start_offset" : 3,   "end_offset" : 5, "type" : "CN_WORD", "position" : 3    },  {   "token" : "学习", "start_offset" : 5,   "end_offset" : 7, "type" : "CN_WORD", "position" : 4    }   ]
}

ik_max_word:会将文本做最细粒度的拆分,比如会将“在潭州教育学习”拆分为“在,潭州。教育学,教育,学习”,会进行各种组合。

至此,Elasticsearch中搭建IK分词器成功!

Elasticsearch中安装IK分词器相关推荐

  1. 如何在Elasticsearch中安装中文分词器(IK+pinyin)

    如何在Elasticsearch中安装中文分词器(IK+pinyin) 如果直接使用Elasticsearch的朋友在处理中文内容的搜索时,肯定会遇到很尴尬的问题--中文词语被分成了一个一个的汉字,当 ...

  2. Elasticsearch下安装ik分词器

    安装ik分词器(必须安装maven) 上传相应jar包 解压到相应目录 unzip elasticsearch-analysis-ik-master.zip(zip包) cp -r elasticse ...

  3. Elasticsearch入门之从零开始安装ik分词器

    起因 需要在ES中使用聚合进行统计分析,但是聚合字段值为中文,ES的默认分词器对于中文支持非常不友好:会把完整的中文词语拆分为一系列独立的汉字进行聚合,显然这并不是我的初衷.我们来看个实例: POST ...

  4. 2021年大数据ELK(八):Elasticsearch安装IK分词器插件

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...

  5. window10下安装Elasticsearch(es)和IK分词器

    1 安装Elasticsearch 7.x  1.1 下载地址 https://www.elastic.co/cn/downloads/elasticsearch 1.2 下载后解压的目录结构 Ela ...

  6. 【javaWeb微服务架构项目——乐优商城day07】——Elasticsearch介绍和安装及使用(安装kibana,安装ik分词器,Spring Data Elasticsearch,高级查询)

    文章目录 0.学习目标 1.Elasticsearch介绍和安装 1.1.简介 1.1.1.Elastic 1.1.2.Elasticsearch 1.1.3.版本 1.2.安装和配置 1.2.1.新 ...

  7. Elasticsearch安装IK分词器,kibana安装是基本使用,DSL语句入门

    文章目录 1. 安装IK分词器 2. Kibana安装和使用 2.1 ELK概述 2.2 Kibana下载 2.3 DSL语句 1. 安装IK分词器 ElasticSearch 默认采用的分词器, 是 ...

  8. elasticsearch安装ik分词器

    elasticsearch安装ik分词器 1. 修改docker-compose.yml文件,对es目录下的plugins文件夹进行文件映射 version: "2.2" volu ...

  9. 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程

    docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...

最新文章

  1. IA32中栈帧结构图
  2. Sharepoint摸索之路
  3. vue data 值如何渲染_vue源码阅读复盘-watcher模块
  4. ICPC程序设计题解系列
  5. 【面试题】---前端需要掌握的知识点-----更新...
  6. 【图论】[BZOJ 1051]受欢迎的牛
  7. 今日制造怎么安装solidworks插件_PS插件安装后出现了登陆界面,无法使用怎么解决?保证一招搞定...
  8. 卡方检验检验水准矫正_医学统计学 第七章 卡方检验
  9. 供应链管理的终极目标
  10. java打印表格_如何在java中使用printf()打印出表格?
  11. python笔记:猜大小,随机数
  12. 0.4-如何使用DAP LINK 下载Hex程序?
  13. 极速办公(word)如何添加文字水印
  14. Quartz 任务调度全攻略【转】
  15. JSON和XML的区别
  16. Android闪退原因
  17. java插件相对布局,C#Winform中控件的布局思想
  18. visio2002无法安装(您必须首先安装Enterprise Architect Edition of visual Studio.Net2003)的解决方案
  19. 2016年4月1日作业
  20. 如何用Visual C#来创建、修改注册信息

热门文章

  1. 为什么L0正则化是一个NP难解问题?
  2. 处理器的计算能力如何计算
  3. 如何获取请求端真实IP和远程主机IP详解
  4. python画樱花(一)
  5. 基于HTML+CSS+JS+JQuery的京东商城
  6. 化工行业危化品实时监控/厂区监控解决方案:EasyGBS如何保障危化品安全生产?
  7. 【C++ Caffe】ubuntu下MNIST训练结果
  8. c语言else if设计一个成绩表,c语言 学生成绩管理系统设计学生成绩信息包括:学号,姓名,三门课程成绩(数学、英语和计算机)等。主要功能:(1) 计算各...
  9. STM32单片机使用ADC功能驱动手指检测心跳模块
  10. 阿里云--实人认证的接口