环境

github下载:https://github.com/medcl/elasticsearch-analysis-ik/releases

注意,IK分词器插件要与ES版本保持一致;
有的小伙伴在GitHub上下载插件时,没有发现与ES相对应的版本,可以切换到Tags中选择分支版本;
例如Branchs列表中仅可能存在主版本号;

切换到右侧Tags中查找对应的版本即可;小编这里选择的7.8.0的版本;

安装IK

  • 解压缩后拷贝到ElasticSearch安装目录plugins文件夹下,默认情况该文件夹中为空,不存在任何插件,将IK插件存入plugins目录并重命名ik,如图:

    解压缩目录如下:

  • 重启elasticsearch,观看是否加载插件

  • 通过ES自带的工具查看, 命令行执行 elasticSearch-plugin list

    注意,切换到bin目录下执行上面命令;

kibana实操

介绍两种分词用法和区别,主要以努力实现中国梦为例;

ik_smart

ik_smart为最少切分;
如何最少切分呢???

GET _analyze
{"analyzer": "ik_smart","text": "努力实现中国梦"
}分词结果:
{"tokens" : [{"token" : "努力实现","start_offset" : 0,"end_offset" : 4,"type" : "CN_WORD","position" : 0},{"token" : "中国","start_offset" : 4,"end_offset" : 6,"type" : "CN_WORD","position" : 1},{"token" : "梦","start_offset" : 6,"end_offset" : 7,"type" : "CN_CHAR","position" : 2}]
}

ik_max_word

ik_max_word为最细粒度划分;

GET _analyze
{"analyzer": "ik_max_word","text": "努力实现中国梦"
}分词结果:
{"tokens" : [{"token" : "努力实现","start_offset" : 0,"end_offset" : 4,"type" : "CN_WORD","position" : 0},{"token" : "努力","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 1},{"token" : "实现","start_offset" : 2,"end_offset" : 4,"type" : "CN_WORD","position" : 2},{"token" : "中国","start_offset" : 4,"end_offset" : 6,"type" : "CN_WORD","position" : 3},{"token" : "梦","start_offset" : 6,"end_offset" : 7,"type" : "CN_CHAR","position" : 4}]
}

自定义分词格式

比如:超级喜欢溪源博主,用上面两种分词,会把溪源,博主分别作为单个词分开,结果如下:

需求想把溪源博主作为两个词,因此需要我们自定义字典;

  • 修改插件配置文件ik/config/IKAnalyzer.cfg.xml,加入自定义字典;

    打开配置文件夹目录,可以看到已经存在的默认词库,如下:
  • 自定义xiyuan.dic文件
    将溪源、博主作为词存入文件中;

加入扩展自定义文件,如下:

  • 重启ES服务和kibana
GET _analyze
{"analyzer": "ik_smart","text": "超级喜欢溪源博主"
}分词结果:
{"tokens" : [{"token" : "超级","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 0},{"token" : "喜欢","start_offset" : 2,"end_offset" : 4,"type" : "CN_WORD","position" : 1},{"token" : "溪源","start_offset" : 4,"end_offset" : 6,"type" : "CN_WORD","position" : 2},{"token" : "博主","start_offset" : 6,"end_offset" : 8,"type" : "CN_WORD","position" : 3}]
}

【elasticsearch系列】windows安装IK分词器插件相关推荐

  1. 2021年大数据ELK(八):Elasticsearch安装IK分词器插件

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 安装IK分词器 一.下载Elasticsearch IK分词器 ...

  2. Elasticsearch入门之从零开始安装ik分词器

    起因 需要在ES中使用聚合进行统计分析,但是聚合字段值为中文,ES的默认分词器对于中文支持非常不友好:会把完整的中文词语拆分为一系列独立的汉字进行聚合,显然这并不是我的初衷.我们来看个实例: POST ...

  3. 使用Docker 安装Elasticsearch、Elasticsearch-head、IK分词器 和使用

    使用Docker 安装Elasticsearch.Elasticsearch-head.IK分词器 和使用 原文:使用Docker 安装Elasticsearch.Elasticsearch-head ...

  4. ES入门学习:ElasticSearch、Kibana、ik分词器的安装、简单使用及SpringBoot集成

    前言 es是采用Java语言开发,因此,想要安装运行es需要提前准备好jdk环境,关于linux配置jdk在前文linux配置jdk 本文主要介绍es的安装.kibana的安装和简单使用及ik分词器的 ...

  5. 【javaWeb微服务架构项目——乐优商城day07】——Elasticsearch介绍和安装及使用(安装kibana,安装ik分词器,Spring Data Elasticsearch,高级查询)

    文章目录 0.学习目标 1.Elasticsearch介绍和安装 1.1.简介 1.1.1.Elastic 1.1.2.Elasticsearch 1.1.3.版本 1.2.安装和配置 1.2.1.新 ...

  6. Elasticsearch安装IK分词器,kibana安装是基本使用,DSL语句入门

    文章目录 1. 安装IK分词器 2. Kibana安装和使用 2.1 ELK概述 2.2 Kibana下载 2.3 DSL语句 1. 安装IK分词器 ElasticSearch 默认采用的分词器, 是 ...

  7. 分布式系列教程(34) -Linux下安装ik分词器

    1.引言 因为Elasticsearch中默认的标准分词器分词器对中文分词不是很友好,会将中文词语拆分成一个一个中文的汉字,因此引入中文分词器-es-ik插件. 例如使用传统的分词器,可以看到把中文分 ...

  8. 【虚拟化】docker安装ElasticSearch+Kibana,下载IK分词器

    1.拉取镜像 docker pull elasticsearch:7.5.0 2.配置 mkdir -p /mydata/elasticsearch/config # 用来存放配置文件 mkdir - ...

  9. Elasticsearch下安装ik分词器

    安装ik分词器(必须安装maven) 上传相应jar包 解压到相应目录 unzip elasticsearch-analysis-ik-master.zip(zip包) cp -r elasticse ...

最新文章

  1. 【转贴】Lua 5.0 参考手册
  2. springCloud - 第8篇 - 配置文件管理中心 - 集群模式(负载匀衡)使用
  3. Dll注入技术之劫持注入
  4. 漫步线性代数十一—— 四个基本子空间
  5. 程序设计与算法----动态规划之最长上升子序列
  6. C++类的继承与派生
  7. DeFi借贷协议Liquity宣布主网将于4月5日上线
  8. 个人信用报告“数字解读”与妙用
  9. CSS实现返回网页顶部
  10. 《Android程序设计》一3.8 Android应用打包:.apk文件
  11. 比较好的取色工具汇总
  12. 光伏发电系统及其MPPT控制
  13. android mp4转mp3格式转换,实现快速将MP4转MP3格式的完美攻略
  14. Spoon Kettle 输入之 excel 输入详解(Microsoft Excel input)
  15. 生物信息(bioinformation)学名词解释
  16. 敏捷项目管理传统项目管理的区别
  17. Java 计算时间差
  18. ipv6连接数据库oracle,oracle连接数据库方式大全
  19. 【机器学习算法笔记系列】朴素贝叶斯(NB)算法详解和实战
  20. 变态杀人狂(约瑟夫环问题)

热门文章

  1. HTTP1.0 HTTP1.1 HTTP2.0总结
  2. 输出二叉树根节点到叶子结点所有路径
  3. 认识和学习orchestrator之基本使用篇
  4. spring整合hibernate出现HibernateException: Unable to get the default Bean Validation factory
  5. Dubbo服务暴露的流程
  6. Docker系列一 ~docker的安装
  7. 宿主机使用nginx向docker容器转发https请求
  8. mark python新手必碰到的问题---encode与decode,中文乱码[转]
  9. 2021-11-10如何快速部署Ceph分布式高可用集群
  10. 轻量级日志系统Loki原理简介和使用