Elasticsearch7.5配置IK中文分词器+拼音分词
1. 安装插件
1.1 安装插件
拼音分词器:https://github.com/medcl/elasticsearch-analysis-pinyin
中文分词器:https://github.com/medcl/elasticsearch-analysis-ik
找到自己对应的自己的Elasticsearch版本的插件进行安装
- Elasticsearch 7.5.1
- elasticsearch-analysis-ik 7.5.1
- elasticsearch-analysis-pinyin 7.5.1
直接进入Elasticsearch安装目录下,依次进行在线安装
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.5.1/elasticsearch-analysis-pinyin-7.5.1.zip
安装完成后需要重启 elasticsearch,然后测试分词器是否OK,正常情况下会出现一堆分词结果
1.2 测试中文分词器
POST http://data:9200/_analyze
{"analyzer":"ik_smart","text":"新型冠状病毒"
}
分词结果
{"tokens": [{"token": "新型","start_offset": 0,"end_offset": 2,"type": "CN_WORD","position": 0},{"token": "冠状病毒","start_offset": 2,"end_offset": 6,"type": "CN_WORD","position": 1}]
}
1.3 测试拼音分词器
POST http://data:9200/_analyze
{"analyzer":"pinyin","text":"新型冠状病毒"
}
分词结果
{"tokens": [{"token": "xin","start_offset": 0,"end_offset": 0,"type": "word","position": 0},{"token": "xxgzbd","start_offset": 0,"end_offset": 0,"type": "word","position": 0},{"token": "xing","start_offset": 0,"end_offset": 0,"type": "word","position": 1},{"token": "guan","start_offset": 0,"end_offset": 0,"type": "word","position": 2},{"token": "zhuang","start_offset": 0,"end_offset": 0,"type": "word","position": 3},{"token": "bing","start_offset": 0,"end_offset": 0,"type": "word","position": 4},{"token": "du","start_offset": 0,"end_offset": 0,"type": "word","position": 5}]
}
2. 修改解析器
修改分词器,以下所有操作均是对song 索引库进行的操作
2.1 关闭索引
首先关闭索引,否则会报错的
POST http://data:9200/song/_close
{}
2.2 配置IK+拼音分词
然后自定义分词器,我这里使用的IK_SMART+拼音
PUT http://data:9200/song/_settings
{"index": {"analysis": {"analyzer": {"ik_pinyin_analyzer": {"type": "custom","tokenizer": "ik_smart","filter": "pinyin_filter"}},"filter": {"pinyin_filter": {"type": "pinyin","keep_first_letter": false}}}}
}
你也可以使用IK_MAX_WORD + 拼音分词
PUT http://data:9200/song/_settings
{"index": {"analysis": {"analyzer": {"ik_pinyin_analyzer": {"type": "custom","tokenizer": "ik_max_word","filter": "pinyin_filter"}},"filter": {"pinyin_filter": {"type": "pinyin","keep_first_letter": false}}}}
}
2.3 开启索引
POST http://data:9200/song/_open
{}
Elasticsearch7.5配置IK中文分词器+拼音分词相关推荐
- CentOS安装Elasticsearch_IK分词器拼音分词器_部署kibana_部署es集群
CentOS安装Elasticsearch_IK分词器_部署kibana_部署es集群 一.部署单点es ①:创建网络 因为我们还需要部署kibana容器,因此需要让es和kibana容器互联.这里先 ...
- docker使用小记——docker安装es+ik分词器+拼音分词器+kibana
一.docker安装:Windows Docker 安装 | 菜鸟教程 二.docker换镜像源 修改或新增 /etc/docker/daemon.json vi /etc/docker/daemon ...
- Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
- 使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库
使用Docker快速安装部署ES和Kibana的前提:首先需要确保已经安装了Docker环境 如果没有安装Docker的话,可以参考上一篇的内容:Linux上安装Docker 有了Docker环境后, ...
- IK分词器-自定义分词算法与自定义分词配置
一.分词的概念 分词:就是把我们要查询的数据拆分成一个个关键字,我们在搜索时,ElasticSearch会把数据进行分词,然后做匹配.默认的中文分词器会把每一个中文拆分,比如"迪丽热巴&qu ...
- solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词
solr基本指令: jetty部署[推荐]: Linux: $ bin/solr start: Windows: bin\solr.cmd start 创建core: Linux: $ bin/sol ...
- Elasticsearch7.15.2 ik中文分词器 定制化分词器之扩展词库(远程)
IK分词提供的两个分词器,并不支持一些新的词汇,有时候也不能满足实际业务需要,这时候,我们可以定义自定义词库来完成目标. 文章目录 一.静态web搭建 1. 安装nginx 2. 创建es目录 3. ...
- Elasticsearch配置ik中文分词器自定义词库
1.IK配置文件 在config目录下: IKAnalyzer.cfg.xml:配置自定义词库 main.dic:分词器自带的词库,索引会按照里面的词创建 quantifier.dic:存放计量单位词 ...
- es拼音分词 大帅哥_elasticsearch实现中文分词和拼音分词混合查询+CompletionSuggestion...
引言 之前已经介绍了如何搭建elasticsearch服务端和简单的索引创建,和中文分词的支持.今天我们来说一说如何实现elasticsearch同时实现中文分词和pinyin分词.并且实现类似百度搜 ...
- IK分词器-自定义分词
我们首先测试一下IK分词器的ik_smart最少切分策略. GET _analyze {"analyzer": "ik_smart","text&qu ...
最新文章
- java实现分词_JAVA实现智能分词
- python server酱_12306这是肿么了?开售一秒就抢完,如何用Python抢到回家车票?
- MySQL数据库的优化-运维架构师必会高薪技能,笔者近六年来一线城市工作实战经验...
- 不花钱、不买服务器可以搭建个人博客吗?快进来,给你安排!
- 用于对Compound协议进行无Gas投票和委托的社区工具发布
- 在职工象棋赛上弃子拿下一盘
- linux安装oracle
- oracle10g rac导出ocr,Oracle RAC 迁移OCR(10g)
- 关于VS2015卸载后,重装无法修改路径问题
- 全网最详细ANSYS Maxwell16下载及安装
- U2000V200R018 的安装教程我们用微软的Windows7专业版示例
- typecho图片插件_typecho插件:HighSlide文章弹窗相册插件
- OGRE: Ogre第一个程序
- 《构建高性能Web站点》
- 怎么修改背景图片大小的HTML代码,css如何改变背景图片大小?
- Face Attention Network: An Effective Face Detector for the Occluded Faces
- mac brew 测速 软件_Mac已到手?从零开始,八步打造一个高效舒适的开发环境
- 基于MATLAB的进制转换
- 灵魂筹码一直显示连接服务器,灵魂筹码进不去怎么办_灵魂筹码进入显示错误解决方法_3DM单机...
- 【DS with Python】 re模块与正则表达式