1. 安装插件

1.1 安装插件

拼音分词器:https://github.com/medcl/elasticsearch-analysis-pinyin
中文分词器:https://github.com/medcl/elasticsearch-analysis-ik

找到自己对应的自己的Elasticsearch版本的插件进行安装

  • Elasticsearch 7.5.1
  • elasticsearch-analysis-ik 7.5.1
  • elasticsearch-analysis-pinyin 7.5.1

直接进入Elasticsearch安装目录下,依次进行在线安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.5.1/elasticsearch-analysis-pinyin-7.5.1.zip

安装完成后需要重启 elasticsearch,然后测试分词器是否OK,正常情况下会出现一堆分词结果

1.2 测试中文分词器

POST http://data:9200/_analyze
{"analyzer":"ik_smart","text":"新型冠状病毒"
}

分词结果

{"tokens": [{"token": "新型","start_offset": 0,"end_offset": 2,"type": "CN_WORD","position": 0},{"token": "冠状病毒","start_offset": 2,"end_offset": 6,"type": "CN_WORD","position": 1}]
}

1.3 测试拼音分词器

POST http://data:9200/_analyze
{"analyzer":"pinyin","text":"新型冠状病毒"
}

分词结果

{"tokens": [{"token": "xin","start_offset": 0,"end_offset": 0,"type": "word","position": 0},{"token": "xxgzbd","start_offset": 0,"end_offset": 0,"type": "word","position": 0},{"token": "xing","start_offset": 0,"end_offset": 0,"type": "word","position": 1},{"token": "guan","start_offset": 0,"end_offset": 0,"type": "word","position": 2},{"token": "zhuang","start_offset": 0,"end_offset": 0,"type": "word","position": 3},{"token": "bing","start_offset": 0,"end_offset": 0,"type": "word","position": 4},{"token": "du","start_offset": 0,"end_offset": 0,"type": "word","position": 5}]
}

2. 修改解析器

修改分词器,以下所有操作均是对song 索引库进行的操作

2.1 关闭索引

首先关闭索引,否则会报错的

POST http://data:9200/song/_close
{}

2.2 配置IK+拼音分词

然后自定义分词器,我这里使用的IK_SMART+拼音

PUT  http://data:9200/song/_settings
{"index": {"analysis": {"analyzer": {"ik_pinyin_analyzer": {"type": "custom","tokenizer": "ik_smart","filter": "pinyin_filter"}},"filter": {"pinyin_filter": {"type": "pinyin","keep_first_letter": false}}}}
}

你也可以使用IK_MAX_WORD + 拼音分词

PUT  http://data:9200/song/_settings
{"index": {"analysis": {"analyzer": {"ik_pinyin_analyzer": {"type": "custom","tokenizer": "ik_max_word","filter": "pinyin_filter"}},"filter": {"pinyin_filter": {"type": "pinyin","keep_first_letter": false}}}}
}

2.3 开启索引

POST http://data:9200/song/_open
{}

Elasticsearch7.5配置IK中文分词器+拼音分词相关推荐

  1. CentOS安装Elasticsearch_IK分词器拼音分词器_部署kibana_部署es集群

    CentOS安装Elasticsearch_IK分词器_部署kibana_部署es集群 一.部署单点es ①:创建网络 因为我们还需要部署kibana容器,因此需要让es和kibana容器互联.这里先 ...

  2. docker使用小记——docker安装es+ik分词器+拼音分词器+kibana

    一.docker安装:Windows Docker 安装 | 菜鸟教程 二.docker换镜像源 修改或新增 /etc/docker/daemon.json vi /etc/docker/daemon ...

  3. Solr7.2.1环境搭建和配置ik中文分词器

    solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...

  4. 使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库

    使用Docker快速安装部署ES和Kibana的前提:首先需要确保已经安装了Docker环境 如果没有安装Docker的话,可以参考上一篇的内容:Linux上安装Docker 有了Docker环境后, ...

  5. IK分词器-自定义分词算法与自定义分词配置

    一.分词的概念 分词:就是把我们要查询的数据拆分成一个个关键字,我们在搜索时,ElasticSearch会把数据进行分词,然后做匹配.默认的中文分词器会把每一个中文拆分,比如"迪丽热巴&qu ...

  6. solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词

    solr基本指令: jetty部署[推荐]: Linux: $ bin/solr start: Windows: bin\solr.cmd start 创建core: Linux: $ bin/sol ...

  7. Elasticsearch7.15.2 ik中文分词器 定制化分词器之扩展词库(远程)

    IK分词提供的两个分词器,并不支持一些新的词汇,有时候也不能满足实际业务需要,这时候,我们可以定义自定义词库来完成目标. 文章目录 一.静态web搭建 1. 安装nginx 2. 创建es目录 3. ...

  8. Elasticsearch配置ik中文分词器自定义词库

    1.IK配置文件 在config目录下: IKAnalyzer.cfg.xml:配置自定义词库 main.dic:分词器自带的词库,索引会按照里面的词创建 quantifier.dic:存放计量单位词 ...

  9. es拼音分词 大帅哥_elasticsearch实现中文分词和拼音分词混合查询+CompletionSuggestion...

    引言 之前已经介绍了如何搭建elasticsearch服务端和简单的索引创建,和中文分词的支持.今天我们来说一说如何实现elasticsearch同时实现中文分词和pinyin分词.并且实现类似百度搜 ...

  10. IK分词器-自定义分词

    我们首先测试一下IK分词器的ik_smart最少切分策略. GET _analyze {"analyzer": "ik_smart","text&qu ...

最新文章

  1. java实现分词_JAVA实现智能分词
  2. python server酱_12306这是肿么了?开售一秒就抢完,如何用Python抢到回家车票?
  3. MySQL数据库的优化-运维架构师必会高薪技能,笔者近六年来一线城市工作实战经验...
  4. 不花钱、不买服务器可以搭建个人博客吗?快进来,给你安排!
  5. 用于对Compound协议进行无Gas投票和委托的社区工具发布
  6. 在职工象棋赛上弃子拿下一盘
  7. linux安装oracle
  8. oracle10g rac导出ocr,Oracle RAC 迁移OCR(10g)
  9. 关于VS2015卸载后,重装无法修改路径问题
  10. 全网最详细ANSYS Maxwell16下载及安装
  11. U2000V200R018 的安装教程我们用微软的Windows7专业版示例
  12. typecho图片插件_typecho插件:HighSlide文章弹窗相册插件
  13. OGRE: Ogre第一个程序
  14. 《构建高性能Web站点》
  15. 怎么修改背景图片大小的HTML代码,css如何改变背景图片大小?
  16. Face Attention Network: An Effective Face Detector for the Occluded Faces
  17. mac brew 测速 软件_Mac已到手?从零开始,八步打造一个高效舒适的开发环境
  18. 基于MATLAB的进制转换
  19. 灵魂筹码一直显示连接服务器,灵魂筹码进不去怎么办_灵魂筹码进入显示错误解决方法_3DM单机...
  20. 【DS with Python】 re模块与正则表达式

热门文章

  1. vsto c# openxml操作excel
  2. 荒神罪蜀山传 服务器未响应,《DOTA2》荒神罪蜀山传新手攻略
  3. 黑盒测试AND白盒测试
  4. cocos 修改层级_管理节点层级和显示顺序
  5. 在线抖音去水印,下载抖音背景音乐
  6. php提取pdf首页图片,pdf图片怎么提取
  7. 使用rem等比例缩放手机界面
  8. 浅谈腾讯云IM接入方式(java后端)
  9. win10下安装ubuntu双系统
  10. 关于一级域名和二级域名跨域的解决方案