我选择了elasticsearch-analysis-lc-pinyin作为拼音分词插件,它是一款elasticsearch拼音分词插件,可以支持按照全拼、首字母,中文混合搜索。

elasticsearch-analysis-lc-pinyin一共有两个版本分别是1.4.5和2.2.2,和es的版本对应
        1.4.5 这个版本对应ES1.X
        2.2.2这个版本对应ES2.X
       请根据需要安装对应的版本,下面地址中压缩包已经包含了这两个版本
        安装插件需要将elasticsearch-analysis-lc-pinyin的源码自己maven  build出来,这样可以避免版本冲突
git 地址:http://git.oschina.net/remoter/elasticsearch-analysis-pinyin
现在网上没有找到有关2.X的插件安装和配置介绍,我摸索了很久才完成,这里记录下:

编译安装:

首先是build源码,使用将目录切到相应目录,我的是:

    cd F:\software\elasticsearch-analysis-lc-pinyin-dev_2.2.2\elasticsearch-analysis-lc-pinyin

然后执行maven build命令(当然,前提是你安装了maven,并配置好环境变量)

  mvn package

然后就等待他的编译,完成时会在..\elasticsearch-analysis-lc-pinyin\target\releases目录下生产一个zip,我们只需将这个zip解压到elasticsearch的plugin目录下即可。

配置使用:

lc 2.x是不需要在elasticsearch.yml里配置的,我们只需要重启elasticsearch实例即可。
关键就是在于使用上mapping和DSL的配置。
由于elasticsearch 1.x和2.x改动很大,所以我这里直接贴2.x的mapping配置了:
curl -XPUT http://localhost:9200/addr
curl -XPOST http://localhost:9200/addr/std/_mapping -d'
{  "std": {  "properties": { "detail_name": {  "type": "string",  "analyzer": "lc_index",  "search_analyzer": "lc_search",  "fields": {  "cn": {  "type": "string",  "analyzer": "ik_max_word",  "search_analyzer": "ik_max_word"  }}  },"door_name":{"type": "string",  "analyzer": "lc_index",  "search_analyzer": "lc_search",  "fields": {  "cn": {  "type": "string",  "analyzer": "ik_max_word",  "search_analyzer": "ik_max_word"  }}  }}  }
}' 

主要问题是在于,1.x是 index_analyzer 为 lc_index ,但是2.x 没有了index_analyzer 这个参数。

 
接下来就和1.x差不多了。
 

转载于:https://www.cnblogs.com/churao/p/5884442.html

Elasticsearch 2.3.x 拼音分词 analysis-lc-pinyin相关推荐

  1. ElasticSearch之中文、拼音分词

    1.IK分词(Git) 1.1.IK分词插件安装 /usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.co ...

  2. Elasticsearch 分布式搜索引擎 -- elasticsearch-analysis-pinyin 拼音分词器的安装和介绍

    1. 拼音分词器 要实现根据字母做补全,就必须对文档按照拼音分词.在GitHub上恰好有elasticsearch的 拼音分词插件. 7.12.1 版本(因为我的es是7.12.1版本) 1.1.1 ...

  3. Elasticsearch生产实战(ik分词器、拼音分词、自动补全、自动纠错)

    目录 一.IK分词器 1.IK分词器介绍 2.安装 3.使用 4.自定义词库 二.拼音分词器 1.拼音分词器介绍 2.安装 三.自动补全 1.效果演示 2.实战 四.自动纠错 1.场景描述 2.DSL ...

  4. Springboot集成elasticsearch 使用IK+拼音分词

    Springboot集成elasticsearch 使用IK+拼音分词 docker安装ES 下载 docker pull docker.elastic.co/elasticsearch/elasti ...

  5. 记一次springboot2.3.*项目整合elasticsearch7.6.2实现中文拼音分词搜索

    一.elasticsearch官网下载:Elasticsearch 7.6.2 | Elastic 二.拼音.ik.繁简体转换插件安装 ik分词:GitHub - medcl/elasticsearc ...

  6. elasticsearch analysis模块 自定义分词 拼音分词 同义词 停词

    Analysis Analysis 解析器由三个模块=character filters(字符过滤器), tokenizers(标记器), and token filters(标记过滤器)组成 Ana ...

  7. ElasticSearch + IK分词 + 拼音分词

    Docker 安装 ES 因为是测试需要,所以跟公司版本保持一致即可 sudo docker pull elasticsearch:7.4.2sudo mkdir -p /data/es_home/c ...

  8. Elasticsearch 分布式搜索引擎 -- 自动补全(拼音分词器、自定义分词器、自动补全查询、实现搜索框自动补全)

    文章目录 1. 自动补全 1.1 拼音分词器 1.2.1 自定义分词器 1.2.2 小结 1.2 自动补全 1.3 实现酒店搜索框自动补全 1.3.1 修改酒店映射结构 1.3.2 修改HotelDo ...

  9. Elasticsearch配置拼音分词和自定义分词器

    下载elasticsearch-analysis-pinyin拼音分词器  https://codeload.github.com/medcl/elasticsearch-analysis-pinyi ...

最新文章

  1. 关于mysql engine(引擎)的疑问
  2. mysql 包含非数字_mysql 正则表达式查询含有非数字和字符的记录
  3. c语言oj1124,程序设计入门——C语言 第2周编程练习 1时间换算(5分)
  4. linux目录/etc/nc.d/nc.local开机启动项无效
  5. Print2flash在.NET(C#)64位中的使用,即文档在线预览(转载)
  6. [leetcode]209. 长度最小的子数组
  7. C# 中使用反射的优缺点
  8. 部署ganglia3.7
  9. centOS7 更改主机名localhost.localdomain
  10. 【C语言】筛选法求素数
  11. FlexPaper查看.swf文件的使用方法
  12. 手机支付宝密码存储机制分析
  13. 【ARM 嵌入式 C 入门及渐进 2 -- 向上取整向下取整 linux roundup/round_up】
  14. 搜索广告的整体架构-子模块划分
  15. 9.目标检测基础、图像风格迁移
  16. 计算机机房管理具体工作和职责,机房职责_机房岗位职责_机房工作职责
  17. 2021年高教杯数学建模国赛C题的解题过程附全部代码以及参赛论文(百度网盘)
  18. 从零学前端第十七讲:小程序开发
  19. Linux通过vidpid找到摄像头对应的索引
  20. linux chrome ui字体,谷歌Chrome 69浏览器标签栏字体模糊的解决方法

热门文章

  1. 解决vmware“二进制转换与此平台长模式不兼容.....”的问题
  2. Java 多线程详解(四)------生产者和消费者
  3. python 循环控制语句结束,Python是如何循环控制语句的
  4. 前端把cookie写在父域里_单点登录的三种实现方式
  5. 边缘计算应用场景_从6大应用场景,看边缘计算落地生根
  6. 系统学习NLP(二十四)--详解Transformer (Attention Is All You Need)
  7. 图论(三)--各种基础图算法总结
  8. Hbase roekey设计入门
  9. kafka 幂等机制入门实例
  10. Windows核心编程调用打印机