1、IK分词(Git)

1.1、IK分词插件安装

/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.zip
sudo systemctl stop elasticsearch.service
sudo systemctl start elasticsearch.service

PS:如果是集群模式,则每个节点都需要安装;

1.2、本地词库配置

vi /etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml

修改"ext_dict",可在/etc/elasticsearch/analysis-ik/目录下新建custom,拷贝fresh.dic。

<entry key="ext_dict">custom/fresh.dic</entry>

重启elasticsearch即可

PS:如果是集群模式,则每个节点都需要配置;

1.3、远程词库配置(热更新)

vi /etc/elasticsearch/analysis-ik/IKAnalyzer.cfg.xml

修改"remote_ext_dict"

<entry key="remote_ext_dict">http://ip:port/products/freshdictrequest</entry>

通过配置远程扩展词典,可以完成热词更新。

实现方式:从词库中查询近一分钟新增热词,若存在,则在OpenResty中修改header的ETag(Etag=os.time())

PS:如果是集群模式,则每个节点都需要配置;

该实现方式有一坑:

IKAnalyzer.cfg.xml中配置后,重启ES,报异常

java.security.AccessControlException: access denied (java.net.SocketPermission ip:port connect,resolve)

此时,需要在

/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.161-0.b14.el7_4.x86_64/jre/lib/security/java.policy

中新增信任站点:

permission java.net.SocketPermission "ip:port","accept";permission java.net.SocketPermission "ip:port","listen";permission java.net.SocketPermission "ip:port","resolve";permission java.net.SocketPermission "ip:port","connect";

2、拼音分词(Git)

/usr/share/elasticsearch/bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v6.2.3/elasticsearch-analysis-pinyin-6.2.3.zip
sudo systemctl stop elasticsearch.service
sudo systemctl start elasticsearch.service

PS:如果是集群模式,则每个节点都需要安装;

3、IK-PinYin分词方案(仅供参考,欢迎指正!)

PUT test
{"index": {"analysis": {"analyzer": {"ik_pinyin_analyzer": {"type": "custom","tokenizer": "ik_smart","filter": ["my_pinyin","word_delimiter"]}},"filter": {"my_pinyin" : {"type" : "pinyin","keep_separate_first_letter" : false,"keep_full_pinyin" : true,"keep_original" : false,"limit_first_letter_length" : 10,"lowercase" : true,"remove_duplicated_term" : true}}}}
}

ElasticSearch之中文、拼音分词相关推荐

  1. debian 10 buster 安装配置 elastic search 和 中文, 拼音分词

    debian 10 buster 安装配置 es 和 中文, 拼音分词 安装 测试 配置 分词 IK 分词器 拼音分词 一个完整的动态映射模板(包含geo, pinyin, IK) 安装 1, 安装j ...

  2. Springboot集成elasticsearch 使用IK+拼音分词

    Springboot集成elasticsearch 使用IK+拼音分词 docker安装ES 下载 docker pull docker.elastic.co/elasticsearch/elasti ...

  3. Elasticsearch 5.5.1 中文/拼音分词 亲测有效

    所有不说明elastic 版本的博客都是耍流氓 . --某码农 原文链接 版本如题.拼音和中文分词一起的整个测试流程如下: 预备 删除 index DELETE /index_name/ { } 创建 ...

  4. 记一次springboot2.3.*项目整合elasticsearch7.6.2实现中文拼音分词搜索

    一.elasticsearch官网下载:Elasticsearch 7.6.2 | Elastic 二.拼音.ik.繁简体转换插件安装 ik分词:GitHub - medcl/elasticsearc ...

  5. Elasticsearch如何修改拼音分词插件支持音调搜索

    背景 es默认加载的拼音分词插件是不支持音调搜索的,如何修改插件使得它支持音调搜索?又或者多音字你想要默认的读音是另外一个,例如曾默认读音是ceng,我想修改其默认读音为zeng. 下载拼音分词插件代 ...

  6. es拼音分词 大帅哥_SpringBoot集成Elasticsearch 进阶,实现中文、拼音分词,繁简体转换...

    Elasticsearch 分词 分词分为读时分词和写时分词. 读时分词发生在用户查询时,ES 会即时地对用户输入的关键词进行分词,分词结果只存在内存中,当查询结束时,分词结果也会随即消失.而写时分词 ...

  7. 【Elasticsearch】Elasticsearch analyzer 中文 分词器

    1.概述 转载: https://blog.csdn.net/tzs_1041218129/article/details/77887767 分词器首先看文章:[Elasticsearch]Elast ...

  8. Elasticsearch 2.3.x 拼音分词 analysis-lc-pinyin

    我选择了elasticsearch-analysis-lc-pinyin作为拼音分词插件,它是一款elasticsearch拼音分词插件,可以支持按照全拼.首字母,中文混合搜索. elasticsea ...

  9. ElasticSearch 2.4.X实现中文拼音排序

    前言 最近接到一个需求,要求实现搜索框的搜索结果可以按照中文排序,本人灵机一动,那不很简单吗,直接按照es自带的sort功能处理下不就行了吗?两分钟的代码量,半天的喝茶时间,白赚半天的故事点,嘿嘿. ...

最新文章

  1. 带哨兵节点的链_【算法导论】10.2不带哨兵节点和带哨兵节点的双向链表
  2. linux中光标向上调一行命令,Linux vi 中移动光标 命令
  3. 利用泛型接口实现生成器
  4. grafana3.1.0安装配置
  5. CentOS 6.3(x86_64)下安装Oracle 10g R2
  6. C++一级与二级指针基础详解
  7. 设计模式(创建型)之原型模式
  8. 易宝典文章——怎样配置TMG能够使外部用户成功访问Outlook Anywhere?
  9. 中国碳酸镁铝行业市场供需与战略研究报告
  10. 【Spring学习笔记-0】Spring开发所需要的核心jar包
  11. vue 中获取select 的option的value 直接click?
  12. linux内核2.6.3x--Executable file formats / Emulations、 Networking support
  13. 微型计算机gl703评测,华硕为Strix GL503GE/GL703GE笔记本更新至第8代CPU
  14. c语言标准差公式标准差数组,Excel标准差计算函数Stdev和StdevP的用法与区别,包含4个实例...
  15. C# vb .net实现相机视图效果滤镜
  16. 在layer弹出层中使用ueditor,所有的下拉选项事件都显示不了,或被遮挡
  17. 智能药盒的设计与实现
  18. Jmeter遇到打不开的问题
  19. LOGO的国际标准规范
  20. 在 C# 中下载图片

热门文章

  1. 汪春阳:Cisco数据中心3.0改变了什么?
  2. 连接远程服务器并上传文件
  3. 【无监督:结构张量:融合框架】
  4. Python 爬虫的小案例(男性福利)
  5. matlab数字信号处理实验报告,数字信号处理实验报告(Matlab与数字信号处理基础).doc...
  6. 判断素数、输出100内素数 C语言初学
  7. html下拉列表框做日期,几种常用的控件(下拉框 可选框 起止日期 在HTML页面直接读取当前时间)...
  8. 单片机课程设计--网络时钟
  9. jQuery实现展开伸缩效果
  10. map评价吗 voc数据集可以用coco_目标检测评价指标(mAP)