Elasticsearch 自带一个名为 synonym 的同义词 filter。为了能让 IK 和 synonym 同时工作,我们需要定义新的 analyzer,用 IK 做 tokenizer,synonym 做 filter。听上去很复杂,实际上要做的只是加一段配置。

官方配置

  • 在ElasticSearch/config配置文件下创建 /analysis/synonym.txt 文件 此文件需要受权 chmod -R 777

    • mkdir -p analysis

    • vi synonym.txt

    • synonym.txt 文件,输入一些同义词并存为 utf-8 格式
      同义词格式 示例1

      中国,中华人民共和国

      执行此类型分词得到的过结果

      GET demo/_analyze
      {"analyzer" :  "ik_smart_synonym", "text" : "中国"}{"tokens" : [{"token" : "中国","start_offset" : 0,"end_offset" : 2,"type" : "CN_WORD","position" : 0},{"token" : "中华人民共和国","start_offset" : 0,"end_offset" : 2,"type" : "SYNONYM","position" : 0}]
      }

      同义词格式 示例2

      中国 => 中华人民共和国

      执行此类型分词得到的过结果

      GET demo/_analyze
      {"analyzer" :  "ik_smart_synonym", "text" : "中国"}{"tokens" : [{"token" : "中华人民共和国","start_offset" : 0,"end_offset" : 2,"type" : "SYNONYM","position" : 0}]
      }
  • 在索引 settings下index修改analysis中 filter和analyzer即可,可查看如下示例
    PUT demo
    {"aliases" : {},"mappings" : {"properties" : {"article_no" : {"type" : "text","analyzer" : "ik_max_custom","search_analyzer" : "ik_smart_synonym"}}},"settings" : {"index" : {"number_of_shards" : "1","analysis" : {"filter" : {"my_synonym_filter": {"type": "synonym","synonyms_path":"analysis/synonyms.txt"}},"analyzer" : {"ik_max_custom" : {"filter" : ["my_synonym_filter"],"tokenizer" : "ik_max_word"},"ik_smart_synonym": {"type":      "custom","tokenizer": "ik_smart","filter": ["my_synonym_filter"]}}},"number_of_replicas" : "1"}}
    }
    

ElasticSearch IK配置同义词相关推荐

  1. elasticsearch ik配置动态同义词

    使用环境 elasticsearch5.1.1 kibana5.1.1 同义词插件5.1.1 安装插件 下载对应的elasticsearch-analysis-dynamic-synonym-5.1. ...

  2. elasticsearch ik分词实现 中文、拼音、同义词搜索

    EasticSearch版本:1.5.2 1.配置分词器:配置IK,参照 <ElasticSearch 安装和使用IK分词器> 2.拼音分词器配置:使用已经编译好的:elasticsear ...

  3. solr配置同义词,停止词,和扩展词库(IK分词器为例)

    定义 同义词:搜索结果里出现的同义词.如我们输入"还行",得到的结果包括同义词"还可以". 停止词:在搜索时不用出现在结果里的词.比如is .a .are .& ...

  4. [大数据]-Fscrawler导入文件(txt,html,pdf,worf...)到Elasticsearch5.3.1并配置同义词过滤...

    fscrawler是ES的一个文件导入插件,只需要简单的配置就可以实现将本地文件系统的文件导入到ES中进行检索,同时支持丰富的文件格式(txt.pdf,html,word...)等等.下面详细介绍下f ...

  5. Elasticsearch 安装配置及学习

    何为全文搜索? 全文搜索本质:非结构化数据转成结构化数据,提取非结构化数据 全文搜索是一种将文件中所有文件与搜索项匹配的文字资料检索方法 原理:建立本库 ---> 建立索引 ---> 执行 ...

  6. Elasticsearch常用配置及性能参数

    Elasticsearch常用配置及性能参数 cluster.name: estest   集群名称 node.name: "testanya"  节点名称 node.master ...

  7. solr之使用IKAnalyzer配置同义词,停止词,扩展词。

    环境如下: solr4.7 IKAnalyzer2012FF_u1 配置同义词 第一步 将IKAnalyzer2012FF_u1放到solr-4.7.2/example/solr-webapp/web ...

  8. ElasticSearch——IK分词器的下载及使用

    ElasticSearch--IK分词器的下载及使用 1.什么是IK分词器 ElasticSearch 几种常用分词器如下: 分词器 分词方式 StandardAnalyzer 单字分词 CJKAna ...

  9. Elasticsearch 常用配置参数总结

    Elasticsearch 重要参数配置 通过阅读官方文档了解到其中重要参数的配置及其说,下面将逐步进行了解. 一. ElasticSearch参数配置 1. data和logs路径配置 如果使用.z ...

  10. elasticsearch 基本配置

    基本配置 elasticsearch的config文件夹里面有两个配置文件:elasticsearch.yml .logging.yml.jvm.options 第一个是es的基本配置文件,第二个是日 ...

最新文章

  1. Web Worker 使用教程
  2. 百度开发平台提交应用后进行官方认证审核失败?
  3. 大哥你需求里说只要工作流引擎组件,怎么真正需要的东西这么.悲剧了,客户需求无止境...
  4. 蓝桥杯 ALGO-149 算法训练 5-2求指数
  5. css html设计网页完整代码,htmlcss完整的网页代码
  6. 什么是SoC?什么是IP核?它们有什么关系?
  7. 555定时器的工作原理
  8. PHP友情链接检测代码
  9. 严重:init datasource errorcom.mysql.jdbc.exceptions.jdb4.CommunicationsException:Communications link失败
  10. CENTOS上的网络安全工具(十二)走向Hadoop(4) Hadoop 集群搭建
  11. 基因编辑最新研究成果进展(2021年11月)
  12. 英雄联盟无法开始第二局(已解决,亲测有效)
  13. html学习笔记-用代码画皮卡丘
  14. 未能正确加载“Microsoft.VisualStudio.Editor.Implementation.EditorPackage
  15. 特朗普遭抗议:美国投资人仍看好可再生能源
  16. 4c钻石净度魔术语言,钻石的4c指的是什么 钻石净度si是不是很差
  17. 51单片机学习笔记-3模块化编程
  18. Springboot整合JPA
  19. 简评 淮上喜会梁州故人
  20. c语言洛谷刷题日记P5734 【深基6.例6】文字处理软件(合理运用字符串函数)

热门文章

  1. bash shell学习的记录(一)
  2. vs2010如何发布窗体应用程序到服务器,C++ CLR 使用(VS2012,VS2013,VS2015)编写Windows窗体应用程序...
  3. 《JAVA程序设计基础与应用》pdf 附下载链接
  4. gimp 抠图_gimp软件如何实现抠图?
  5. yuzu模拟器linux,yuzu模拟器使用教程 yuzu模拟器手机版下载
  6. 组态软件android版,昆仑通态组态软件
  7. Office基础操作:Word插入visio图片显示不全
  8. 数据系统架构-3.数据仓库设计
  9. MATLAB实现智能优化算法
  10. 趣谈网络协议栈,以太网基础MAC和PHY