一、同义词词库配置
编辑环境:windows、elasticsearch7.1.1
1.创建同义词文件
首先要在ES中config文件夹下创建analysis文件,并在里面创建synonym.dic
2.编辑同义词
使用文本编辑器打开文件,输入你想要创建的同义词(分隔符是英文逗号)

西红柿,番茄,tomato
马铃薯,土豆

保存,此时我的文件所在位置为elasticsearch-7.1.1\config\analysis\synonym.dic
3.打开kibana输入以下命令

#创建同义词词库
PUT syno
{"settings": {"analysis": {"filter": {"my_synonym_filter": {"type": "synonym","synonyms_path" : "analysis/synonym.dic"}},"analyzer": {"my_synonyms": {"tokenizer": "ik_smart","filter": ["lowercase","my_synonym_filter"]}}}}
}#查询同义词
GET /syno/_analyze
{"analyzer": "my_synonyms","text": "我爱吃土豆"
}#删除数据库
DELETE syno

4.执行查询后结果

可以看到,同义词词库已配置完成

二、扩展字典和扩展停止词字典配置
1.打开ik分词器所在目录
之前有在ES中\plugins下创建ik目录,并将ik分词器解压到该文件夹下
2.打开\config目录下IKAnalyzer.cfg.xml文件,在其中编写你想要的文件名称
其中ext.dic是扩展字典,ext_stopwords.dic是扩展停止词字典

3.在config目录中创建对应文件
然后用打开写入内容ext.dic(找到上面同义词运行结果中不是词语的组成词语)

我爱

ext_stopwords.dic(找到上面同义词运行结果中的词语)

爱吃

之后重启ES和kibana运行得到结果

至此,扩展字典和扩展停止词字典都已配置完成

elasticsearch使用3:配置同义词词库、ik分词器扩展字典和扩展停止词字典相关推荐

  1. 基于ik分词器和布隆过滤器实现敏感词过滤

    文章目录 准备阶段 为何选用IK Analyzer 什么是布隆过滤器 开发过程 整合Ik 总结 <基于ik分词器和布隆过滤器实现敏感词过滤>首发 牧马人博客转发请加此提示 最近公司业务有个 ...

  2. Elasticsearch 6.4 ingest-attachment对office文件IK分词器全文检索(1) HttpAPI使用

    这款插件主要是处理ES中文档解析,如果博友们对ES感兴趣欢迎相互交流:(该文默认你已经具备Es的IK分词器能力) 安装: elasticsearch-plugin install ingest-att ...

  3. Elasticsearch+elasticsearch-head的安装+Kibana环境搭建+ik分词器安装

    一.安装JDK1.8 二.安装ES 三个节点:master.slave01.slave02 1.这里下载的是elasticsearch-6.3.1.rpm版本包 https://www.elastic ...

  4. 全文检索引擎ElasticSearch:文档管理、集成IK分词器

    ElasticSearch 文档管理 添加文档 修改文档 删除文档 文档的查询 IK分词器安装 使用IK分词器 文档管理 添加文档 定位到资源 url http://localhost:9200/{i ...

  5. IK分词器的安装和扩展词典的使用

    Es中默认的是标准分词器,对于属性类型是text类型的中文语句,进行了单字分词,英文语句是单词分词. 所以在搜索时,如果输入单词搜索,拆分成多个汉字搜索,搜索内容不准确. 故引入更加智能的IK分词器. ...

  6. Elasticsearch 7.8.1 创建索引,IK分词器的使用

    前置知识来自:图解Elasticsearch中的_source._all.store和index属性_1.02^365=1377.41 (Lucene.ES.ELK开发交流群: 370734940, ...

  7. Elasticsearch实现不同索引使用不同的ik分词器词典

    需求说明 原本在IK中,所有索引共用一个词典,热更新词库也是对所有的索引有效. 本文实现,不同的索引,可以配置不同的词典数据 词典数据来自于接口,可以是文件,可以是关系型数据库mysql等 提供数据词 ...

  8. Elasticsearch——分布式搜索引擎01(索引库、文档、RestAPI、RestClient、拼音分词器、IK分词器)

    Elasticsearch--分布式搜索引擎01(索引库.文档.RestAPI.RestClient.拼音分词器.IK分词器) 一.初识 elesticsearch 1.1 简介 1.2 倒排索引(重 ...

  9. 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程

    docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...

  10. 04.ElasticSearch之IK分词器的安装与使用

    ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...

最新文章

  1. 做好职业规划:做自己的船长
  2. Python垃圾回收机制详解
  3. Python的sort()
  4. teraterm 执行sql命令_tera term的ttl脚本使用方法 | 学步园
  5. 创造型模式——工厂模式
  6. 微波感应模块电路图_关于人体感应灯,你不知道的“冷”知识
  7. 数据结构实践项目——图的基本运算及遍历操作
  8. 2d头发_3D打印毛囊突破性进展!“头发工厂”将成秃顶的救星
  9. Xilinx Artix-7 Aurora调试过程中遇到的问题
  10. python中if语句的实例_如何在Python中的if语句中调用某个函数?
  11. 经典合成器插件 – LennarDigital Sylenth1 v3.067 WiN
  12. eclipse插件开发:把自定义的文件类型使用xml编辑器打开
  13. FAT文件系统工作原理
  14. 第三方平台创建小程序步骤
  15. Linux vi vim 宏 批量操作 重复操作 宏录制
  16. android studio wifi,Android Studio第四十一期 - WIFI开发
  17. java nanotime单位_java – System.nanoTime()的精度与精度
  18. 有限元方法基础-以二维拉普拉斯方程为例(附程序)
  19. tplink控制上网设备_在家办公视频会议学生上网课慢 - 带宽控制TP-Link 篇
  20. 【iOS与EV3混合机器人编程系列之三】编写EV3 Port Viewer 应用监测EV3端口数据

热门文章

  1. 关于最新的APP上架流程
  2. 一款可视化低代码编程平台开源了!
  3. hasp hl加密狗驱动
  4. 三大运营商发5G白皮书:传统短信迎大升级 推出5G消息
  5. Java程序员必看的 14 本 Java 书籍!
  6. java heapdump 分析工具_heapdump分析工具
  7. vuejs2和echarts3组合显示图表
  8. 计算机硬件的基本组成(计算机组成原理3)
  9. 用极大似然法估计因子载荷矩阵_因子分析的方法和公式 - Minitab
  10. Android5开机自动执行sh,自动脚本执行器