elasticsearch使用3:配置同义词词库、ik分词器扩展字典和扩展停止词字典
一、同义词词库配置
编辑环境:windows、elasticsearch7.1.1
1.创建同义词文件
首先要在ES中config文件夹下创建analysis文件,并在里面创建synonym.dic
2.编辑同义词
使用文本编辑器打开文件,输入你想要创建的同义词(分隔符是英文逗号)
西红柿,番茄,tomato
马铃薯,土豆
保存,此时我的文件所在位置为elasticsearch-7.1.1\config\analysis\synonym.dic
3.打开kibana输入以下命令
#创建同义词词库
PUT syno
{"settings": {"analysis": {"filter": {"my_synonym_filter": {"type": "synonym","synonyms_path" : "analysis/synonym.dic"}},"analyzer": {"my_synonyms": {"tokenizer": "ik_smart","filter": ["lowercase","my_synonym_filter"]}}}}
}#查询同义词
GET /syno/_analyze
{"analyzer": "my_synonyms","text": "我爱吃土豆"
}#删除数据库
DELETE syno
4.执行查询后结果
可以看到,同义词词库已配置完成
二、扩展字典和扩展停止词字典配置
1.打开ik分词器所在目录
之前有在ES中\plugins下创建ik目录,并将ik分词器解压到该文件夹下
2.打开\config目录下IKAnalyzer.cfg.xml文件,在其中编写你想要的文件名称
其中ext.dic是扩展字典,ext_stopwords.dic是扩展停止词字典
3.在config目录中创建对应文件
然后用打开写入内容ext.dic(找到上面同义词运行结果中不是词语的组成词语)
我爱
ext_stopwords.dic(找到上面同义词运行结果中的词语)
爱吃
之后重启ES和kibana运行得到结果
至此,扩展字典和扩展停止词字典都已配置完成
elasticsearch使用3:配置同义词词库、ik分词器扩展字典和扩展停止词字典相关推荐
- 基于ik分词器和布隆过滤器实现敏感词过滤
文章目录 准备阶段 为何选用IK Analyzer 什么是布隆过滤器 开发过程 整合Ik 总结 <基于ik分词器和布隆过滤器实现敏感词过滤>首发 牧马人博客转发请加此提示 最近公司业务有个 ...
- Elasticsearch 6.4 ingest-attachment对office文件IK分词器全文检索(1) HttpAPI使用
这款插件主要是处理ES中文档解析,如果博友们对ES感兴趣欢迎相互交流:(该文默认你已经具备Es的IK分词器能力) 安装: elasticsearch-plugin install ingest-att ...
- Elasticsearch+elasticsearch-head的安装+Kibana环境搭建+ik分词器安装
一.安装JDK1.8 二.安装ES 三个节点:master.slave01.slave02 1.这里下载的是elasticsearch-6.3.1.rpm版本包 https://www.elastic ...
- 全文检索引擎ElasticSearch:文档管理、集成IK分词器
ElasticSearch 文档管理 添加文档 修改文档 删除文档 文档的查询 IK分词器安装 使用IK分词器 文档管理 添加文档 定位到资源 url http://localhost:9200/{i ...
- IK分词器的安装和扩展词典的使用
Es中默认的是标准分词器,对于属性类型是text类型的中文语句,进行了单字分词,英文语句是单词分词. 所以在搜索时,如果输入单词搜索,拆分成多个汉字搜索,搜索内容不准确. 故引入更加智能的IK分词器. ...
- Elasticsearch 7.8.1 创建索引,IK分词器的使用
前置知识来自:图解Elasticsearch中的_source._all.store和index属性_1.02^365=1377.41 (Lucene.ES.ELK开发交流群: 370734940, ...
- Elasticsearch实现不同索引使用不同的ik分词器词典
需求说明 原本在IK中,所有索引共用一个词典,热更新词库也是对所有的索引有效. 本文实现,不同的索引,可以配置不同的词典数据 词典数据来自于接口,可以是文件,可以是关系型数据库mysql等 提供数据词 ...
- Elasticsearch——分布式搜索引擎01(索引库、文档、RestAPI、RestClient、拼音分词器、IK分词器)
Elasticsearch--分布式搜索引擎01(索引库.文档.RestAPI.RestClient.拼音分词器.IK分词器) 一.初识 elesticsearch 1.1 简介 1.2 倒排索引(重 ...
- 服务器安装配置elasticsearch,kibana,IK分词器和拼音分词器,集群搭建教程
docker安装配置elasticsearch,kibana和IK分词器 elasticsearch文章系列 前置安装docker 创建docker网络 安装Elasticsearch 运行elast ...
- 04.ElasticSearch之IK分词器的安装与使用
ElasticSearch之IK分词器的安装与使用 前言 安装 离线安装 在线安装 ik分词器测试 扩展(停用)词(典) 测试数据 概念 配置词典 1.修改配置文件 2.新建词典 3.自定义内容 4. ...
最新文章
- 做好职业规划:做自己的船长
- Python垃圾回收机制详解
- Python的sort()
- teraterm 执行sql命令_tera term的ttl脚本使用方法 | 学步园
- 创造型模式——工厂模式
- 微波感应模块电路图_关于人体感应灯,你不知道的“冷”知识
- 数据结构实践项目——图的基本运算及遍历操作
- 2d头发_3D打印毛囊突破性进展!“头发工厂”将成秃顶的救星
- Xilinx Artix-7 Aurora调试过程中遇到的问题
- python中if语句的实例_如何在Python中的if语句中调用某个函数?
- 经典合成器插件 – LennarDigital Sylenth1 v3.067 WiN
- eclipse插件开发:把自定义的文件类型使用xml编辑器打开
- FAT文件系统工作原理
- 第三方平台创建小程序步骤
- Linux vi vim 宏 批量操作 重复操作 宏录制
- android studio wifi,Android Studio第四十一期 - WIFI开发
- java nanotime单位_java – System.nanoTime()的精度与精度
- 有限元方法基础-以二维拉普拉斯方程为例(附程序)
- tplink控制上网设备_在家办公视频会议学生上网课慢 - 带宽控制TP-Link 篇
- 【iOS与EV3混合机器人编程系列之三】编写EV3 Port Viewer 应用监测EV3端口数据