ElasticSearch分词近义词
1.在config/目录下创建文件
analysis/synonym.txt
内容如下
搜房,房天下 成交均价,成交单价,房价,售价 保障房,经济适用房,配套商品房,动迁房,廉租房 出租,租赁 买卖,销售 克而瑞,CRAC 耐克=>鞋子
2.创建索引时分析器配置过滤
{"settings": {"index": {"max_result_window": 1000000},"analysis": {"analyzer": {"ik_max_word": {"tokenizer": "ik_max_word","filter": ["lowercase","asciifolding","my_synonym_filter"]}},"filter": {"my_synonym_filter": {"type": "synonym","synonyms_path": "analysis/synonym.txt"}}}},"mappings": {"properties": {"goodsName": {"type": "text","analyzer": "ik_max_word"}}} }
因为“克而瑞”和“CRAC”是近义词,所以在搜索结果中既有“克而瑞”,也有“CRAC”
3.同义词配置详解
一行一个同义词,其中 AA,BB=>CC 这种写法会将AA与BB都映射到CC,然后只对CC进行索引;而 AA,BB 这种当文档中存在AA时,不仅仅会索引AA还会索引BB;这里需要注意的是如果文件中一个词存在于多行,那么对应的近义词会累计,如:
小米,小米手机 小米,小米电脑
此时“小米”对应的近义词是“小米手机”,“小米电脑”,但如果是输入“小米手机”,那么近义词只有“小米”.
ElasticSearch分词近义词相关推荐
- 【Elasticsearch】相关性,近义词匹配,纠错匹配
目录 相关性 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 向量空间模型 Lucene 的实用评分函数 近义词匹配 近义词查询原理 同义词过滤器 纠错匹配 ...
- JAVA ik es_安装elasticsearch及中文IK和近义词配置
安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...
- 安装elasticsearch及中文IK和近义词配置
安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...
- ES elasticsearch-analysis-dynamic-synonym连接数据库动态更新synonym近义词
前言 在很多搜索场景中,我们希望能够搜索出搜索词相关的目标,同时也希望能搜索出其近义词相关的目标.例如在商品搜索中,搜索"瓠瓜",也希望能够搜索出"西葫芦",但 ...
- 人为增加近义词 | Word2Vec的语料制作和训练
第零步:介绍 终于弄明白了gensim.word2vec怎么玩,说到底word2vec就是用共现矩阵来判断两个词语是不是相关,从而得出两个词语相似度高不高,这话听起来有问题~ 但事实就是这样的,不管我 ...
- Synonyms:一个开源的中文近义词工具包
作者:Synonyms 项目的作者胡小夕是北京邮电大学研究生,目前实习于今日头条 AI LAB.从事自然语言处理方向研究,在智能客服,知识图谱等领域都有相关研究开发经验. 工具包技术说明:该中文近义词 ...
- Elasticsearch-ik同义词,近义词,联想词
Elasticsearch-ik同义词,近义词,联想词 1. 将ik安装到elasticsearch/plugin/ 两种方式: (1) 方式1:下载构建包: https://github.com/m ...
- python 近义词库包 synonyms 的使用
最近接触到nlp的一些东西,需要找出中文词语的近义词,也接触到了一个synonyms 的库, 分词,去停用词,word2vector 等 一些列nlp 的操作,还可以输出中文词语的近义词 https ...
- Synonyms最好的中文近义词工具包
1.中文分词 import synonyms synonyms.seg("中文近义词工具包") 分词结果,由两个list组成的元组,分别是单词和对应的词性. (['中文', '近义 ...
- LeetCode 1258. 近义词句子(哈希+并查集+排序+回溯)
文章目录 1. 题目 2. 解题 1. 题目 给你一个近义词表 synonyms 和一个句子 text , synonyms 表中是一些近义词对 ,你可以将句子 text 中每个单词用它的近义词来替换 ...
最新文章
- linux uefo引导 win_基于UEFI和GPT模式下U盘安装windows8.1和Linux双启动教程
- 二级域名怎么设置_怎么建设自己的网站?看完这四个步骤你就明白了
- 如何避免面试中薪水要的太高或太低?
- WIN32获取进程当前目录
- 如何在无显示器的ubuntu下跑selenium
- 罗永浩关联直播交易案遭“问停”;中国量子计算原型机“九章”问世;pip 20.3 发布 | 极客头条...
- android设置window背景颜色,Android WindowManager 背景暗化
- C++禁止隐式转换之explicit用法
- matlab中怎样绘制离散点,matlab中怎么绘制大量的离散点
- 全球与中国引文管理软件市场深度研究分析报告
- 页面回到顶部的几种方法
- Java入门基础知识之函数
- TwinCAT 3 安全门程序
- python xlwt_Python模块xlwt对excel进行写入操作
- word自动生成目录如何设置第一页和页码不齐问题
- springboot下,JedisPool getResource导致大量线程WAITING,服务假死
- kafka的分区详解
- 最快的 Hexo 博客搭建方法
- 郑捷《机器学习算法原理与编程实践》学习笔记(第二章 中文文本分类(二)—朴素贝叶斯算法)...
- 三星mzvlb1t0hblr是什么固态_固态硬盘跑分速度天梯图/天梯表,最全搜集。