1.在config/目录下创建文件

analysis/synonym.txt

内容如下

搜房,房天下
成交均价,成交单价,房价,售价
保障房,经济适用房,配套商品房,动迁房,廉租房
出租,租赁
买卖,销售
克而瑞,CRAC
耐克=>鞋子

2.创建索引时分析器配置过滤

{"settings": {"index": {"max_result_window": 1000000},"analysis": {"analyzer": {"ik_max_word": {"tokenizer": "ik_max_word","filter": ["lowercase","asciifolding","my_synonym_filter"]}},"filter": {"my_synonym_filter": {"type": "synonym","synonyms_path": "analysis/synonym.txt"}}}},"mappings": {"properties": {"goodsName": {"type": "text","analyzer": "ik_max_word"}}}
}

因为“克而瑞”和“CRAC”是近义词,所以在搜索结果中既有“克而瑞”,也有“CRAC”

3.同义词配置详解

一行一个同义词,其中 AA,BB=>CC 这种写法会将AA与BB都映射到CC,然后只对CC进行索引;而 AA,BB 这种当文档中存在AA时,不仅仅会索引AA还会索引BB;这里需要注意的是如果文件中一个词存在于多行,那么对应的近义词会累计,如:

小米,小米手机
小米,小米电脑

此时“小米”对应的近义词是“小米手机”,“小米电脑”,但如果是输入“小米手机”,那么近义词只有“小米”.

ElasticSearch分词近义词相关推荐

  1. 【Elasticsearch】相关性,近义词匹配,纠错匹配

    目录 相关性 布尔模型 词频/逆向文档频率(TF/IDF) 词频 逆向文档频率 字段长度归一值 结合使用 向量空间模型 Lucene 的实用评分函数 近义词匹配 近义词查询原理 同义词过滤器 纠错匹配 ...

  2. JAVA ik es_安装elasticsearch及中文IK和近义词配置

    安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...

  3. 安装elasticsearch及中文IK和近义词配置

    安装elasticsearch及中文IK和近义词配置 安装java环境 java环境是elasticsearch安装必须的 yum install java-1.8.0-openjdk 安装elast ...

  4. ​ES elasticsearch-analysis-dynamic-synonym​连接数据库动态更新synonym近义词

    前言 在很多搜索场景中,我们希望能够搜索出搜索词相关的目标,同时也希望能搜索出其近义词相关的目标.例如在商品搜索中,搜索"瓠瓜",也希望能够搜索出"西葫芦",但 ...

  5. 人为增加近义词 | Word2Vec的语料制作和训练

    第零步:介绍 终于弄明白了gensim.word2vec怎么玩,说到底word2vec就是用共现矩阵来判断两个词语是不是相关,从而得出两个词语相似度高不高,这话听起来有问题~ 但事实就是这样的,不管我 ...

  6. Synonyms:一个开源的中文近义词工具包

    作者:Synonyms 项目的作者胡小夕是北京邮电大学研究生,目前实习于今日头条 AI LAB.从事自然语言处理方向研究,在智能客服,知识图谱等领域都有相关研究开发经验. 工具包技术说明:该中文近义词 ...

  7. Elasticsearch-ik同义词,近义词,联想词

    Elasticsearch-ik同义词,近义词,联想词 1. 将ik安装到elasticsearch/plugin/ 两种方式: (1) 方式1:下载构建包: https://github.com/m ...

  8. python 近义词库包 synonyms 的使用

    最近接触到nlp的一些东西,需要找出中文词语的近义词,也接触到了一个synonyms 的库, 分词,去停用词,word2vector  等 一些列nlp 的操作,还可以输出中文词语的近义词 https ...

  9. Synonyms最好的中文近义词工具包

    1.中文分词 import synonyms synonyms.seg("中文近义词工具包") 分词结果,由两个list组成的元组,分别是单词和对应的词性. (['中文', '近义 ...

  10. LeetCode 1258. 近义词句子(哈希+并查集+排序+回溯)

    文章目录 1. 题目 2. 解题 1. 题目 给你一个近义词表 synonyms 和一个句子 text , synonyms 表中是一些近义词对 ,你可以将句子 text 中每个单词用它的近义词来替换 ...

最新文章

  1. linux uefo引导 win_基于UEFI和GPT模式下U盘安装windows8.1和Linux双启动教程
  2. 二级域名怎么设置_怎么建设自己的网站?看完这四个步骤你就明白了
  3. 如何避免面试中薪水要的太高或太低?
  4. WIN32获取进程当前目录
  5. 如何在无显示器的ubuntu下跑selenium
  6. 罗永浩关联直播交易案遭“问停”;中国量子计算原型机“九章”问世;pip 20.3 发布 | 极客头条...
  7. android设置window背景颜色,Android WindowManager 背景暗化
  8. C++禁止隐式转换之explicit用法
  9. matlab中怎样绘制离散点,matlab中怎么绘制大量的离散点
  10. 全球与中国引文管理软件市场深度研究分析报告
  11. 页面回到顶部的几种方法
  12. Java入门基础知识之函数
  13. TwinCAT 3 安全门程序
  14. python xlwt_Python模块xlwt对excel进行写入操作
  15. word自动生成目录如何设置第一页和页码不齐问题
  16. springboot下,JedisPool getResource导致大量线程WAITING,服务假死
  17. kafka的分区详解
  18. 最快的 Hexo 博客搭建方法
  19. 郑捷《机器学习算法原理与编程实践》学习笔记(第二章 中文文本分类(二)—朴素贝叶斯算法)...
  20. 三星mzvlb1t0hblr是什么固态_固态硬盘跑分速度天梯图/天梯表,最全搜集。

热门文章

  1. Less系列之导入(Importing)
  2. 计算机技术能力校本培训总结,教师现代教育技术校本培训总结(2篇)
  3. COS对象存储服务的使用
  4. 解决方案-联想电脑插耳机后仍然外放
  5. youtube下载视屏和字幕办法
  6. Hadoop运维记录系列(十九)
  7. [生存志] 第14节 历代大事件概览 西汉
  8. SPSS作业-一元线性回归
  9. 写JAVA的,码农,程序员,工程师有啥不同
  10. 上海数据分析师面试经历