IK如何实现同义词搜索
转载请声明出处,谢谢。翻译也很辛苦
solr学习交流扣扣群340954928
IK如何实现同义词搜索
如何通过IK实现
<!--[if !supportLists]-->1、 <!--[endif]-->在schema.xml中配置
<fieldType name="text_ik" class="solr.TextField" > <analyzer type="index" > <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/> </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" /> <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/> </analyzer> </fieldType> |
<!--[if !supportLists]-->2、 <!--[endif]-->修改solr配置文件synonyms.txt
打开synonyms.txt文件,写如下内容,另存为utf-8文件,覆盖原来的synonyms.txt文件
#some test synonym mappings unlikely to appear in real input text aaafoo => aaabar bbbfoo => bbbfoo bbbbar cccfoo => cccbar cccbaz fooaaa,baraaa,bazaaa # Some synonym groups specific to this example GB,gib,gigabyte,gigabytes MB,mib,megabyte,megabytes Television, Televisions, TV, TVs #notice we use "gib" instead of "GiB" so any WordDelimiterFilter coming #after us won't split it into two words. # Synonym mappings can be used for spelling correction too pixima => pixma 康飞,飞飞,小飞,飞机 小人 => 男人 女人 认认 人人 |
<!--[if !supportLists]-->3、 <!--[endif]-->创建collection,进入analysis,做测试
<!--[endif]-->
<!--[if !supportLists]-->4、 <!--[endif]-->后期动态维护synonyms.txt的办法是,使用zookeeper管理工具,连接到zookeeper管理中心,找到synonyms.txt文件,修改,保存。
Zookeeper管理工具下载地址:
https://github.com/woshikangfei/zookeeper
IK如何实现同义词搜索相关推荐
- Elasticsearch5.3.1 IK分词,同义词/联想搜索设置
本文主要是记录Elasticsearch5.3.1 IK分词,同义词/联想搜索设置,本来是要写fscrawler的多种格式(html,pdf,word...)数据导入的,但是IK分词和同义词配置还是折 ...
- 同义词搜索是如何做到的?
前面几个章节我们使用到了 Lucene 的中文分词器 HanLPAnalyzer,它并不是 Lucene 自带的中文分词器.Lucene 确实自带了一些中文分词器,但是效果比较弱,在生产实践中多用第三 ...
- Elasticsearch学习笔记6: 同义词搜索实现
2019独角兽企业重金招聘Python工程师标准>>> es的同义词搜索功能通过自定义分析器实现 我们知道 一个 分析器 就是在一个包里面组合了三种函数的一个包装器, 三种函数按照顺 ...
- Elasticsearch1.x 基于lc-pinyin和ik分词实现 中文、拼音、同义词搜索
一.简介 有时候我们需要在项目中支持中文 和 拼音的搜索.采用ik分词来做中文分词是目前比好的方式.至于拼音分词可以采用lc-pinyin,虽然lc-pinyin能很好的解决首字母和全拼的搜索,但是在 ...
- elasticsearch ik分词实现 中文、拼音、同义词搜索
EasticSearch版本:1.5.2 1.配置分词器:配置IK,参照 <ElasticSearch 安装和使用IK分词器> 2.拼音分词器配置:使用已经编译好的:elasticsear ...
- elasticsearch ik配置动态同义词
使用环境 elasticsearch5.1.1 kibana5.1.1 同义词插件5.1.1 安装插件 下载对应的elasticsearch-analysis-dynamic-synonym-5.1. ...
- es html标签,Elasticsearch如何使用同义词搜索富文本html标签过滤以及分权限过滤搜索结果...
如何建立恰当的索引结点 { "mappings": { "data": { "properties": { "answer_id& ...
- ElasticSearch 6.3.2版本使用 ik + 拼音复合分词 搜索
1.通过Kibana 输入命令 {"index": {"analysis": {"analyzer": {"ik_pinyin_a ...
- lucene6中配置IK Analyzer同义词分词器
首先需要基础知识 intellij idea中为lucene6配置IK Analyzer分词器 说到同义词分词器,从原理角度来说要了解了Analyzer Analyzer分词的原理 Analyzer类 ...
- es 修改ik和同义词插件源码连接mysql实现字典值同义词热更新
问题描述: 上周运营反馈商城搜索词搜不到 排查发现es ik分词器的ik_smart对搜索词的分词结果不是ik_max_word对索引文档字段值分词结果的子集 即细粒度分词结果不完全包含粗粒度分词结果 ...
最新文章
- 厉害!这位北科大博士生,4年9篇SCI一作
- 电子漫画 - 轻轻松松
- Linux下kvm宿主机死机,看到一些朋友苦虚拟机久矣,分享下我使用KVM的一些经验和技巧...
- matlab如何截取图像的中间部分_利用matlab提取并分割RGB图像中的某一个已知像素值的图像...
- ORACLE审计初步入门
- ubuntu下安装,查看,拉取docker镜像
- java+character类使用_Java Character类应用实例
- MiniProfiler,一个.NET简单但有效的微型分析器
- python框架django文档_Django基础——Django框架介绍及模板语言
- html css3模拟心的跳动
- 小甲鱼 OllyDbg 教程系列 (十一) : inline patch ( 内嵌补丁 )
- JSP Unable to compile class for JSP
- arcgis创建城市路网
- DOS windows PE三者有什么区别
- 高德地图html5生成,高德地图选择位置然后生成静态地图
- 怎么把录音文件转换成mp3格式,3个高效方法
- 计算机屏幕暗度怎么调,电脑屏幕亮度太亮怎么调暗一点
- 一一数落2006几大“恶心”事件
- AES加密,由S盒计算逆S盒程序
- c语言程序设计振动合成,C语言课程设计-振动波的合成原理
热门文章
- 基于python的百度离线地图下载器
- Excel2007中文显示乱码的解决方法(亲自实践)
- win10输入法转win7模式
- mzy git学习,git协同开发忽略文档配置以及一些杂点(九)
- string entitlement = Application.dataPath+ “/Editor/Entitle Unity工程到处iOS工程,用脚本把Push Notifications打开
- 用友U8案例教程目录
- word 2019 方框中打勾
- 贪心——国际象棋锦标赛
- 开源网站的漏洞复现(appcms、wordpress)
- Docker安装phpmyadmin