solr5.3.1 集成IK中文分词器
参考文章:http://www.cnblogs.com/sword-successful/p/5604541.html
转载文章:http://www.cnblogs.com/pazsolr/p/5796813.html
1.下载IK分词器包。
链接:http://pan.baidu.com/s/1i4D0fZJ 密码:bcen
2.解压并把IKAnalyzer5.3.1.jar 、IK-Analyzer-extra-5.3.1.jar拷贝到tomcat/webapps/solr/WEB-INF/lib下。
3.修改schema.xml配置文件,如下:
修改后的配置文件
- <?xml version="1.0" encoding="UTF-8" ?>
- <schema name="example" version="1.5">
- <field name="_version_" type="long" indexed="true" stored="true"/>
- <field name="_root_" type="string" indexed="true" stored="false"/>
- <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
- <field name="title" type="text_ik" indexed="true" stored="true" multiValued="true"/>
- <field name="subject" type="text_ik" indexed="true" stored="true"/>
- <field name="description" type="text_ik" indexed="true" stored="true"/>
- <field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>
- <uniqueKey>id</uniqueKey>
- <copyField source="title" dest="text"/>
- <copyField source="subject" dest="text"/>
- <copyField source="description" dest="text"/>
- <fieldType name="string" class="solr.StrField" sortMissingLast="true" />
- <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
- <fieldType name="date" class="solr.TrieDateField" precisionStep="0" positionIncrementGap="0"/>
- <fieldType name="text_ik" class="solr.TextField">
- <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
- <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
- </fieldType>
- <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
- <analyzer type="index">
- <tokenizer class="solr.StandardTokenizerFactory"/>
- <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
- <filter class="solr.LowerCaseFilterFactory"/>
- </analyzer>
- <analyzer type="query">
- <tokenizer class="solr.StandardTokenizerFactory"/>
- <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
- <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
- <filter class="solr.LowerCaseFilterFactory"/>
- </analyzer>
- </fieldType>
- </schema>
修改完成之后保存并重启solr服务器。
solr5.3.1 集成IK中文分词器相关推荐
- Elasticsearch7.15.2 集成ik中文分词器 适用于单机和集群
文章目录 一.下载部署 1. 版本对应 2. 下载ik 3. 目录权限 4. 切换es用户 5. 启动es 6. 验证es 7. 切换kibana 用户 8. 启动kibana 9. 验证kibana ...
- 学习 ES 的笔记、全文检索、倒排索引、Lucene、ik中文分词器、Kibana使用Dev Tools
文章目录 感悟 新接触的单词 知识点一:ES是什么? 知识点二:ES基本概念 知识点三:1.1 什么是全文检索和Lucene? 知识点四:1.2 什么是倒排索引,Lucene实现全文检索的流程是怎样? ...
- 玩转ES,一文教你掌握IK中文分词器
前言 ES默认的分词器对中文分词并不友好,所以我们一般会安装中文分词插件,以便能更好的支持中文分词检索. 而ES的中文分词器中,最流行的必然是IK分词器. 一.IK分词器介绍 IK分词器在是一款基于词 ...
- python连接es_Elasticsearch --- 3. ik中文分词器, python操作es
一.IK中文分词器 1.下载安装 2.测试 #显示结果 {"tokens": [ {"token" : "上海","start_o ...
- solr集成IKAnalyzer中文分词器
如果想要知道如何安装solr,集成IKAnalyzer中文分词器,批量导入数据库数据,java使用参照以下本博主博文: 安装solr https://blog.csdn.net/u013294097/ ...
- Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(十九)ES6.2.2 安装Ik中文分词器
注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...
- ES7 IK中文分词器
IK中文分词器的安装 ES默认是没有IK中文分词器的,我们要将IK中文分词器作为一个插件安装到ES中,安装的步骤也很简单: 从GitHub上下载适合自己ES版本的IK中文分词器,地址如下:https: ...
- 分词器以及ik中文分词器
文章目录 分词器以及ik中文分词器 概念 ik分词器的安装 环境准备 设置jdk环境变量 下载maven安装包并解压 设置path 验证maven是否安装成功 下载IK分词器并安装 使用IK分词器 查 ...
最新文章
- 从新手机到老股票 闲鱼为何会沦为骗子与营销的新平台?
- 编程之美3——N!末尾有多少个0
- 77岁“核弹老人”,前后半生都令人动容!
- 平流式隔油池计算_隔油池计算方法及图集[参考提供]
- 云服务器 ECS 搭建WordPress网站:购买 Linux 实例
- find border vertex
- lambda函数if_Python中lambda的使用,与它的三个好基友介绍
- pythoncv2模块详细介绍_【Opencv】【Python】Python中opencv模块cv2一些函数用法及简介...
- Flutter 技术介绍
- C++随机生成中文姓名
- 我是CSDN最硬核作者,谁赞成,谁反对?
- Merlin:一个开源的神经网络语音合成系统
- 网络调试助手TCP server不能成功连接
- 基于centos部署的 漏洞扫描工具(afrog)
- 不依赖任何库打造属于自己的可视化数据地图
- STM32单片机—编码器测速
- Freeline使用说明
- 实验室周赛暨CCPC选拔赛
- 条码打印软件之优化导入PDF文档的清晰度
- C/C++研发实习生要求
热门文章
- jQuery 事件介绍
- Python-数据结构(二)
- Django框架(7.Django中视图,url的配置)
- wxWidgets:拖放样本
- boost::hana::map_用法的测试程序
- boost::advance用法的测试程序
- boost::hana模块实现算术的测试程序
- boost::maximum_weighted_matching用法的测试程序
- boost::fusion::zip用法的测试程序
- boost::fusion::remove用法的测试程序