参考文章:http://www.cnblogs.com/sword-successful/p/5604541.html

转载文章:http://www.cnblogs.com/pazsolr/p/5796813.html

1.下载IK分词器包。

链接:http://pan.baidu.com/s/1i4D0fZJ 密码:bcen

2.解压并把IKAnalyzer5.3.1.jar 、IK-Analyzer-extra-5.3.1.jar拷贝到tomcat/webapps/solr/WEB-INF/lib下。

3.修改schema.xml配置文件,如下:

修改后的配置文件

[html] view plaincopy
  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <schema name="example" version="1.5">
  3. <field name="_version_" type="long" indexed="true" stored="true"/>
  4. <field name="_root_" type="string" indexed="true" stored="false"/>
  5. <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />
  6. <field name="title" type="text_ik" indexed="true" stored="true" multiValued="true"/>
  7. <field name="subject" type="text_ik" indexed="true" stored="true"/>
  8. <field name="description" type="text_ik" indexed="true" stored="true"/>
  9. <field name="text" type="text_ik" indexed="true" stored="false" multiValued="true"/>
  10. <uniqueKey>id</uniqueKey>
  11. <copyField source="title" dest="text"/>
  12. <copyField source="subject" dest="text"/>
  13. <copyField source="description" dest="text"/>
  14. <fieldType name="string" class="solr.StrField" sortMissingLast="true" />
  15. <fieldType name="long" class="solr.TrieLongField" precisionStep="0" positionIncrementGap="0"/>
  16. <fieldType name="date" class="solr.TrieDateField" precisionStep="0" positionIncrementGap="0"/>
  17. <fieldType name="text_ik" class="solr.TextField">
  18. <analyzer type="index" useSmart="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  19. <analyzer type="query" useSmart="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  20. </fieldType>
  21. <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
  22. <analyzer type="index">
  23. <tokenizer class="solr.StandardTokenizerFactory"/>
  24. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
  25. <filter class="solr.LowerCaseFilterFactory"/>
  26. </analyzer>
  27. <analyzer type="query">
  28. <tokenizer class="solr.StandardTokenizerFactory"/>
  29. <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
  30. <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
  31. <filter class="solr.LowerCaseFilterFactory"/>
  32. </analyzer>
  33. </fieldType>
  34. </schema>

修改完成之后保存并重启solr服务器。

solr5.3.1 集成IK中文分词器相关推荐

  1. Elasticsearch7.15.2 集成ik中文分词器 适用于单机和集群

    文章目录 一.下载部署 1. 版本对应 2. 下载ik 3. 目录权限 4. 切换es用户 5. 启动es 6. 验证es 7. 切换kibana 用户 8. 启动kibana 9. 验证kibana ...

  2. 学习 ES 的笔记、全文检索、倒排索引、Lucene、ik中文分词器、Kibana使用Dev Tools

    文章目录 感悟 新接触的单词 知识点一:ES是什么? 知识点二:ES基本概念 知识点三:1.1 什么是全文检索和Lucene? 知识点四:1.2 什么是倒排索引,Lucene实现全文检索的流程是怎样? ...

  3. 玩转ES,一文教你掌握IK中文分词器

    前言 ES默认的分词器对中文分词并不友好,所以我们一般会安装中文分词插件,以便能更好的支持中文分词检索. 而ES的中文分词器中,最流行的必然是IK分词器. 一.IK分词器介绍 IK分词器在是一款基于词 ...

  4. python连接es_Elasticsearch --- 3. ik中文分词器, python操作es

    一.IK中文分词器 1.下载安装 2.测试 #显示结果 {"tokens": [ {"token" : "上海","start_o ...

  5. solr集成IKAnalyzer中文分词器

    如果想要知道如何安装solr,集成IKAnalyzer中文分词器,批量导入数据库数据,java使用参照以下本博主博文: 安装solr https://blog.csdn.net/u013294097/ ...

  6. Solr7.2.1环境搭建和配置ik中文分词器

    solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...

  7. Kafka:ZK+Kafka+Spark Streaming集群环境搭建(十九)ES6.2.2 安装Ik中文分词器

    注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...

  8. ES7 IK中文分词器

    IK中文分词器的安装 ES默认是没有IK中文分词器的,我们要将IK中文分词器作为一个插件安装到ES中,安装的步骤也很简单: 从GitHub上下载适合自己ES版本的IK中文分词器,地址如下:https: ...

  9. 分词器以及ik中文分词器

    文章目录 分词器以及ik中文分词器 概念 ik分词器的安装 环境准备 设置jdk环境变量 下载maven安装包并解压 设置path 验证maven是否安装成功 下载IK分词器并安装 使用IK分词器 查 ...

最新文章

  1. 从新手机到老股票 闲鱼为何会沦为骗子与营销的新平台?
  2. 编程之美3——N!末尾有多少个0
  3. 77岁“核弹老人”,前后半生都令人动容!
  4. 平流式隔油池计算_隔油池计算方法及图集[参考提供]
  5. 云服务器 ECS 搭建WordPress网站:购买 Linux 实例
  6. find border vertex
  7. lambda函数if_Python中lambda的使用,与它的三个好基友介绍
  8. pythoncv2模块详细介绍_【Opencv】【Python】Python中opencv模块cv2一些函数用法及简介...
  9. Flutter 技术介绍
  10. C++随机生成中文姓名
  11. 我是CSDN最硬核作者,谁赞成,谁反对?
  12. Merlin:一个开源的神经网络语音合成系统
  13. 网络调试助手TCP server不能成功连接
  14. 基于centos部署的 漏洞扫描工具(afrog)
  15. 不依赖任何库打造属于自己的可视化数据地图
  16. STM32单片机—编码器测速
  17. Freeline使用说明
  18. 实验室周赛暨CCPC选拔赛
  19. 条码打印软件之优化导入PDF文档的清晰度
  20. C/C++研发实习生要求

热门文章

  1. jQuery 事件介绍
  2. Python-数据结构(二)
  3. Django框架(7.Django中视图,url的配置)
  4. wxWidgets:拖放样本
  5. boost::hana::map_用法的测试程序
  6. boost::advance用法的测试程序
  7. boost::hana模块实现算术的测试程序
  8. boost::maximum_weighted_matching用法的测试程序
  9. boost::fusion::zip用法的测试程序
  10. boost::fusion::remove用法的测试程序