solr6.0中进行中文分词器IK Analyzer的配置和solr低版本中最大不同点在于IK Analyzer中jar包的引用。一般的IK分词jar包都是不能用的,因为IK分词中传统的jar不支持solr6.0这个高版本的,所以就会发送运行错误的界面。下面就来介绍一下solr6.0中中文分词器IK Analyzer的配置。

步骤1:

下载solr6.0专用的IK Analyzer的jar包和相应的配置文件。因为IK Analyzer可以很方便的对词库近些年扩展,所以我在IK Analyzer中加入了搜狗词库的配置,可以最大限度的收录现在一些潮流的词语。  IK Analyzer的jar包和相应的配置文件下载地址:点击打开链接

步骤2:

解压上一个步骤所得到的压缩包,将ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INF\lib目录中去,将IKAnalyzer.cfg.xml,mydict.dic(搜狗的扩展词库),stopword.dic放在solr项目下的WEB-INF\classes目录中去。

步骤3:

将项目下solrhome\mynode\conf下的managed-schema配置文件中</schema>上面加入如下配置信息:(如果这里不懂的话可以去看我前几篇的博客关于solr6.0项目的环境的配置 连接地址:点击打开链接)

[html] view plaincopy
  1. <span style="font-size:14px;">    <fieldType name="text_ik" class="solr.TextField">
  2. <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
  3. </fieldType>
  4. <field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" /></span>

solor中配置IK Analyzer分词相关推荐

  1. lucene6中配置IK Analyzer同义词分词器

    首先需要基础知识 intellij idea中为lucene6配置IK Analyzer分词器 说到同义词分词器,从原理角度来说要了解了Analyzer Analyzer分词的原理 Analyzer类 ...

  2. solr配置中文IK Analyzer分词器

    1.下载IK Analyzer分词器文件 链接: https://pan.baidu.com/s/1hrA1YyK 密码: 9hpk 中文IK Analyzer分词器的相关配置使用资料: 链接:htt ...

  3. Solr7.2.1环境搭建和配置ik中文分词器

    solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...

  4. 使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库

    使用Docker快速安装部署ES和Kibana的前提:首先需要确保已经安装了Docker环境 如果没有安装Docker的话,可以参考上一篇的内容:Linux上安装Docker 有了Docker环境后, ...

  5. 【全】在 Docker 的Solr容器中安装 IK 中文分词器

    [原创文章,转载请标明出处] 这些坑我已经帮你踩过了: 现在大家能够在网上(需要禾斗学上网)下载的IK分词器版本已经非常老了,而Solr更新还是非常快的,所以会出现版本不兼容的问题,不然即使成功装上了 ...

  6. Elasticsearch配置ik中文分词器自定义词库

    1.IK配置文件 在config目录下: IKAnalyzer.cfg.xml:配置自定义词库 main.dic:分词器自带的词库,索引会按照里面的词创建 quantifier.dic:存放计量单位词 ...

  7. solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词

    solr基本指令: jetty部署[推荐]: Linux: $ bin/solr start: Windows: bin\solr.cmd start 创建core: Linux: $ bin/sol ...

  8. Solr配置IK Analyzer

    拷贝jar包至:tomcat-8\webapps\solr\WEB-INF\lib  文件夹下 拷贝剩余三个资源文件至:tomcat-8\webapps\solr\WEB-INF\classes文件夹 ...

  9. IK Analyzer 中文分词器

    IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始, IKAnalyzer已经推出了3个大版本.最初,它是以开源项目Luence为应用 ...

最新文章

  1. RocksDB线程局部缓存
  2. log4j.properties配置总结
  3. git撤销/回退操作
  4. C++中的逻辑操作符重载
  5. SpringBatch批处理框架入门(一)
  6. MySQL视图附带例子详解(小白都能懂哦)
  7. [转载] Python入门(输入/输出、数据类型、条件/循环语句)
  8. 判定两个点是否在一条直线的同一侧_计算几何01-判定两条线段是否相交
  9. 机器学习-逻辑回归-信用卡检测任务
  10. 产品经理改需求这件事
  11. project2016资源管理
  12. MATLAB plotyy总结
  13. 联发科MT6797/Helio X20软件用户手册资料介绍
  14. HTML_canvas
  15. 【Linux】写实拷贝、父子进程间数据共享以及僵死进程
  16. NAT技术---网络地址转换
  17. 线性代数基础10--特征值与特征向量,行列式的空间关系
  18. apollo planning module
  19. IntelliJ IDEA设置查看Java API帮助文档
  20. set.seed的作用

热门文章

  1. NLP——part of speech (POS)中的隐马尔可夫模型 + Viterbi 算法
  2. 野火无刷电机驱动板pcb,原理图,电源电压检测,电机电流检测,pwm控制信号
  3. 用Fiddler做WEB服务与页面分析,以及自动化任务
  4. 阿里云-函数计算,Process exited unexpectedly before completing request,错误解决
  5. PAT 1099 Build A Binary Search Tree
  6. 时间概念 — 24时区、GMT、UTC的意涵
  7. 工作流: Gitlab和Telegram集成
  8. 银行元宇宙3D数字虚拟人的应用场景
  9. 测试用例和BUG管理
  10. uni-app - 基于uView的base-navbar实现