solor中配置IK Analyzer分词
solr6.0中进行中文分词器IK Analyzer的配置和solr低版本中最大不同点在于IK Analyzer中jar包的引用。一般的IK分词jar包都是不能用的,因为IK分词中传统的jar不支持solr6.0这个高版本的,所以就会发送运行错误的界面。下面就来介绍一下solr6.0中中文分词器IK Analyzer的配置。
步骤1:
下载solr6.0专用的IK Analyzer的jar包和相应的配置文件。因为IK Analyzer可以很方便的对词库近些年扩展,所以我在IK Analyzer中加入了搜狗词库的配置,可以最大限度的收录现在一些潮流的词语。 IK Analyzer的jar包和相应的配置文件下载地址:点击打开链接
步骤2:
解压上一个步骤所得到的压缩包,将ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INF\lib目录中去,将IKAnalyzer.cfg.xml,mydict.dic(搜狗的扩展词库),stopword.dic放在solr项目下的WEB-INF\classes目录中去。
步骤3:
将项目下solrhome\mynode\conf下的managed-schema配置文件中</schema>上面加入如下配置信息:(如果这里不懂的话可以去看我前几篇的博客关于solr6.0项目的环境的配置 连接地址:点击打开链接)
- <span style="font-size:14px;"> <fieldType name="text_ik" class="solr.TextField">
- <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
- </fieldType>
- <field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" /></span>
solor中配置IK Analyzer分词相关推荐
- lucene6中配置IK Analyzer同义词分词器
首先需要基础知识 intellij idea中为lucene6配置IK Analyzer分词器 说到同义词分词器,从原理角度来说要了解了Analyzer Analyzer分词的原理 Analyzer类 ...
- solr配置中文IK Analyzer分词器
1.下载IK Analyzer分词器文件 链接: https://pan.baidu.com/s/1hrA1YyK 密码: 9hpk 中文IK Analyzer分词器的相关配置使用资料: 链接:htt ...
- Solr7.2.1环境搭建和配置ik中文分词器
solr7.2.1环境搭建和配置ik中文分词器 安装环境:Jdk 1.8. windows 10 安装包准备: solr 各种版本集合下载:http://archive.apache.org/dist ...
- 使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库
使用Docker快速安装部署ES和Kibana的前提:首先需要确保已经安装了Docker环境 如果没有安装Docker的话,可以参考上一篇的内容:Linux上安装Docker 有了Docker环境后, ...
- 【全】在 Docker 的Solr容器中安装 IK 中文分词器
[原创文章,转载请标明出处] 这些坑我已经帮你踩过了: 现在大家能够在网上(需要禾斗学上网)下载的IK分词器版本已经非常老了,而Solr更新还是非常快的,所以会出现版本不兼容的问题,不然即使成功装上了 ...
- Elasticsearch配置ik中文分词器自定义词库
1.IK配置文件 在config目录下: IKAnalyzer.cfg.xml:配置自定义词库 main.dic:分词器自带的词库,索引会按照里面的词创建 quantifier.dic:存放计量单位词 ...
- solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词
solr基本指令: jetty部署[推荐]: Linux: $ bin/solr start: Windows: bin\solr.cmd start 创建core: Linux: $ bin/sol ...
- Solr配置IK Analyzer
拷贝jar包至:tomcat-8\webapps\solr\WEB-INF\lib 文件夹下 拷贝剩余三个资源文件至:tomcat-8\webapps\solr\WEB-INF\classes文件夹 ...
- IK Analyzer 中文分词器
IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始, IKAnalyzer已经推出了3个大版本.最初,它是以开源项目Luence为应用 ...
最新文章
- RocksDB线程局部缓存
- log4j.properties配置总结
- git撤销/回退操作
- C++中的逻辑操作符重载
- SpringBatch批处理框架入门(一)
- MySQL视图附带例子详解(小白都能懂哦)
- [转载] Python入门(输入/输出、数据类型、条件/循环语句)
- 判定两个点是否在一条直线的同一侧_计算几何01-判定两条线段是否相交
- 机器学习-逻辑回归-信用卡检测任务
- 产品经理改需求这件事
- project2016资源管理
- MATLAB plotyy总结
- 联发科MT6797/Helio X20软件用户手册资料介绍
- HTML_canvas
- 【Linux】写实拷贝、父子进程间数据共享以及僵死进程
- NAT技术---网络地址转换
- 线性代数基础10--特征值与特征向量,行列式的空间关系
- apollo planning module
- IntelliJ IDEA设置查看Java API帮助文档
- set.seed的作用
热门文章
- NLP——part of speech (POS)中的隐马尔可夫模型 + Viterbi 算法
- 野火无刷电机驱动板pcb,原理图,电源电压检测,电机电流检测,pwm控制信号
- 用Fiddler做WEB服务与页面分析,以及自动化任务
- 阿里云-函数计算,Process exited unexpectedly before completing request,错误解决
- PAT 1099 Build A Binary Search Tree
- 时间概念 — 24时区、GMT、UTC的意涵
- 工作流: Gitlab和Telegram集成
- 银行元宇宙3D数字虚拟人的应用场景
- 测试用例和BUG管理
- uni-app - 基于uView的base-navbar实现