【全】在 Docker 的Solr容器中安装 IK 中文分词器
【原创文章,转载请标明出处】
这些坑我已经帮你踩过了:
- 现在大家能够在网上(需要禾斗学上网)下载的IK分词器版本已经非常老了,而Solr更新还是非常快的,所以会出现版本不兼容的问题,不然即使成功装上了,也无法进行分词,Solr会报异常:java.lang.AbstractMethodError
File | Summary + Labels | Uploaded | Size |
---|---|---|---|
[IK Analyzer 2012FF_hf1_source.rar] | IK Analyer 2012-FF Hotfix 1 源码 Type-Archive OpSys-All Ver 2012 FF hf1 | Dec 21, 2012 | 1.02MB |
[IK Analyzer 2012_u6_source.rar] | IK Analyer 2012 upgrade 6 源码 Type-Source OpSys-All version 2012 u6 | Dec 21, 2012 | 1.02MB |
[IKAnalyzer2012_u6.zip] | IK Analyer 2012 完整分发包 upgrade 6 Type-Archive OpSys-All version 2012 u6 For Lucene 3.x / Solr3.x | Oct 29, 2012 | 2.04MB |
[IK Analyzer 2012FF_hf1.zip] | IK Analyer 2012-FF hotfix 1 完整分发包 Type-Archive OpSys-All version 2012FF hotfix1 For lucene4.0 / solr 4.0 | Oct 26, 2012 | 2.05MB |
[IK Analyzer 2012 FF_SRC.rar] | IK Analyer 2012-FF 源码 Type-Source OpSys-All Ver 2012 FF | Oct 23, 2012 | 1.02MB |
所以现在给大家提供比较新的两个版本:
Solr6(包含)以下食用更佳:https://github.com/cj96248/ik-analyzer-solr6
(推荐) Solr7&8食用更佳:https://github.com/magese/ik-analyzer-solr
上面两个都需要将源码打成JAR包,操作见下篇文章
当然solr5以前的可以装上老版本,我也都因为勤(cai)快(keng)下好了
链接:https://pan.baidu.com/s/1WAtY5kjI75Kg-e6OAH69cw
提取码:g5ib
文章目录
- 安装Solr
- 安装核心选择器
- 安装配置IK分词器
- 真香时刻
安装Solr
拉取Solr镜像
docker pull solr
创建Solr容器并运行
–name mySolr 给自己的容器取名mySolr
-p 8983:8983 8983端口号映射到宿主机的8983端口上
-d solr 后台运行容器
docker run --name mySolr -p 8983:8983 -d solr
直接访问Solr服务
浏览器直接访问
http://宿主服务器ip地址:8983
电脑虚拟机无法访问检查防火墙,阿里云等云服务器需要进行安全组配置开放端口,这里就不多赘述了。
页面上的Versions就是Solr的版本号
安装核心选择器
创建核心选择器
exec -it :交互式执行容器
-c 内核的名称(必须)
docker exec -it mySolr bin/solr create_core -c myIKCore
安装配置IK分词器
传输IK分词器
先通过FTP传输软件传入宿主机的某一文件夹内
没有按照开篇说的步骤将源码打成JAR包的我也准备好了(最好还是学下怎么打JAR包吧)
链接:https://pan.baidu.com/s/1HRkBrGSQ3d4jl-XL07fSKw
提取码:fviy将JAR包复制到Solr容器的分词包文件夹中
docker cp ik-analyzer.jar mySolr:/opt/solr-8.3.1/contrib/analysis-extras/lucene-libs
查看Solr容器在宿主机中数据卷的位置
docker inspect mySolr
找到Mounts
Destination 容器里的路径
Source 对应宿主机里的路径
将IK分词器配置到Solr的核心配置文件中
Source就是上一步骤的Source值,不是真写{Source} 就是上一步骤的Source值,不是真写Source就是上一步骤的Source值,不是真写{Source}哈
cd ${Source}/data/myIKCore/conf/ vim solrconfig.xml
添加如下内容
dir 容器存放自带分词JAR包的目录
regex JAR包名
<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs/" regex="ik-analyzer.jar" />
声明中文分词器
vim managed-schema
找到指定位置添加配置
<!-- IKAnalyzer --> <fieldType name ="text_ik" class ="solr.TextField"><!-- 索引时候的分词器--><analyzer type ="index" isMaxWordLength ="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/><!--查询时候的分词器--><analyzer type ="query" isMaxWordLength ="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
真香时刻
重启Solr容器
docker restart mySolr
浏览器访问Solr
选择刚刚创建的核心选择器
进行分词分析
End……
欢迎来访个人博客:www.geekshare.site
【全】在 Docker 的Solr容器中安装 IK 中文分词器相关推荐
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(十九)ES6.2.2 安装Ik中文分词器
注: elasticsearch 版本6.2.2 1)集群模式,则每个节点都需要安装ik分词,安装插件完毕后需要重启服务,创建mapping前如果有机器未安装分词,则可能该索引可能为RED,需要删除后 ...
- es安装IK中文分词器
没有中文分词器,我们使用es的时候会觉得乐趣少了很多,同时在业务中也有很多不方便的地方,es中对于字符串的默认内置分词是standard类型的,但是这对于中文来说就无能为力了,下面简单介绍一下es中怎 ...
- ElasticSerach安装IK中文分词器,并在Java中使用
1.所有文章优先发表在个人博客上: https://www.xdx97.com 2.后续如果有修改的话,可能忘记更新到CSDN了,给你带来不便,抱歉. 3.个人博客本篇文章地址 : https://w ...
- 30彻底掌握IK中文分词_上机动手实战IK中文分词器的安装和使用
之前大家会发现,字段全部是用英文 其实我们用来进行搜索的,绝大多数,都是中文应用,很少做英文的 默认分词器standard:没有办法对中文进行合理分词的,只是将每个中文字符一个一个的切割开来,比如说中 ...
- 使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库
使用Docker快速安装部署ES和Kibana的前提:首先需要确保已经安装了Docker环境 如果没有安装Docker的话,可以参考上一篇的内容:Linux上安装Docker 有了Docker环境后, ...
- 安装elasticsearch-analysis-ik中文分词器
1 安装elasticsearch-analysis-ik中文分词器 Ik介绍:ik是一款中文的分词插件,支持自定义词库. 1.1 下载ik分词器 下载地址:https://github.com/me ...
- r与python自然语言处理_Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器 | 我爱自然语言处理...
斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Java文本分析工具,包括分词器(Word Segmenter),词性标注工具(Part-Of-Speech Tagger), ...
- 白话Elasticsearch28-IK中文分词之IK中文分词器的安装和使用
文章目录 概述 Github IK安装 ik分词器基础知识 ik_max_word ik_smart 验证ik分词器 示例 概述 继续跟中华石杉老师学习ES,第28篇 课程地址: https://ww ...
- ik中文分词器安装以及简单新增词典操作
ik分词器地址 https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.4.1/elasticsearch-an ...
最新文章
- 当你打开的程序在任务栏出现两个一样的怎么办?
- c语言中的目标程序的正确含义,C语言程序设计练习题整理要点.doc
- [css] css如何消除字体的锯齿?
- 判读一个对象不为空_ArrayList实现分析(一)——对象创建
- 【Level 08】U08 Positive Attitude L1 See the world
- html.fromhtml 加载图片,TextView使用html.fromhtml加载html并显示图片
- CSRF与XSS攻击的原理与防范
- 一键修改电脑硬件信息_不想使用iPhone锁屏键?一键锁屏快捷指令来了
- 用c语言编写一个简易计算器
- 软件测试中什么是正交分析法,软件测试用例设计方法之正交分析法
- 魔兽世界单机mysql修改怪物血量_魔兽世界单机版如何修改怪物掉落物品个数
- 小a的旅行计划(BM模板)
- arXiv 注册完整过程(图文详解)
- 微信公众号 配网 airkiss配网 wifi配网
- 【语言环境】win2008R2SP1+WAMP环境部署
- C语言自由落体程序咋写,C语言实现 小球自由落体问题
- 成都Uber优步司机奖励政策(3月10日)
- mac用brew安装mysql报错1045(28000)
- css绘制卡券优惠券_用纯css来实现一个优惠券
- 苹果系统设置http代理ip教程
热门文章
- 发送writely和orkut邀请
- 猫狗肠道菌群—“主子们”的健康新领域
- 计算机毕业设计Java夕阳红养老院系统(源码+系统+mysql数据库+Lw文档)
- markdown语法教学(for萌新版)
- Win7完全卸载MySQL的步骤
- (天池)超级码力在线编程大赛初赛 第2场
- 20核服务器项目,详细解答E5-2680v2,20核40线程服务器的具体用途怎么体现出来
- 《Python基础教程》第2章读书笔记(1)
- 【佳学基因人工智能】ANACONDA下安装SCIPY
- H5 App调试工具vconsole