elasticsearch-analysis-ik-1.10.0中文分词插件安装
2019独角兽企业重金招聘Python工程师标准>>>
版本说明
根据ik官网提示,elasticsearch2.4.0需要使用elasticsearch-analysis-ik-1.10.0版本
前提条件
首先,需要有一个es服务器.
其次,需要一个maven环境(由于ik不再支持install安装,只能通过源码安装)
提示:如果不想搭建maven环境,可以使用我已经打包好的elasticsearch-analysis-ik-1.10.0.zip
安装步骤
1.下载源码
https://codeload.github.com/medcl/elasticsearch-analysis-ik/zip/v1.10.0
2.插件打包
unzip elasticsearch-analysis-ik-1.10.0.zip
cd elasticsearch-analysis-ik-1.10.0
mvn package#出现下面内容说明编译成功
Tests run: 0, Failures: 0, Errors: 0, Skipped: 0[INFO]
[INFO] --- maven-jar-plugin:2.4:jar (default-jar) @ elasticsearch-analysis-ik ---
[INFO]
[INFO] >>> maven-source-plugin:2.1.2:jar (attach-sources) > generate-sources @ elasticsearch-analysis-ik >>>
[INFO]
[INFO] --- maven-enforcer-plugin:1.0:enforce (enforce-maven) @ elasticsearch-analysis-ik ---
[INFO]
[INFO] <<< maven-source-plugin:2.1.2:jar (attach-sources) < generate-sources @ elasticsearch-analysis-ik <<<
[INFO]
[INFO] --- maven-source-plugin:2.1.2:jar (attach-sources) @ elasticsearch-analysis-ik ---
[INFO] Building jar: /Downloads/elasticsearch-analysis-ik-1.10.0/target/elasticsearch-analysis-ik-1.10.0-sources.jar
[INFO]
[INFO] --- maven-assembly-plugin:2.2-beta-5:single (default) @ elasticsearch-analysis-ik ---
[INFO] Reading assembly descriptor: /Downloads/elasticsearch-analysis-ik-1.10.0/src/main/assemblies/plugin.xml
[INFO] Building zip: /Downloads/elasticsearch-analysis-ik-1.10.0/target/releases/elasticsearch-analysis-ik-1.10.0.zip
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 9.865 s
[INFO] Finished at: 2016-10-09T18:59:29+08:00
[INFO] Final Memory: 23M/469M
[INFO] ------------------------------------------------------------------------
3.安装插件
将zip包解压到ES_HOME/plugins/ik目录下(ik目录需要自己创建)
重启es服务器即可.
注: 由于新版本ik插件不需要配置elasticsearch.yml文件.重启后,在日志中看到ik-analyzer表示ik分词器安装成功
[2016-10-09 17:47:04,558][INFO ][ik-analyzer ] try load config from /home/es/es-client/config/analysis-ik/IKAnalyzer.cfg.xml
[2016-10-09 17:47:04,559][INFO ][ik-analyzer ] try load config from /home/es/es-client/plugins/ik/config/IKAnalyzer.cfg.xml
[2016-10-09 17:47:04,995][INFO ][ik-analyzer ] [Dict Loading] custom/mydict.dic
[2016-10-09 17:47:04,997][INFO ][ik-analyzer ] [Dict Loading] custom/single_word_low_freq.dic
[2016-10-09 17:47:05,006][INFO ][ik-analyzer ] [Dict Loading] custom/ext_stopword.dic
4.分词验证
curl -XPUT http://192.168.22.158:9201/indexhttp://192.168.22.158:9201/index/_analyze?analyzer=ik&pretty=true&text="我是中国人"
#返回结果
{"tokens": [{"token": "我","start_offset": 1,"end_offset": 2,"type": "CN_CHAR","position": 0},{"token": "中国人","start_offset": 3,"end_offset": 6,"type": "CN_WORD","position": 1},{"token": "中国","start_offset": 3,"end_offset": 5,"type": "CN_WORD","position": 2},{"token": "国人","start_offset": 4,"end_offset": 6,"type": "CN_WORD","position": 3}]
}curl -XPOST http://192.168.22.158:9201/index/fulltext/_mapping -d'
{"fulltext": {"_all": {"analyzer": "ik_max_word","search_analyzer": "ik_max_word","term_vector": "no","store": "false"},"properties": {"content": {"type": "string","store": "no","term_vector": "with_positions_offsets","analyzer": "ik_max_word","search_analyzer": "ik_max_word","include_in_all": "true","boost": 8}}}
}'curl -XPOST http://192.168.22.158:9201/index/fulltext/1 -d'
{"content":"美国留给伊拉克的是个烂摊子吗"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/2 -d'
{"content":"公安部:各地校车将享最高路权"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/3 -d'
{"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/4 -d'
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/_search -d'
{"query" : { "term" : { "content" : "中国" }},"highlight" : {"pre_tags" : ["<tag1>", "<tag2>"],"post_tags" : ["</tag1>", "</tag2>"],"fields" : {"content" : {}}}
}
'
#返回结果
{"took": 172,"timed_out": false,"_shards": {"total": 5,"successful": 5,"failed": 0},"hits": {"total": 2,"max_score": 1.5,"hits": [{"_index": "index","_type": "fulltext","_id": "4","_score": 1.5,"_source": {"content": "中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"},"highlight": {"content": ["<tag1>中国</tag1>驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"]}},{"_index": "index","_type": "fulltext","_id": "3","_score": 0.53699243,"_source": {"content": "中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"},"highlight": {"content": ["中韩渔警冲突调查:韩警平均每天扣1艘<tag1>中国</tag1>渔船"]}}]}
}
转载于:https://my.oschina.net/cnarthurs/blog/755958
elasticsearch-analysis-ik-1.10.0中文分词插件安装相关推荐
- elasticsearch5安装和elasticsearch-analysis-ik中文分词插件安装
ElasticSearch简介 Elastic有一条完整的产品线及解决方案:Elasticsearch.Kibana.Logstash等,前面说的三个就是大家常说的ELK技术栈. Elasticsea ...
- elasticsearch-analysis-ik中文分词插件安装及配置Ik自定义词典+拼音分词
在Elasticsearch中默认的分词器对中文的支持不好,会分隔成一个一个的汉字.而IK分词器对中文的支持比较好,主要有两种模式"ik_smart"和"ik_max_w ...
- Elasticsearch学习笔记(三)安装hanlp中文分词插件及同义词配置
目录 hanlp分词插件 插件安装 在线安装 离线安装 安装数据包 同义词配置 hanlp分词插件 HanLP是一款免费开源(Apache License 2.0协议)中文语义分词工具,它提供中文分词 ...
- 基于 Ansj 的 elasticsearch 2.3.1 中文分词插件
前言 这是一个elasticsearch的中文分词插件,基于Ansj中文分词.发起者Onni大神. 2.3.1插件安装 进入Elasticsearch目录运行如下命令 进入es目录执行如下命令 ./b ...
- elasticsearch6.2.2安装中文分词插件IK analyzer
elasticsearch6.2.2安装中文分词插件IK analyzer 哎,装了一下午的ik终于装上了,发现自己真的是非常笨了,并且es重启过程中遇到了很多的问题,下面我将手把手教大家如何安装ik ...
- Elasticsearch07:ES中文分词插件(es-ik)安装部署
一.ES中文分词插件(es-ik) 在中文数据检索场景中,为了提供更好的检索效果,需要在ES中集成中文分词器,因为ES默认是按照英文的分词规则进行分词的,基本上可以认为是单字分词,对中文分词效果不理想 ...
- 基于 HanLP 的 ES 中文分词插件
一.分词插件 1.分词器概念 在 ES 中,分词器的作用是从文本中提取出若干词元(token)来支持索引的存储和搜索,分词器(Analyzer)由一个分解器(Tokenizer).零个或多个词元过滤器 ...
- es ik分词插件安装
es ik分词插件安装 1.ik下载(下载es对应版本的ik分词包) https://github.com/medcl/elasticsearch-analysis-ik/releases 2.解压下 ...
- python 3.10.0源码编译安装
python 3.10.0源码编译安装 文章目录 python 3.10.0源码编译安装 1. 安装编译依赖工具 2. 下载python 3.10.0 3. 编译安装 Python 4. 体验 1. ...
最新文章
- 如何在高精度下求解亿级变量背包问题?
- Noip2012同余方程
- db first和code first
- 2019年技术盘点云数据库篇(一):UCloud专家谈云数据库:千锤百炼 云之重器
- Mac Pro m1 安装 brew/eclipse/visual stadio code/nodejs/git
- org.apache.subversion.javahl.ClientException: Working copy is not up-to-date
- 关于文件的INode与Java中的文件操作接口
- 华为高管涉嫌受贿已被带走调查
- STP RSTP MSTP PVST+学习 (1)
- java ide 的优劣_Java程序员的困惑 Java IDE到底怎么选
- 【转】OAuth的改变
- NXP智能车竞赛笔记(室外电磁组)
- 电脑计算机 回收站隐藏文件,电脑中怎样隐藏回收站?电脑中隐藏回收站方法【图文】...
- sklearn.metrics.multilabel_confusion_matrix
- 【花雕学AI】超级提问模型大全!150个ChatGPT神奇示例,让你的聊天更有趣!
- python交易是什么意思_py交易是什么意思?
- 前端代码 (html css JavaScript DOM JSON)
- 产品vs程序员:你知道www是怎么来的吗?
- Unity 3d 最新下载与安装
- 网卡介绍——MAC与PHY的关系分析
热门文章
- discuz php 扩展环境 不支持,配置php扩展memcache
- gentoo php,gentoo下的use原始配置让我安装php折腾好久。
- java 字符串每隔两位插入一个字符
- CSS 的导入方式 (link or import ?)
- linux设备文件列表,linux 设备文件
- 利用划分树求解整数区间内第K大的值
- ESP8266的AP模式与STA模式简单测试
- 动态html树形菜单模板,JS+CSS简易树状菜单Tree
- 不使用自动注解方式来生成mapper,采用原生方式来生成mapper
- IDEA中导入一个新项目,出现了Cannot resolve symbol 'String'