2019独角兽企业重金招聘Python工程师标准>>>

版本说明

根据ik官网提示,elasticsearch2.4.0需要使用elasticsearch-analysis-ik-1.10.0版本

前提条件

首先,需要有一个es服务器.

其次,需要一个maven环境(由于ik不再支持install安装,只能通过源码安装)

提示:如果不想搭建maven环境,可以使用我已经打包好的elasticsearch-analysis-ik-1.10.0.zip

安装步骤

1.下载源码

https://codeload.github.com/medcl/elasticsearch-analysis-ik/zip/v1.10.0

2.插件打包

unzip elasticsearch-analysis-ik-1.10.0.zip
cd elasticsearch-analysis-ik-1.10.0
mvn package#出现下面内容说明编译成功
Tests run: 0, Failures: 0, Errors: 0, Skipped: 0[INFO]
[INFO] --- maven-jar-plugin:2.4:jar (default-jar) @ elasticsearch-analysis-ik ---
[INFO]
[INFO] >>> maven-source-plugin:2.1.2:jar (attach-sources) > generate-sources @ elasticsearch-analysis-ik >>>
[INFO]
[INFO] --- maven-enforcer-plugin:1.0:enforce (enforce-maven) @ elasticsearch-analysis-ik ---
[INFO]
[INFO] <<< maven-source-plugin:2.1.2:jar (attach-sources) < generate-sources @ elasticsearch-analysis-ik <<<
[INFO]
[INFO] --- maven-source-plugin:2.1.2:jar (attach-sources) @ elasticsearch-analysis-ik ---
[INFO] Building jar: /Downloads/elasticsearch-analysis-ik-1.10.0/target/elasticsearch-analysis-ik-1.10.0-sources.jar
[INFO]
[INFO] --- maven-assembly-plugin:2.2-beta-5:single (default) @ elasticsearch-analysis-ik ---
[INFO] Reading assembly descriptor: /Downloads/elasticsearch-analysis-ik-1.10.0/src/main/assemblies/plugin.xml
[INFO] Building zip: /Downloads/elasticsearch-analysis-ik-1.10.0/target/releases/elasticsearch-analysis-ik-1.10.0.zip
[INFO] ------------------------------------------------------------------------
[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 9.865 s
[INFO] Finished at: 2016-10-09T18:59:29+08:00
[INFO] Final Memory: 23M/469M
[INFO] ------------------------------------------------------------------------

3.安装插件

将zip包解压到ES_HOME/plugins/ik目录下(ik目录需要自己创建)

重启es服务器即可.

注: 由于新版本ik插件不需要配置elasticsearch.yml文件.重启后,在日志中看到ik-analyzer表示ik分词器安装成功

[2016-10-09 17:47:04,558][INFO ][ik-analyzer              ] try load config from /home/es/es-client/config/analysis-ik/IKAnalyzer.cfg.xml
[2016-10-09 17:47:04,559][INFO ][ik-analyzer              ] try load config from /home/es/es-client/plugins/ik/config/IKAnalyzer.cfg.xml
[2016-10-09 17:47:04,995][INFO ][ik-analyzer              ] [Dict Loading] custom/mydict.dic
[2016-10-09 17:47:04,997][INFO ][ik-analyzer              ] [Dict Loading] custom/single_word_low_freq.dic
[2016-10-09 17:47:05,006][INFO ][ik-analyzer              ] [Dict Loading] custom/ext_stopword.dic

4.分词验证

curl -XPUT http://192.168.22.158:9201/indexhttp://192.168.22.158:9201/index/_analyze?analyzer=ik&pretty=true&text="我是中国人"
#返回结果
{"tokens": [{"token": "我","start_offset": 1,"end_offset": 2,"type": "CN_CHAR","position": 0},{"token": "中国人","start_offset": 3,"end_offset": 6,"type": "CN_WORD","position": 1},{"token": "中国","start_offset": 3,"end_offset": 5,"type": "CN_WORD","position": 2},{"token": "国人","start_offset": 4,"end_offset": 6,"type": "CN_WORD","position": 3}]
}curl -XPOST http://192.168.22.158:9201/index/fulltext/_mapping -d'
{"fulltext": {"_all": {"analyzer": "ik_max_word","search_analyzer": "ik_max_word","term_vector": "no","store": "false"},"properties": {"content": {"type": "string","store": "no","term_vector": "with_positions_offsets","analyzer": "ik_max_word","search_analyzer": "ik_max_word","include_in_all": "true","boost": 8}}}
}'curl -XPOST http://192.168.22.158:9201/index/fulltext/1 -d'
{"content":"美国留给伊拉克的是个烂摊子吗"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/2 -d'
{"content":"公安部:各地校车将享最高路权"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/3 -d'
{"content":"中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/4 -d'
{"content":"中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"}
'curl -XPOST http://192.168.22.158:9201/index/fulltext/_search  -d'
{"query" : { "term" : { "content" : "中国" }},"highlight" : {"pre_tags" : ["<tag1>", "<tag2>"],"post_tags" : ["</tag1>", "</tag2>"],"fields" : {"content" : {}}}
}
'
#返回结果
{"took": 172,"timed_out": false,"_shards": {"total": 5,"successful": 5,"failed": 0},"hits": {"total": 2,"max_score": 1.5,"hits": [{"_index": "index","_type": "fulltext","_id": "4","_score": 1.5,"_source": {"content": "中国驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"},"highlight": {"content": ["<tag1>中国</tag1>驻洛杉矶领事馆遭亚裔男子枪击 嫌犯已自首"]}},{"_index": "index","_type": "fulltext","_id": "3","_score": 0.53699243,"_source": {"content": "中韩渔警冲突调查:韩警平均每天扣1艘中国渔船"},"highlight": {"content": ["中韩渔警冲突调查:韩警平均每天扣1艘<tag1>中国</tag1>渔船"]}}]}
}

转载于:https://my.oschina.net/cnarthurs/blog/755958

elasticsearch-analysis-ik-1.10.0中文分词插件安装相关推荐

  1. elasticsearch5安装和elasticsearch-analysis-ik中文分词插件安装

    ElasticSearch简介 Elastic有一条完整的产品线及解决方案:Elasticsearch.Kibana.Logstash等,前面说的三个就是大家常说的ELK技术栈. Elasticsea ...

  2. elasticsearch-analysis-ik中文分词插件安装及配置Ik自定义词典+拼音分词

    在Elasticsearch中默认的分词器对中文的支持不好,会分隔成一个一个的汉字.而IK分词器对中文的支持比较好,主要有两种模式"ik_smart"和"ik_max_w ...

  3. Elasticsearch学习笔记(三)安装hanlp中文分词插件及同义词配置

    目录 hanlp分词插件 插件安装 在线安装 离线安装 安装数据包 同义词配置 hanlp分词插件 HanLP是一款免费开源(Apache License 2.0协议)中文语义分词工具,它提供中文分词 ...

  4. 基于 Ansj 的 elasticsearch 2.3.1 中文分词插件

    前言 这是一个elasticsearch的中文分词插件,基于Ansj中文分词.发起者Onni大神. 2.3.1插件安装 进入Elasticsearch目录运行如下命令 进入es目录执行如下命令 ./b ...

  5. elasticsearch6.2.2安装中文分词插件IK analyzer

    elasticsearch6.2.2安装中文分词插件IK analyzer 哎,装了一下午的ik终于装上了,发现自己真的是非常笨了,并且es重启过程中遇到了很多的问题,下面我将手把手教大家如何安装ik ...

  6. Elasticsearch07:ES中文分词插件(es-ik)安装部署

    一.ES中文分词插件(es-ik) 在中文数据检索场景中,为了提供更好的检索效果,需要在ES中集成中文分词器,因为ES默认是按照英文的分词规则进行分词的,基本上可以认为是单字分词,对中文分词效果不理想 ...

  7. 基于 HanLP 的 ES 中文分词插件

    一.分词插件 1.分词器概念 在 ES 中,分词器的作用是从文本中提取出若干词元(token)来支持索引的存储和搜索,分词器(Analyzer)由一个分解器(Tokenizer).零个或多个词元过滤器 ...

  8. es ik分词插件安装

    es ik分词插件安装 1.ik下载(下载es对应版本的ik分词包) https://github.com/medcl/elasticsearch-analysis-ik/releases 2.解压下 ...

  9. python 3.10.0源码编译安装

    python 3.10.0源码编译安装 文章目录 python 3.10.0源码编译安装 1. 安装编译依赖工具 2. 下载python 3.10.0 3. 编译安装 Python 4. 体验 1. ...

最新文章

  1. 如何在高精度下求解亿级变量背包问题?
  2. Noip2012同余方程
  3. db first和code first
  4. 2019年技术盘点云数据库篇(一):UCloud专家谈云数据库:千锤百炼 云之重器
  5. Mac Pro m1 安装 brew/eclipse/visual stadio code/nodejs/git
  6. org.apache.subversion.javahl.ClientException: Working copy is not up-to-date
  7. 关于文件的INode与Java中的文件操作接口
  8. 华为高管涉嫌受贿已被带走调查
  9. STP RSTP MSTP PVST+学习 (1)
  10. java ide 的优劣_Java程序员的困惑 Java IDE到底怎么选
  11. 【转】OAuth的改变
  12. NXP智能车竞赛笔记(室外电磁组)
  13. 电脑计算机 回收站隐藏文件,电脑中怎样隐藏回收站?电脑中隐藏回收站方法【图文】...
  14. sklearn.metrics.multilabel_confusion_matrix
  15. 【花雕学AI】超级提问模型大全!150个ChatGPT神奇示例,让你的聊天更有趣!
  16. python交易是什么意思_py交易是什么意思?
  17. 前端代码 (html css JavaScript DOM JSON)
  18. 产品vs程序员:你知道www是怎么来的吗?
  19. Unity 3d 最新下载与安装
  20. 网卡介绍——MAC与PHY的关系分析

热门文章

  1. discuz php 扩展环境 不支持,配置php扩展memcache
  2. gentoo php,gentoo下的use原始配置让我安装php折腾好久。
  3. java 字符串每隔两位插入一个字符
  4. CSS 的导入方式 (link or import ?)
  5. linux设备文件列表,linux 设备文件
  6. 利用划分树求解整数区间内第K大的值
  7. ESP8266的AP模式与STA模式简单测试
  8. 动态html树形菜单模板,JS+CSS简易树状菜单Tree
  9. 不使用自动注解方式来生成mapper,采用原生方式来生成mapper
  10. IDEA中导入一个新项目,出现了Cannot resolve symbol 'String'