ElasticSearch创建索引映射文档+IK分词器
目录
- 1.ElasticSearch介绍
- 2.配置文件
- 3.安装head插件和Kibana
- 4.创建索引:
- 4.1第一种:界面上直接新建
- 4.2第二种:postman种新建
- 5.创建映射
- 6.创建文档
- 6.1 不指定ID,随机生成
- 6.2 指定ID,推荐
- 7.搜索文档
- 8.IK分词器
- 8.1 测试分词器
- 8.2 安装IK分词器
- 8.3 两种分词模式
- 8.3.1 ik_max_word 会将文本做最细粒度的拆分
- 8.3.2 ik_smart:会做最粗粒度的拆分
- 8.4 自定义词库
- 9 修改映射
- 10.搜索
1.ElasticSearch介绍
总结:
1、elasticsearch是一个基于Lucene的高扩展的分布式搜索服务器,支持开箱即用。
2、elasticsearch隐藏了Lucene的复杂性,对外提供Restful 接口来操作索引、搜索。
突出优点:1.扩展性好,可部署上百台服务器集群,处理PB级数据。
2.近实时的去索引数据、搜索数据。
2.配置文件
elasticsearch.yml : 用于配置Elasticsearch运行参数
jvm.options : 用于配置Elasticsearch JVM设置
log4j2.properties: 用于配置Elasticsearch日志
elasticsearch.yml :
cluster.name: wang
node.name: wang_node_1
network.host: 0.0.0.0
http.port: 9200
transport.tcp.port: 9300
node.master: true
node.data: true
#discovery.zen.ping.unicast.hosts: ["0.0.0.0:9300", "0.0.0.0:9301", "0.0.0.0:9302"]
discovery.zen.minimum_master_nodes: 1
bootstrap.memory_lock: false
node.max_local_storage_nodes: 1path.data: D:\ES\elasticsearch-6.2.1\data
path.logs: D:\ES\elasticsearch-6.2.1\logshttp.cors.enabled: true
http.cors.allow-origin: /.*/
常用的配置项如下:
cluster.name: 配置elasticsearch的集群名称,默认是elasticsearch。建议修改成一个有意义的名称。
node.name:节点名,通常一台物理服务器就是一个节点,es会默认随机指定一个名字,建议指定一个有意义的名称,方便管理一个或多个节点组成一个cluster集群,集群是一个逻辑的概念,节点是物理概念
path.conf: 设置配置文件的存储路径,tar或zip包安装默认在es根目录下的config文件夹,rpm安装默认在/etc/
elasticsearch path.data:设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开。
path.logs:设置日志文件的存储路径,默认是es根目录下的logs文件夹
path.plugins: 设置插件的存放路径,默认是es根目录下的plugins文件夹
bootstrap.memory_lock: true 设置为true可以锁住ES使用的内存,避免内存与swap分区交换数据。
network.host: 设置绑定主机的ip地址,设置为0.0.0.0表示绑定任何ip,允许外网访问,生产环境建议设置为具体的ip。http.port: 9200 设置对外服务的http端口,默认为9200。
transport.tcp.port: 9300 集群结点之间通信端口
node.master: 指定该节点是否有资格被选举成为master结点,默认是true,如果原来的master宕机会重新选举新的master。
node.data: 指定该节点是否存储索引数据,默认为true。
discovery.zen.ping.unicast.hosts: [“host1:port”, “host2:port”, “…”] 设置集群中master节点的初始列表。
discovery.zen.ping.timeout: 3s 设置ES自动发现节点连接超时的时间,默认为3秒,如果网络延迟高可设置大些。
discovery.zen.minimum_master_nodes:主结点数量的最少值 ,此值的公式为:(master_eligible_nodes / 2) + 1,比如:有3个符合要求的主结点,那么这里要设置为2。node.max_local_storage_nodes: 单机允许的最大存储结点数,通常单机启动一个结点建议设置为1,开发环境如果单机启动多个节点可设置大于1.
3.安装head插件和Kibana
4.创建索引:
4.1第一种:界面上直接新建
4.2第二种:postman种新建
put http://localhost:9200/索引库名称
number_of_shards:设置分片的数量,在集群中通常设置多个分片,表示一个索引库将拆分成多片分别存储不同的结点,提高了ES的处理能力和高可用性,入门程序使用单机环境,这里设置为1。
number_of_replicas:设置副本的数量,设置副本是为了提高ES的高可靠性,单机环境设置为0.
5.创建映射
post http://localhost:9200/wang-001/doc/_mapping
6.创建文档
6.1 不指定ID,随机生成
http://localhost:9200/wang-001/doc
或kibana页面
6.2 指定ID,推荐
post http://localhost:9200/wang-001/doc/1
7.搜索文档
get http://localhost:9200/wang-001/doc/1
8.IK分词器
8.1 测试分词器
post http://localhost:9200/_analyze
分词结果:
8.2 安装IK分词器
8.3 两种分词模式
ik分词器有两种分词模式:ik_max_word和ik_smart模式。
ik_max_word:会将文本做最细粒度的拆分
ik_smart:会做最粗粒度的拆分
8.3.1 ik_max_word 会将文本做最细粒度的拆分
{“text”:“拼搏到无能为力”,“analyzer”:“ik_max_word”}
8.3.2 ik_smart:会做最粗粒度的拆分
{“text”:“拼搏到无能为力”,“analyzer”:“ik_smart”}
8.4 自定义词库
添加词库
加入
9 修改映射
不能直接修改,只能添加
添加,存储用最细粒度,搜索用最粗粒度
"analyzer":"ik_max_word",
"search_analyzer":"ik_smart"
10.搜索
新增几条数据
搜索所有
http://localhost:9200/wang-001/doc/_search
根据搜索字段名搜索
http://localhost:9200/wang-001/doc/_search?q=desc:无能
ElasticSearch创建索引映射文档+IK分词器相关推荐
- ElasticSearch查询篇索引映射文档数据准备
elasticsearch查询篇索引映射文档数据准备 我们后面要讲elasticsearch查询,先来准备下索引,映射以及文档: 我们先用Head插件建立索引film,然后建立映射 POST http ...
- es查询索引java_elasticsearch查询篇索引映射文档数据准备
elasticsearch查询篇索引映射文档数据准备 我们后面要讲elasticsearch查询,先来准备下索引,映射以及文档: 我们先用Head插件建立索引film,然后建立映射 { "p ...
- 拾忆Elasticsearch01:Elasticsearch概述及相关ES、IK分词器等下载安装
为了防止老年痴呆记不住学过的Elasticsearch,在这里写点blog回顾一下 写在前面,建议下载以下出现的Elasticsearch版本,我之前下的7.6.1在这里找不到对应的springboo ...
- php elasticsearch 获取索引所有文档_Elasticsearch客户端主要方法的使用规则
安装 1.在 composer.json 文件中引入 elasticsearch-php: { "require": { "elasticsearch/elasticse ...
- elasticsearch学习(六):IK分词器
1.IK分词器简介 IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始IKAnalyzer已经推出 了3个大版本.最初,它是以开源项目L ...
- 【还不会用ElasticSearch ?】 ElasicSearch 客户端索引,映射,文档基础操作命令 kibana 演示
1.索引操作 1.1 创建索引 ## 创建索引 put csdn 返回结果 {"acknowledged" : true,"shards_acknowledged&quo ...
- 【SpringBoot】整合Elasticsearch 操作索引及文档
官网操作文档:Elasticsearch Clients | Elastic 踩坑太多了...这里表明一下Spring Boot2.4以上版本可能会出现问题,所以我降到了2.2.1.RELEASE.对 ...
- elasticsearch创建索引映射
1.我们这里通过google自带的工具postman来创建索引,这里我们创建一个:vclogdb,看到返回"acknowledged": true,表示创建成功: 2.通过elas ...
- Elasticsearch 6.4 ingest-attachment对文件IK分词器全文检索
这里写自定义目录标题 1.简介 2.实现步骤 1.简介 ElasticSearch只能处理文本,不能直接处理文档.要实现 ElasticSearch 的附件导入需要以下两个步骤: 一.对多种主流格式的 ...
- ElasticSearch最新版(8.4.3) IK分词器基于mysql实现热更新词库
1 源码阅读思路 阅读Dictionary类下的initial方法,基于该方法进行改造 2 下载源码 https://github.com/medcl/elasticsearch-analysis-i ...
最新文章
- Bash shell中的位置参数$#,$*,$@,$0,$1,$2...及特殊参数$?,$-等的含义
- 排序算法复习之一趟快速排序算法:为什么说关键字所占的位置是多余的
- 理解 Linux 的硬链接与软链接
- batchsize一定是2的幂_支付接口的幂等性设计
- 一文串起从NLP到CV 预训练技术和范式演进
- java semaphore 等待_Java并发编程系列之Semaphore详解
- 10W+集群规模下,美团点评如何优化改造K8s?
- day15【前台】项目发布
- Python IO模型
- MySQL 批量插入,如何不插入重复数据?
- 解决办法:std没有成员initializer_list
- Android package属性、package name和Application ID三者的联系及区别
- 北大中文核心期刊目录2021年 电工技术
- python 软件包 petri_常用Petri网模拟软件工具简介
- 轻松搞懂均匀分布、高斯分布、瑞利分布、莱斯分布(含MATLAB代码)
- JUC -- 辅助类
- Kotlin中问号 ? 和两个叹号 !! 的含义
- bzoj1861 [Zjoi2006]Book 书架
- CREO:CREO软件之零件【工具(调查/模型意图/实用工具)】、【视图(可见性/方向/模型显示/显示/窗口)】的简介及其使用方法(图文教程)之详细攻略
- 面试:GET 请求能上传图片吗,已解决
热门文章
- 全国哀悼日,英来网停站一天。
- 代理服务器的常用端口有哪些?
- 安卓电子书格式_进阶能力 | 了解常见的电子书格式
- 1069三网合一集团短信通道固定接收号
- 国际短信平台怎么找?
- php源码授权网络验证系统,WEB端管理网络验证授权系统源代码
- 多任务学习之MRI重建(Reconstruction)与超分辨率(Super-Resolution)论文阅读
- 买笔记本电脑主要看什么?
- 135编辑器html怎么复制,微信公众号怎么复制别人的图文排版(图文模板复制方法)...
- html如何绘制树结构图,HTML 5 Canvas 递归画树