ElasticSearch 介绍及使用方法

女主宣言

今天小编为大家分享一篇关于ElasticSearch 介绍及使用方法的文章。希望能对大家有所帮助。

PS：丰富的一线技术、多元化的表现形式，尽在“360云计算”，点关注哦！

ElasticSearch是一款基于 Apache Lucene的开源搜索引擎产品，之后成了独立的商业公司，继而发布了ELK等一系列产品，特点是开源、分布式、准实时，标准的RESTFul接口等。

ElasticSearch可以单机部署，也可以集群部署。ES的分布式属性，可以轻松的处理超过单机负载能力的数据量，集群也是无间断服务的一种解决方案。

整体架构

基本概念

Node：单个的ElasticSearch服务实例。
Master：负责监督、控制其它节点的工作。
Data：持有数据，并提供数据的索引功能，主要用途是索引和查询数据。
协调节点：每一个节点都是一个潜在的协调节点，协调节点会处理请求，将各分片里的数据汇集起来一并返回给客户端，ES的节点需要有足够的CPU和内存去处理协调节点的gather 阶段。
索引：EasticSearch将数据存储在一个或多个索引中，用SQL领域的术语来类比，索引就像数据库，可以向索引中写入文档或者从索引中读取文档，内部使用Lucene。
分片：ES将数据分散到多个物理的Lucene索引，这些Lucene索引就称为分片。分散分片的过程，称之为sharding。
主分片：主分片的数量在索引创建时就被配置好了，之后无法改变，除非创建一个新索引并重新索引全部数据。
副本分片：副本主要有以下作用，1 分担访问压力；2 给ES集群提供安全机制；3会增加写入的时长。

类型（type）

5.x 版本中index和 type为一对多关系，不同type定义对应的mapping。

6.x 版本中index和 type为一对一关系。

7.x 版本中移除了type，一个索引只定义一个数据类型。

将来会在8.x中彻底移除。

文档（doc）

doc是ES中的主要实体：

对于所有使用ES的案例来说，最终都会被归结到文档的搜索之上。
文档由字段构成，每个字段包含字段名以及一个或多个字段值。
从用户端的角度看，文档是一个Json对象。

集群健康状态

Green：表示所有主分片和副本分片都可用。

Yellow：表示所有主分片可用，但不是所有副本分片都可用。

Red：表示部分主分片处于不可用状态

ES操作

索引操作

索引设计主要包括 mapping和setting两部分

Settings用于设置分片和副本数

查看setting：

Mapping（映射）

mappings用于设置字段和类型。

动态mapping：根据索引的数据动态的生成 mapping

不建议使用动态mapping，主要原因：

会引发性能下降。
影响磁盘空间的使用。
导致与预期查询不符的结果。

查看mapping语法：

模板

Logstash 使用事件中的时间戳来生成索引名，@timestamp 为 2019-10-01 00:00:01 事件将被发送至索引 logstash-2019.10.01 中，通常我们想要控制新建索引的设置（settings）和映射（mappings）

上面的API做了如下操作：

创建一个名为 my_logs 的模板；
将这个模板应用于所有以 logstash- 为起始的索引；
设置模版的顺序级别；
限制主分片数量为 10；
为所有类型禁用 _all 域。

常用API：

写入操作：

实际过程中，提交操作会进行一次完整的 HTTP POST 请求和 ES indexing，单条数据是一种极大的性能浪费，ES 设计了批量提交方式， bulk接口：

Bulk像一个集合，把一系列操作批量提交，这在很大程度上提高了ES的写入效率。

bulk的使用和大小设置

整个bulk请求需要被加载到接收请求节点的内存里，所以请求越大，给其它请求可用的内存就越小。因此，有一个最佳的bulk请求大小，超过这个大小，性能不再提升而且可能降低。
最佳大小，并不是一个固定的数字, 取决于硬件、文档的大小和复杂度以及索引和搜索的负载情况。
开始的数量可以在1000~5000个文档之间，如果文档非常大，可以使用较小的批次。通常着眼于你请求批次的物理大小是非常有用的，一千个1kB的文档和一千个1MB的文档大不相同。
一个好的批次最好保持在5-15MB大小间。

数据检索过程

数据检索主要分为两个阶段，query阶段和fetch阶段：

query阶段：

客户端发送一个search请求到Node 3上，然后Node 3会创建一个优先级队列（大小=from+size）。
Node 3转发这个search请求到索引里面每一个主shard或者副本shard上，每个shard会在本地查询然后添加结果到本地的排序好的优先级队列里面。
每个shard返回docId和所有参与排序字段的值到优先级队列里面，然后再返回给coordinating节点也就是Node 3，然后Node 3负责将所有shard里面的数据合并到一个全局的排序列表。

Fetch阶段：

coordinating节点标识了那些document需要被拉取出来，并发送一个批量的mutil get请求到相关的shard上。
每个shard加载相关document，如果需要它们将会被返回到coordinating 节点上。
一旦所有的document被拉取回来，coordinating节点将会返回结果集到客户端上。

scroll 读取（游标查询）

优点：

Scroll 有效地执行大批量的文档查询，而又不用付出深度分页的代价，类似于传统数据库中的cursor。

scroll使用方法：

游标查询每次返回一个新字段 _scroll_id。每次做下一次游标查询时，需要把前一次查询返回的字段 _scroll_id 传递进去

在一些语言如 Python、perl的ElasticSearch包中，提供了这个功能易用的封装。

别名 Index aliases

别名很简单，但是能解决重建索引必须更新应用中索引名的问题，实现索引切换的无缝过渡。

别名像一个快捷方式或软连接，可以指向一个或多个索引，需要注意，别名不能与索引同名。

相关API：

重命名别名：

针对DSL查询，浅显的优化建议：

正确使用 match、match_phrase、term，区分 must 、must_not 、should等Bool查询
尽量多使用filter
如果不必须涉及相关性和评分的话，尽量避免相应的操作
合适的数据类型（如Mapping中合理使用keyword类型）

总结

本篇文章主要介绍了ElasticSearch的基本概念和实践中常用的一些方法，并没有涉及深层原理和优化的知识，在DSL、读写优化、7.x新版本等方面，还有不少知识点可以深入研究。如果有什么疑问或建议，可以在下方留言。

360云计算

由360云平台团队打造的技术分享公众号，内容涉及数据库、大数据、微服务、容器、AIOps、IoT等众多技术领域，通过夯实的技术积累和丰富的一线实战经验，为你带来最有料的技术分享

ElasticSearch 介绍及使用方法相关推荐

【javaWeb微服务架构项目——乐优商城day07】——Elasticsearch介绍和安装及使用（安装kibana，安装ik分词器，Spring Data Elasticsearch，高级查询）
文章目录 0.学习目标 1.Elasticsearch介绍和安装 1.1.简介 1.1.1.Elastic 1.1.2.Elasticsearch 1.1.3.版本 1.2.安装和配置 1.2.1.新 ...
fanuc机器人四边形编程_FANUC机器人示教编程：原始路径恢复功能介绍与使用方法...
概要原始路径恢复功能,是在机器人运行过程中,程序动作由于某种原因被暂停的情况下,当机器人再次启动运行时首先恢复到暂停时位置的一种功能.比如,在暂停后通过手动运行方式使得机器人发生了移动,当再次启动机 ...
Elasticsearch介绍Kibana分词器增删改操作
Elasticsearch Elasticsearch介绍和安装简介 Elastic Elastic官网:https://www.elastic.co/cn/ Elastic有一条完整的产品线及解决 ...
【Android UI设计与开发】第07期：底部菜单栏（二）Fragment的详细介绍和使用方法
转载请注明出处:http://blog.csdn.net/yangyu20121224/article/details/8995025 由于TabActivity在Android4.0以后已经被完全弃 ...
如何通过牛顿方法解决Logistic回归问题 By 机器之心2017年8月09日 16:30 本文介绍了牛顿方法（Newton's Method），以及如何用它来解决 logistic 回归。log
如何通过牛顿方法解决Logistic回归问题 By 机器之心2017年8月09日 16:30 本文介绍了牛顿方法(Newton's Method),以及如何用它来解决 logistic 回归.logi ...
Python语言学习之文件格式后缀那些事：python和常见各种文件格式后缀介绍、使用方法之详细攻略
Python语言学习之文件格式后缀那些事:python和常见各种文件格式后缀介绍.使用方法之详细攻略目录常见各种文件格式后缀介绍 .pyc文件介绍 .py文件介绍 .pxd 文件 .pyd 文件 ...
CV之face_recognition：Py之face_recognition库安装、介绍、使用方法详细攻略
CV之face_recognition:Py之face_recognition库安装.介绍.使用方法详细攻略目录 face_recognition简介 face_recognition安装 face ...
Elasticsearch介绍
目录: Elasticsearch介绍 es功能 es特点 elasticsearch基本概念概念说明索引(Index)[数据库] 类型(Type)[表] 文档(Document) 节点(Node ...
JSTL 及　tablibs　的简单介绍和配置方法
JSTL 及 tablibs 的简单介绍和配置方法 jstl 简介 jstl 的全称就是jsp standard tag libraries, 就是jsp里的标准标签库. 引用jstl技术能在jsp种 ...

ElasticSearch 介绍及使用方法

ElasticSearch 介绍及使用方法相关推荐

最新文章

热门文章