Elasticsearch 7.10 之 Data tiers
数据层是具有相同数据角色的节点的集合,这些节点通常共享相同的硬件配置文件:
- 内容层节点:处理诸如产品目录之类的内容的索引和查询负载。
- 热层节点:处理诸如日志或指标之类的时间序列数据的索引负载,并保存您最近,最常访问的数据。
- 暖层节点:保存的时间序列数据访问频率较低,并且很少需要更新。
- 冷层节点:保存时间序列数据,这些数据偶尔会被访问,并且通常不会更新。
当您将文档直接索引到特定索引时,它们会无限期地保留在内容层节点上。
当您将文档索引到数据流时,它们最初位于热层节点上。您可以配置索引生命周期管理(ILM)策略,以根据性能、弹性和数据保留要求自动通过热、暖和冷层转换时间序列数据。
节点的数据角色是在 elasticsearch.yml 中配置的。例如,可以将群集中性能最高的节点分配给热层和内容层:
node.roles: ["data_hot", "data_content"]
Content tier
存储在内容层中的数据通常是项目的集合,例如产品目录或文章档案。与时间序列数据不同,内容的价值在一段时间内保持相对恒定,因此,随着时间的流逝,将其转移到具有不同性能特征的层中是没有意义的。内容数据通常具有很长的数据保留要求,并且您希望能够快速检索项目,无论它们有多旧。
内容层节点通常针对查询性能进行了优化,它们将处理能力置于 IO 吞吐量之上,因此它们可以处理复杂的搜索和聚合并快速返回结果。尽管它们还负责索引编制,但通常不会以与时间序列数据(例如日志和指标)一样高的速率摄取内容数据。从弹性角度来看,该层中的索引应配置为使用一个或多个副本。
除非新索引是数据流的一部分,否则它们会自动分配给内容层。
Hot tier
热层是时间序列数据的 Elasticsearch 入口点,并保存您最近,最频繁搜索的时间序列数据。热层中的节点在读取和写入时都需要快速,这需要更多的硬件资源和更快的存储(SSD)。为了具有弹性,应将热层中的索引配置为使用一个或多个副本。
属于数据流的新索引会自动分配给热层。
Warm tier
一旦查询时间序列数据的频率低于热层中最近索引的数据,就可以将其移至此层。暖层通常保存最近几周的数据。仍然允许进行更新,但可能很少。通常,暖层中的节点不需要像热层中的节点一样快。为了实现弹性,应将暖层中的索引配置为使用一个或多个副本。
Cold tier
一旦不再更新数据,它就可以从暖层移到冷层,并在余下的时间内保留下来。冷层仍然是响应查询层,但是冷层中的数据通常不会更新。随着数据过渡到冷层,可以对其进行压缩和缩小。为了具有弹性,冷层中的索引可以依赖可搜索的快照,从而无需副本。
Data tier index allocation
创建索引时,默认情况下,Elasticsearch 将 index.routing.allocation.include._tier_preference 设置为 data_content ,以将索引分片自动分配给内容层。
当 Elasticsearch 创建索引作为数据流的一部分时,默认情况下, Elasticsearch 将 index.routing.allocation.include._tier_preference 设置为 data_hot ,以自动将索引分片分配给热层。
您可以通过在创建索引请求或与新索引匹配的索引模板中指定分片分配过滤设置来覆盖基于自动层的自动分配。
您还可以显式设置 index.routing.allocation.include._tier_preference 以选择退出默认的基于层的分配。如果将层首选项设置为 null ,则 Elasticsearch 在分配期间将忽略数据层角色。
Automatic data tier migration
ILM 使用迁移操作自动在可用数据层之间过渡托管索引。默认情况下,此操作会在每个阶段自动注入。您可以显式指定迁移操作以覆盖默认行为,也可以使用分配操作手动指定分配规则。
详情见官网:https://www.elastic.co/guide/en/elasticsearch/reference/7.10/data-tiers.html
Elasticsearch 7.10 之 Data tiers相关推荐
- Linux配置安装 Elasticsearch 7.10.2 详细教程
文章目录 引言 一.ES 安装 二.head 插件安装 三.Kibana 安装 四.IK分词器 安装 引言 由于后续都基于 Elasticsearch 7.10.2 版本进行操作,所以此处相关安装版本 ...
- 生产集群设置Elasticsearch 7.10
文章目录 生产集群设置Elasticsearch 7.10 索引管理设置 索引恢复设置 节点查询缓存设置 查询缓存索引设置 搜索设置 缓存失效 启用和禁用缓存 启用和禁用每个请求的缓存 缓存设置 监视 ...
- 系统管理Lesson 10. Managing Data Concurrency
系统管理Lesson 10. Managing Data Concurrency 1. 请对 Oracle 数据库锁机制做一个完整的说明. 10-4 2. 事务在获取排他的行锁的同时,为什么要同时获取 ...
- ES elasticsearch 7.10安装部署
下载安装 最新版本地址 #进入安装目录 cd /opt#下载安装包,300多M wget https://artifacts.elastic.co/downloads/elasticsearch/el ...
- Elastic:Data tiers 介绍及索引生命周期管理 - 7.10 之后版本
Data tier 也就是数据层.是一个在 7.10 版本的一个新概念.数据层是具有相同数据角色的节点的集合,这些节点通常共享相同的硬件配置文件: Content tier (内容层)节点处理诸如产品 ...
- elasticsearch线上调优[ Data too large]
项目场景: 最近es的线上经常出现一个内存的异常的问题,我解决了各种的途径都无效.最后再方案一种解决最终办法,方案二能解决部分问题. 问题描述:[[parent] Data too large, da ...
- elasticsearch之hello(spring data整合)
1.书写pom.xml文件 <dependencies><dependency><groupId>org.springframework.data</grou ...
- 【Elasticsearch】10分钟查询一个petabyte的云存储容量
1.概述 翻译:Querying a petabyte of cloud storage in 10 minutes Elastic的新冻结数据层将计算与存储解耦,并利用低成本的对象存储(如谷歌Clo ...
- Elasticsearch 7.10 之 Indexing pressure
将文档索引到 Elasticsearch 中会以内存和 CPU 负载的形式引入系统负载.每个索引操作都包括协调,主要和复制阶段.这些阶段可以跨集群中的多个节点执行. 索引压力可以通过外部操作(例如索引 ...
最新文章
- 使用最小堆优化Dijkstra算法
- You don't have permission to access
- 心形尺寸比例图解_0元图解建筑史-05 | 中国木构建筑的特征与详部演变(2)——斗栱、厅堂殿堂...
- 项目管理中的沟通管理(转)
- 各种流行编程语言的优缺点
- loadrunner录制事件为0_利用LoadRunner编写Socket性能测试脚本简述
- Unreal Engine 4切换默认Camera实现
- 特征工程之自动特征生成(自动特征衍生)工具Featuretools介绍
- 49个Python学习资源:从初学者到高级玩家都有了
- c语言图书管理系统课设报告总结,c语言图书管理系统课设报告.docx
- 计算机作曲常用软件,计算机作曲——软件与音源的选择
- 计算机科学与技术代码0812,一级学科代码及名称0812计算机科学与技术(2007年)本.doc...
- VoLTE 信令分析手册
- 从零开始学写脚本(大麦网抢票 上)【第二天】
- python中if缩进规则_Python if条件判断
- 基于RNN实现搜狐新闻数据文本分类
- spring-cloud(十一)GateWay强大的路由谓词(断言)功能
- 数学公式中的希腊字母读音
- 使用zii.widgets.CDetailView显示内容
- 怎么做读书分享PPT课件?
热门文章
- python打开word并插入图片_Python操作word文档插入图片和表格的实例演示
- Photo Album: 2008年5月-三亚爱琴海岸康年度假村-day2
- 内网穿透软件对比——cpolar : 网云穿(下)
- 不同CPU的MATLAB性能表现的简单对比方法
- IT人转型的终极目标
- 德勤技术咨询 oracle,【内推】德勤急招Oracle/SAP功能、开发顾问,Siebel顾问,BI顾问,IT审计顾问...
- 怎么学大数据?该从哪学起?
- 连接服务器绑定信息无效,警告:ldap_bind():无法绑定到服务器:凭据无效PHP和LDAP...
- 盘点:文本内容安全领域 深度学习的六个主流应用方法
- 阿里巴巴有哪些好玩的分布式开源框架?