原文:https://prometheus.io/docs/prometheus/latest/storage/

文章目录

  • 本地存储
  • 磁盘上的布局
  • 压实
  • 运营方面
  • 远程存储集成
  • 总览
  • 现有集成

Prometheus包括本地磁盘时间序列数据库,但也可以选择与远程存储系统集成。

本地存储

Prometheus的本地时间序列数据库以自定义格式在磁盘上存储时间序列数据。

磁盘上的布局

摄入的样品分为两个小时。每个两个小时的时间段包含一个目录,该目录包含一个或多个块文件,该文件包含该时间窗口的所有时间序列样本,以及元数据文件和索引文件(该索引文件将度量标准名称和标签索引到块文件中的时间序列) )。通过API删除系列时,删除记录存储在单独的逻辑删除文件中(而不是立即从块文件中删除数据)。

当前传入样本的块保留在内存中,尚未完全保留。它通过预写日志(WAL)防止崩溃,当Prometheus服务器在崩溃后重新启动时可以重放该日志。预写日志文件wal以128MB的段存储在目录中。这些文件包含尚未压缩的原始数据,因此它们比常规的块文件大得多。
Prometheus将至少保留3个预写日志文件,但是高流量服务器可能会看到三个以上的WAL文件,因为它需要保留至少两个小时的原始数据。

Prometheus服务器的数据目录的目录结构如下所示:

./data
├── 01BKGV7JBM69T2G1BGBGM6KB12
│   └── meta.json
├── 01BKGTZQ1SYQJTR4PB43C8PD98
│   ├── chunks
│   │   └── 000001
│   ├── tombstones
│   ├── index
│   └── meta.json
├── 01BKGTZQ1HHWHV8FBJXW1Y3W0K
│   └── meta.json
├── 01BKGV7JC0RY8A6MACW02A2PJD
│   ├── chunks
│   │   └── 000001
│   ├── tombstones
│   ├── index
│   └── meta.json
├── chunks_head
│   └── 000001
└── wal├── 000000002└── checkpoint.00000001└── 00000000

请注意,本地存储的局限性在于它不是集群或复制的。因此,面对磁盘或节点中断,它不是任意可伸缩的或持久的,应该像对待任何其他类型的单节点数据库一样对待它。建议使用RAID来提高磁盘可用性,使用快照进行备份,容量规划等,以提高耐用性。通过适当的存储耐久性和计划,可以在本地存储中存储多年的数据。

或者,可以通过远程读/写API使用外部存储。这些系统在耐用性,性能和效率上差异很大,因此需要仔细评估。

有关文件格式的更多详细信息,请参见TSDB format。

压实

最初的两个小时的块最终会在后台压缩为更长的块。

压缩将创建较大的块,最多保留时间的10%,即31天,以较小者为准。

运营方面

Prometheus具有几个允许配置本地存储的标志。最重要的是:

--storage.tsdb.path:这确定Prometheus在何处写入其数据库。默认为data/。
--storage.tsdb.retention.time:这确定何时删除旧数据。默认为15d。storage.tsdb.retention如果此标志设置为默认值以外的其他值,则覆盖。
--storage.tsdb.retention.size:[EXPERIMENTAL]这确定存储块可以使用的最大字节数(请注意,这不包括WAL大小,这可能是很大的)。最旧的数据将首先被删除。默认为0或禁用。该标志是实验性的,可以在将来的版本中进行更改。支持的单位:B,KB,MB,GB,TB,PB,EB。例如:“ 512MB”
--storage.tsdb.retention:已弃用该标志,而推荐使用storage.tsdb.retention.time。
--storage.tsdb.wal-compression:此标志启用预写日志(WAL)的压缩。根据您的数据,您可以预期WAL大小将减少一半,而额外的CPU负载却很少。此标志在2.11.0中引入,默认情况下在2.20.0中启用。请注意,一旦启用,将Prometheus降级到2.11.0以下的版本将需要删除WAL。

平均而言,普罗米修斯每个样本仅使用大约1-2个字节。因此,要计划Prometheus服务器的容量,可以使用以下粗略公式:

needed_disk_space = retention_time_seconds * ingested_samples_per_second * bytes_per_sample

要调整每秒摄取的样本的速率,可以减少抓取的时间序列数(每个目标更少的目标或更少的序列),或者可以增加抓取间隔。但是,由于压缩序列中的样本,减少序列数可能更有效。

如果您的本地存储由于某种原因而损坏,最好的选择是关闭Prometheus并删除整个存储目录。您可以尝试删除单个块目录或WAL目录来解决该问题,这意味着每个块目录损失的时间窗口约为两个小时。同样,Prometheus的本地存储并不意味着持久的长期存储。

注意: Prometheus的本地存储不支持不兼容POSIX的文件系统,因为可能会发生不可恢复的损坏。不支持NFS文件系统(包括AWS的EFS)。NFS可能符合POSIX,但大多数实现均不符合。强烈建议使用本地文件系统以提高可靠性。
如果同时指定了时间和大小保留策略,则在那一刻将使用第一个触发的策略。

过期的块清除将在后台计划中进行。删除过期的块可能最多需要两个小时。过期的块在清除之前必须完全过期。

远程存储集成

Prometheus的本地存储在可伸缩性和持久性方面受到单个节点的限制。Prometheus并没有尝试解决Prometheus本身中的群集存储,而是提供了一组允许与远程存储系统集成的接口。

总览

Prometheus通过两种方式与远程存储系统集成:

Prometheus可以将提取的样本以标准格式写入远程URL。
Prometheus可以以标准化格式从远程URL读取(返回)样本数据。
远程读写架构

读取和写入协议都使用基于HTTP的快速压缩协议缓冲区编码。该协议尚未被认为是稳定的API,当可以安全地假定Prometheus和远程存储之间的所有跃点都支持HTTP / 2时,该协议将来可能会更改为在HTTP / 2上使用gRPC。

有关在Prometheus中配置远程存储集成的详细信息,请参阅Prometheus配置文档的“ 远程写入”和“ 远程读取”部分。

有关请求和响应消息的详细信息,请参阅远程存储协议缓冲区定义。

请注意,在读取路径上,Prometheus仅从远端获取一组标签选择器和时间范围的原始系列数据。PromQL对原始数据的所有评估仍在Prometheus本身中进行。这意味着远程读取查询具有一定的可伸缩性限制,因为所有必需的数据都需要先加载到查询的Prometheus服务器中,然后再在其中进行处理。但是,暂时认为支持PromQL的完全分布式评估是不可行的。

现有集成

要了解有关与远程存储系统的现有集成的更多信息,请参阅集成文档。

【Prometheus】存储相关推荐

  1. 总结:Prometheus存储

    一.介绍 prometheus 提供了本地存储(TSDB)时序型数据库的存储方式,在2.0版本之后,压缩数据的能力得到了大大的提升(每个采样数据仅仅占用3.5byte左右空间),单节点情况下可以满足大 ...

  2. prometheus存储模型

    Prometheus是目前被广泛使用的容器云监控系统,其底层实现了一个时序数据库(tsdb),它拥有强大的数据压缩和检索能力,可轻松应对每秒百万级的数据采集.本文基于最新的prometheus 2.1 ...

  3. Prometheus实战--Uber背书的存储解决方案M3

    前言 前面我们一直在做prometheus的远程存储的工作,一直缺乏一种大厂背书的解决方案.具体可能有下面的几点: 大厂背书且开源 可承接大规模海量metrics 非weave cortex这种对pr ...

  4. Prometheus 如何做到“活学活用”,大牛总结的避坑指南

    点击上方蓝色"方志朋",选择"设为星标" 回复"666"获取独家整理的学习资料! 作者丨徐亚松 来源丨http://www.xuyasong ...

  5. 监控神器Prometheus用不对,也就是把新手村的剑

    点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 作者丨徐亚松 来源丨http://www.xuyasong.com ...

  6. 高可用 Prometheus 架构实践中的踩坑集锦

    监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎. 本文主要分享在 Prometheus 实践中遇到的 ...

  7. 高可用 Prometheus 的常见问题

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 监控系统的历史悠久,是一个很成熟的方向,而 Promet ...

  8. 开源监控系统 Prometheus 入门

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 来源 | 公众号「yangyidba」 一 简介 Pro ...

  9. 应用监控指标采集器 Prometheus 核心介绍

    点击蓝色"程序猿DD"关注我 回复"资源"获取独家整理的学习资料! 作者 | 码农小胖哥 来源 | 公众号「码农小胖哥」 Prometheus是一个最初在Sou ...

  10. prometheus简介

    一.prometheus简介 1.1 什么是prometheus? Prometheus是一个开源监控系统,它前身是SoundCloud的警告工具包.从2012年开始,许多公司和组织开始使用Prome ...

最新文章

  1. 抢滩“体验经济”,“真快乐”布局娱乐化零售的野心
  2. 关于 lockfree 算法
  3. 2018091-2 博客作业
  4. 在Serverless Kubernetes集群中轻松运行Argo Workflow
  5. WordPress好看的QQ微信等登录插件二开美化版
  6. 大二第二学期周学习进度总结(十三)
  7. Orcad 使用MySQL数据库建立元件数据库完整步骤(30多张截图)
  8. xshell绿色版安装,无限制
  9. python计算学分绩点的程序_Python爬虫实战七之计算大学本学期绩点
  10. BugKu CTF(杂项篇MISC)--Pokergame
  11. 【Gym - 101350M Make Cents?】 STL - map
  12. java 天气api_基于JAVA的免费天气预报接口查询
  13. R语言逻辑回归预测分析付费用户
  14. 远程桌面对方计算机无法远程,win7开启QQ远程协助无法连接对方电脑如何解决
  15. java URL java.net.URL类的使用 详细介绍 URL转义 解决URL中文字符
  16. Java反射invoke报错wrong number of arguments
  17. Oracle Database 12c Security - 13. An Applied Approach to Multitenancy and Cloud Security
  18. 根据传入日期 往前或者往后 顺延月份
  19. Zxing生成二维码(可带图标)
  20. 各省地图都像些什么?

热门文章

  1. 【BZOJ4820】[SDOI2017]硬币游戏(高斯消元)
  2. 10.原码 反码 补码
  3. 一些个人认为好看的电影
  4. (转)Spring定时任务的几种实现
  5. document.write()详解
  6. 初探WCF 如何在配置文件中指定Address?
  7. 使用FLVPlayback组件播放fms(fcs)的流式FLV文件
  8. C++虚函数表,虚表指针,内存分布
  9. 堆排序-Python
  10. 深度学习 自组织映射网络 ——python实现SOM(用于聚类)