1 SLI

Service Level Indicator 服务水平指示器,服务水平,简称SLI。对于业务来说是最重要的指标。比如,对于网站来说,一个常见的SLI是请求得到正常响应的百分比。

只要遵从两个原则就可以:

  • 选择能够标识一个主体是否稳定的指标,如果不是这个主体本身的指标,或者不能标识主体稳定性的,就要排除在外。
  • 优先选择与用户体验强相关或用户可以明显感知的指标。

通常情况下,可以直接使用谷歌的VALET指标方法。

  • V:Volume,容量,服务承诺的最大容量
  • A:Availability,可用性,服务是否正常
  • L:Latency,延迟,服务的响应时间
  • E:Error,错误率,请求错误率是多少
  • T:Ticket,人工介入,是否需要人工介入

2 SLO

Service Level Object 服务水平目标,是围绕SLI构建的目标。通常是一个百分比,并与一个时间范围挂钩。比如,月度、季度、年度等。通常用一连串9来度量。如果脱离了时间的度量,SLO的意义就不大了。

90%(1个9的正常运行时间):这意味着10%的停机时间,也就是说在过去的30天里停机了3天。
99%(2个9的正常运行时间):意味着在过去30天中有1%,或者说7.2小时的停机时间。
99.9%(3个9的正常运行时间):意味着0.1%,或者说43.2分钟的停机时间。
99.95%(3.5个9的正常运行时间):意味着0.05%,或者说21.6分钟的停机时间。
99.99%(4个9的正常运行时间):意味着0.01%,或者说4.32分钟的停机时间。
99.999%(5个9的正常运行时间):意味着0.001%,或者说26秒的停机时间。

Availability = Successful request Total request

那么什么样的指标才是 SLI 指标呢?下面我们就以最常见的 SLI 指标成功率,延迟率来看2个范例:

请求成功的 TCP 数量/总 TCP 请求数,即 TCP 请求成功率。
请求成功的延迟小于 200 ms 的请求数/总请求数,即 TCP 延迟小于 200ms 的的比例。
下面我们就来看他们对应的常见 SLO 的范例:

每月 TCP 请求成功率(SLI)大于 99.99%
每月 99.99% 的 TCP 请求延迟(SLI)小于 200ms
这就是我们其实在实际 SLI,SLO 设定中最常见的 2 个指标及其范例

3 SLA

Service Level Agreement 服务水平协议,是企业围绕SLO发布的协议。它要求在不满足SLO时向客户补偿的协议。

Availability = Uptime (Uptime + Downtime)

37 | 什么是SLI、SLO、SLA相关推荐

  1. SLO、SLI、SLA是什么?【AIOps智能运维的方向会是SLO吗】

    1. SLO.SLI.SLA名词解释以及关系 2. Why SLO? SLO的目的 SLO 量化客户对可靠性的期望,找到客户对服务的可靠性感到满意的点(额外的可靠性价值微乎其微,此时新功能更加重要) ...

  2. SRE之SLI/SLO设定

    微信公众号:运维开发故事,作者:夏老师 1什么是SLI/SLO SLI,全名Service Level Indicator,是服务等级指标的简称,它是衡定系统稳定性的指标. SLO,全名Sevice ...

  3. 通过Prometheus来做SLI/SLO监控展示

    微信公众号:运维开发故事,作者:乔克 什么是SLI/SLO SLI,全名Service Level Indicator,是服务等级指标的简称,它是衡定系统稳定性的指标. SLO,全名Sevice Le ...

  4. 001_深度剖析什么是 SLI、SLO和SLA?

    前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的SLA条款,比如Amazon的EC2和S3服务都有相应的SLA条款.这些大公司的S ...

  5. 深度剖析什么是 SLI、SLO和SLA?

    前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的SLA条款,比如Amazon的EC2和S3服务都有相应的SLA条款.这些大公司的S ...

  6. SLI、SLO和SLA,一文彻底搞懂!!!

    前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的 SLA 条款,比如 Amazon 的 EC2 和 S3 服务都有相应的 SLA ...

  7. 在大规模 Kubernetes 集群上实现高 SLO 的方法

    作者 | 蚂蚁金服技术专家 姚菁华:蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率.低延迟的交付 pod.本文将分享蚂蚁金服在设计 S ...

  8. 七步成诗-快速创建有效SLO

    前言 之前的文章- 如何配置 SLO - 东风微鸣技术博客 (ewhisper.cn) 介绍了一些常用的各类 SLO, 但是在实际制定 SLO 过程中,并不一定适合实际业务需求.本次介绍 SLO 的最 ...

  9. 烎!GopherChina 2020 讲师全阵容发布,集结国内外Go语言最强力量

    今年 Gopher China 大会的讲师阵容和内容质量,是历年来最高规格的一次. -- Asta 1. Go 作者与 Team Leader 现身互动 "有生之年"环节 Meet ...

最新文章

  1. 浙江大学医学院附属儿童医院倪艳组招聘博士后和科研助理-肠道微生物和代谢方向...
  2. beanpostprocessor使用场景_Spring因动态代理使用不注意导致的诡异现象
  3. open() 函数以 w+ 模式打开文件
  4. PSD分层模板,助你设计出有创意的圣诞海报
  5. Linux安装winetim简单教程,在Ubuntu 18.04中安装Wine QQ、微信、TIM,并安装图标托盘,...
  6. BAT、头条的时长战争:百度逆势领跑
  7. 这些好用的音频、视频素材网站,你值得拥有。
  8. find+sed考试题及生产实战解决案例分享(考试答案系列)
  9. 【通过】华为OD机试真题59:叠积木
  10. 什么是用户实体行为分析(UEBA)
  11. 电子警察技术原理分析
  12. python3 用socket编写ftp
  13. 手机怎么模拟125k卡_【个性nubia之路】无卡开门禁:教你用手机NFC模拟门禁卡
  14. javaweb-一个投票网页
  15. wavplay控件应用之SigmaStudio
  16. Android实现计时器(Handle+Runable)
  17. C#读取写入excel单元格
  18. linux 查重脚本,Linux脚本学习必经之路:Shell脚本实例分享
  19. matlab 概率密度 混合分布 拟合,概率密度函数拟合和求概率分布函数
  20. 二分法求函数的零点c++

热门文章

  1. 计算机保存不了自动还原,win7系统颜色校准无法保存开机自动还原默认的处理步骤...
  2. good man or bad man?
  3. 世界各地的游戏都是如何分级的?哪个最严格?
  4. gitbook安装使用看完这一篇就够了
  5. 微信Android热更新Tinker使用详解(by 星空武哥)
  6. 国内免费版ChatGPT和AI绘画
  7. 使用iperf测试峰值带宽
  8. 14个程序员常去的外国网站
  9. python 如何使用正则表达式
  10. 手写由链表设计的简易队列