37 | 什么是SLI、SLO、SLA
1 SLI
Service Level Indicator 服务水平指示器,服务水平,简称SLI。对于业务来说是最重要的指标。比如,对于网站来说,一个常见的SLI是请求得到正常响应的百分比。
只要遵从两个原则就可以:
- 选择能够标识一个主体是否稳定的指标,如果不是这个主体本身的指标,或者不能标识主体稳定性的,就要排除在外。
- 优先选择与用户体验强相关或用户可以明显感知的指标。
通常情况下,可以直接使用谷歌的VALET指标方法。
- V:Volume,容量,服务承诺的最大容量
- A:Availability,可用性,服务是否正常
- L:Latency,延迟,服务的响应时间
- E:Error,错误率,请求错误率是多少
- T:Ticket,人工介入,是否需要人工介入
2 SLO
Service Level Object 服务水平目标,是围绕SLI构建的目标。通常是一个百分比,并与一个时间范围挂钩。比如,月度、季度、年度等。通常用一连串9来度量。如果脱离了时间的度量,SLO的意义就不大了。
90%(1个9的正常运行时间):这意味着10%的停机时间,也就是说在过去的30天里停机了3天。
99%(2个9的正常运行时间):意味着在过去30天中有1%,或者说7.2小时的停机时间。
99.9%(3个9的正常运行时间):意味着0.1%,或者说43.2分钟的停机时间。
99.95%(3.5个9的正常运行时间):意味着0.05%,或者说21.6分钟的停机时间。
99.99%(4个9的正常运行时间):意味着0.01%,或者说4.32分钟的停机时间。
99.999%(5个9的正常运行时间):意味着0.001%,或者说26秒的停机时间。
Availability = Successful request Total request
那么什么样的指标才是 SLI 指标呢?下面我们就以最常见的 SLI 指标成功率,延迟率来看2个范例:
请求成功的 TCP 数量/总 TCP 请求数,即 TCP 请求成功率。
请求成功的延迟小于 200 ms 的请求数/总请求数,即 TCP 延迟小于 200ms 的的比例。
下面我们就来看他们对应的常见 SLO 的范例:
每月 TCP 请求成功率(SLI)大于 99.99%
每月 99.99% 的 TCP 请求延迟(SLI)小于 200ms
这就是我们其实在实际 SLI,SLO 设定中最常见的 2 个指标及其范例
3 SLA
Service Level Agreement 服务水平协议,是企业围绕SLO发布的协议。它要求在不满足SLO时向客户补偿的协议。
Availability = Uptime (Uptime + Downtime)
37 | 什么是SLI、SLO、SLA相关推荐
- SLO、SLI、SLA是什么?【AIOps智能运维的方向会是SLO吗】
1. SLO.SLI.SLA名词解释以及关系 2. Why SLO? SLO的目的 SLO 量化客户对可靠性的期望,找到客户对服务的可靠性感到满意的点(额外的可靠性价值微乎其微,此时新功能更加重要) ...
- SRE之SLI/SLO设定
微信公众号:运维开发故事,作者:夏老师 1什么是SLI/SLO SLI,全名Service Level Indicator,是服务等级指标的简称,它是衡定系统稳定性的指标. SLO,全名Sevice ...
- 通过Prometheus来做SLI/SLO监控展示
微信公众号:运维开发故事,作者:乔克 什么是SLI/SLO SLI,全名Service Level Indicator,是服务等级指标的简称,它是衡定系统稳定性的指标. SLO,全名Sevice Le ...
- 001_深度剖析什么是 SLI、SLO和SLA?
前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的SLA条款,比如Amazon的EC2和S3服务都有相应的SLA条款.这些大公司的S ...
- 深度剖析什么是 SLI、SLO和SLA?
前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的SLA条款,比如Amazon的EC2和S3服务都有相应的SLA条款.这些大公司的S ...
- SLI、SLO和SLA,一文彻底搞懂!!!
前言 SLO和SLA是大家常见的两个名词:服务等级目标和服务等级协议. 云计算时代,各大云服务提供商都发布有自己服务的 SLA 条款,比如 Amazon 的 EC2 和 S3 服务都有相应的 SLA ...
- 在大规模 Kubernetes 集群上实现高 SLO 的方法
作者 | 蚂蚁金服技术专家 姚菁华:蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率.低延迟的交付 pod.本文将分享蚂蚁金服在设计 S ...
- 七步成诗-快速创建有效SLO
前言 之前的文章- 如何配置 SLO - 东风微鸣技术博客 (ewhisper.cn) 介绍了一些常用的各类 SLO, 但是在实际制定 SLO 过程中,并不一定适合实际业务需求.本次介绍 SLO 的最 ...
- 烎!GopherChina 2020 讲师全阵容发布,集结国内外Go语言最强力量
今年 Gopher China 大会的讲师阵容和内容质量,是历年来最高规格的一次. -- Asta 1. Go 作者与 Team Leader 现身互动 "有生之年"环节 Meet ...
最新文章
- 浙江大学医学院附属儿童医院倪艳组招聘博士后和科研助理-肠道微生物和代谢方向...
- beanpostprocessor使用场景_Spring因动态代理使用不注意导致的诡异现象
- open() 函数以 w+ 模式打开文件
- PSD分层模板,助你设计出有创意的圣诞海报
- Linux安装winetim简单教程,在Ubuntu 18.04中安装Wine QQ、微信、TIM,并安装图标托盘,...
- BAT、头条的时长战争:百度逆势领跑
- 这些好用的音频、视频素材网站,你值得拥有。
- find+sed考试题及生产实战解决案例分享(考试答案系列)
- 【通过】华为OD机试真题59:叠积木
- 什么是用户实体行为分析(UEBA)
- 电子警察技术原理分析
- python3 用socket编写ftp
- 手机怎么模拟125k卡_【个性nubia之路】无卡开门禁:教你用手机NFC模拟门禁卡
- javaweb-一个投票网页
- wavplay控件应用之SigmaStudio
- Android实现计时器(Handle+Runable)
- C#读取写入excel单元格
- linux 查重脚本,Linux脚本学习必经之路:Shell脚本实例分享
- matlab 概率密度 混合分布 拟合,概率密度函数拟合和求概率分布函数
- 二分法求函数的零点c++