线上事故复盘报告模板
前言:线上事故复盘报告模板分享
线上事故复盘报告模板
- 一、事故级别定义
- 二、事故发生背景
- 三、事件回顾
- 四、事故产生原因分析
- 五、事故处理办法
- 六、针对事故的反省及改进措施:
- 七、处罚策略(可选)
- 八、疑问解答与加群交流学习
一、事故级别定义
P0:核心业务重要功能不可用且大面积影响用户; 响应时间:立即
P1: 核心业务重要功能不可用,但影响用户有限,如仅影响内部用户; 响应时间:小于15分钟
P2 :核心业务周边功能不可用,持续故障将大面积影响用户体验; 响应时间:小于15分钟
P3: 周边业务功能不可用,轻微影响用户体验; 响应时间:小于4小时
P4: 周边业务功能不可用,但基本不影响用户正常使用。 响应时间:小于6小时
二、事故发生背景
(详细描述在时间节点发生的动作,造成什么影响)
例:xxx 项目上线后,在2020-01-10 18:00由甲方反馈在xxx平台上出现xxxxx问题,导致大面积用户不能正常使用XXX功能
三、事件回顾
(记录事件从需求产生到发生事故整个流程,也可根据具体情况自行确定回顾内容)
例:
1、xxx时间点,确定了xxxx需求
2、xxx时间点,经由技术讨论确定xxx方案
3、……
四、事故产生原因分析
(主要描述事故的产生的直接原因、间接因素)
例:
1、开发未自测
2、测试漏测
3、产品方案设计不合理
4、问题产生后未引起团队重视,处理优先级确定错误
5、……
五、事故处理办法
(主要描述事故出现后的修复手段以及验证过程)
六、针对事故的反省及改进措施:
(主要描述以后如何避免类似的问题,以及出现问题后及时响应指定合理的解决办法)
七、处罚策略(可选)
(针对事故级别,合理制定项目组成员的处罚方案)
八、疑问解答与加群交流学习
线上事故复盘报告模板相关推荐
- 如何更快的查找线上系统问题--多次重大线上事故复盘
以前我以为,线上系统的问题,只需要好好检查代码即可找出原因,可是工作后发现,现实并非如此,往往线上系统的问题来源于信息不对称.这种信息不对称体现在团队成员之间没有好好沟通,了解彼此对系统的改动,以及跨 ...
- 线上问题复盘报告模版
[问题描述] [问题过程] [问题来源]:业务-A/产品-B [问题记录链接]: 发生时间: 发现时间: 定位时间: 恢复时间: 监控是否发现:是/否 [问题原因] 根本原因: [解决方案] [影响范 ...
- 线上事故应该由谁来承担?
前不久线上发生了一个事故,主线是这样的,XX 平台对接了 web 端和手机终端,一个伸手不见五指的夜晚,web 端出现了问题,SRE 发现故障后迅速发起了 oncall 机制,建立了作战室.一个小时后 ...
- “���”引发的线上事故
点击上方"方志朋",选择"设为星标" 回复"666"获取新整理的面试文章 最近遇到了一起依赖升级 + 异常数据引发的线上事故,教训惨痛,本文 ...
- 程序员惊魂 12 小时:“���”引发线上事故
作者 | 饶全成 来源 | 码农桃花源(ID:CoderPark) 最近遇到了一起依赖升级 + 异常数据引发的线上事故,教训惨痛,本文对此进行回故和总结. 背景 起因是我们使用的服务框架版本比较老,G ...
- RPC 的超时设置,一不小心就是线上事故!
作者 | 骆俊武 来源 | IT人的职场进阶(ID:BestITer) 上面这张监控图,对于服务端的研发同学来说再熟悉不过了.在日常的系统维护中,『服务超时』应该属于监控报警最多的一类问题. 尤其在微 ...
- RPC的超时设置,一不小心就是线上事故
来自:IT人的职场进阶 上面这张监控图,对于服务端的研发同学来说再熟悉不过了.在日常的系统维护中,『服务超时』应该属于监控报警最多的一类问题. 尤其在微服务架构下,一次请求可能要经过一条很长的链路,跨 ...
- 醉了,RPC 超时设置也能引起线上事故!
上面这张监控图,对于服务端的研发同学来说再熟悉不过了.在日常的系统维护中,『服务超时』应该属于监控报警最多的一类问题. 尤其在微服务架构下,一次请求可能要经过一条很长的链路,跨多个服务调用后才能返回结 ...
- 同时设置超时时间_刚入职的小菜鸡,设错了RPC超时,搞了个线上事故
上面这张监控图,对于服务端的研发同学来说再熟悉不过了.在日常的系统维护中,『服务超时』应该属于监控报警最多的一类问题. 尤其在微服务架构下,一次请求可能要经过一条很长的链路,跨多个服务调用后才能返回结 ...
- 【报告分享】2020情趣用品线上消费趋势报告.pdf(附下载链接)
大家好,我是文文(微信号:sscbg2020),今天给大家分享CBNData发布的报告<2020情趣用品线上消费趋势报告.pdf>,有"性"趣的伙伴们别错过了哦-本报告 ...
最新文章
- ptam tracking
- shell编程-条件判断
- 架构模式: 事务日志跟踪
- 6大最流行、最有用的自然语言处理库对比
- 国外好的软件测试网站
- react前端显示图片_如何在react项目中引用图片?
- vscode java settings设置_兼容vscode插件的主题服务
- LAPSUS$声称盗取源代码仓库,微软正在调查
- unity3d ppsspp模拟器中的post processing shader在unity中使用
- RabbitMQ常用交换机模式总结
- java接口文档编写_java api接口文档怎么编写?
- autocad.net 画多段线_VB.net 在AutoCAD中绘制矩形云线
- HDU-2669 Romantic (欧几里得定理)
- 国外5G行业应用产业政策分析及对我国的启示
- 计算机编程学英语词汇,计算机编程常用英语词汇
- 20221017在线识鸟
- c语言分拆素数和,分拆素数和。
- HEVC官方软件HM源代码简单分析-解码器TAppDecoder
- 如何安装和搭建wordpress个人网站(超详细+零基础)
- [Ant][StartWithAnt] 第七章 Ant扩展包ant-contrib的使用
热门文章
- 定制自己的Unity场景编辑工具界面(一)
- 太极熊猫3服务器维护中,太极熊猫3月10日维护公告_瑞兽稀有技修改_蚕豆网新闻...
- 如果面试官问您还有什么问题要问的,应该如何巧妙的回答才算合适呢?
- 霍尔高斯计G81在地磁测量上的运用
- 哈理工OJ 2090 背包【思维】
- 几行Java解决图片提取文字功能
- 查看计算机本机IP地址,本机ip地址查询
- python找不到tushare_python stock数据包tushare
- 还有在用迅雷7的朋友吗?
- 中外大学及大学生活面貌的实录(计算机专业大一学生有感网摘记录) (原创,2013年2月21日不断更新中)...