更多专业文档请访问 www.itilzj.com

IT服务连续性简介

实施IT服务连续性管理的目标是确保发生灾难时,IT服务的可用性和性能保持在足够的水平。其实连续性管理就是目前的灾备管理(IT方)。

定义:灾难 (ITIL 4)

对组织造成重大损失或重大损失的突发性意外事件。要将事件归类为灾难,该事件必须符合组织预定义的某些业务影响标准。

现在很多企业都在做连续性管理,尤其是金融行业,包括银行、证券、保险、消金等等。企业首先要应对监管的要求。无论国际还是国内的标准组织和监控机构,针对连续性,都出台了一系列的管理规范,见下(只是一部分):

其次,确保服务连续性变得越来越重要和困难。尤其在数字化转型的背景下,很多企业的业务都严重依赖于IT系统,使得IT服务连续性的作用也越来越大。严重的服务中断可能会给企业带来灾难性的影响。

在ITIL 2中,服务连续性管理流程是服务交付其中的一个流程。在ITIL 3中,连续性管理是做为服务设计中的一个流程,流程活动与ITIL2相比,没有大变化,不过针对风险管理的方法进行了详细的解释。那么在ITIL 4中,IT服务连续性管理有哪些新亮点呢?

IT服务连续性的术语

定义:服务连续性

在发生灾难事件或中断性事件后,服务提供商在可接受的预定义级别上继续服务运行的能力。

在这个定义中,我们需要界定连续性管理的范畴是灾难,连续性管理是针对灾难性事件而制定的计划和响应措施。非灾难性事件的管理,一般不包括在IT服务连续性管理实践中,如

●小故障。根据业务影响,应将故障视为轻微或重大故障。重要的是要考虑诸如受影响的维修行动、故障规模、故障时间等因素。

●战略、政治、市场或行业事件

定义:服务连续性计划

服务连续性计划指导服务提供商在服务中断后响应、恢复和恢复到正常水平.

服务连续性计划通常包括:

●响应计划:服务提供商最初如何应对破坏性事件,以防止损坏,例如在火灾或网络攻击情况下。

●恢复计划:服务提供者如何恢复服务以实现RTO和RPO。

●恢复正常的操作计划:服务提供商在恢复后如何恢复正常操作。

指标:RTO和RPO

定义:RTO 恢复时间目标

在服务中断后,业务功能的缺乏严重影响组织之前,可以经过的最长时间。这表示必须恢复产品或活动或必须恢复资源的最长商定时间。

定义:RPO 恢复点目标

为了使活动在恢复时能够有效地运行,必须将活动使用的信息恢复到该点。

RTO 规定了业务可以中断的时间。RPO规定了可接受数据丢失的时间段。通常,RTO和RPO都是作为连续性管理的衡量指标,写入SLA中。


服务连续性管理的流程

服务连续性管理活动分为以下五个过程:

●服务连续性管理的治理

●业务影响分析

●制定和维护服务连续性计划

●测试服务连续性计划

●响应和恢复。

1. 服务连续性管理的治理

服务连续性治理主要包括三个活动,定义范围、策略选择和意识与演练计划的开发。一般做连续性的企业,主营业务都非庞大,IT系统更是错综复杂,交互繁多。出于经济效益的考虑,企业不可能保证所有的应用和基础设施组件都有备份,所以首先根据BIA(业务需求分析),确定关键业务和组件。然后根据不同的级别,选择不同的灾备方式和演练计划。

2. 业务影响分析 BIA

业务影响分析包括以下活动:

●VBF识别

●中断后果分析

●VBF相互依赖性识别

●确定服务连续性要求

ITIL 4中对于这些活动并未给出具体的实施方法。后面我会专门写一篇,如何开展BIA。BIA的难点在于技术实施层面,必须有系统架构师参与,进行风险评估也需要技术人员。

3. 制定和维护服务连续性计划

这个过程包括的步骤是:

●服务连续性策略制定

●服务连续性计划制定

●服务连续性计划初步测试

服务连续性策略可以包括连续性的等级,对应的RTO和RPO的目标,可用性目标,演练的等级。如:

金融领域的云计算平台容灾能力等级要求

影响范围

危害程度

较小影响

一般影响

严重影响

内部辅助管理

1级

2级

3级

内部运营管理

2级

3级

4级

公民、法人和其他组织的金融权益

3级

4级

5级

国家金融稳定、金融秩序

4级

5级

6级

关键指标:

容灾等级

RTO

RPO

可用性

3级

<=24小时

<=24小时

4级

<=4小时

<=1小时

5级

<=30分钟

约等于0

6级

<=2分钟

0

演练等级在《保险业信息系统灾难恢复管理指引(保监发[2008]20号)》规定为:桌面演练、模拟演练、实战演练、部分演练和全面演练。

4. 测试连续性计划

这个过程包括执行演练和连续性评审两个活动。

5. 响应和恢复

响应包括对应供应商服务连续性计划的调用。


IT服务连续性和可用性的关联和区别

先说区别。

从目标来看,服务连续性管理不包括对没有严重影响的小故障或短期故障的处理。它侧重于与重大损害相关的风险,而不管其发生的可能性或可能性有多大。通常,这些都是紧急情况:火灾、洪水、停电、数据中心故障等等。可用性管理实践并没有忽略故障对服务提供者和使用者的负面影响,但是在这个过程中也会考虑到单个组件的轻微中断。

从衡量指标看,服务连续性是RTO和RPO,可用性的指标是MTTR,MIBF,Availability%。

再说联系。

服务连续性和可用性在实施方法上,都会用到VBFs和风险评估,需要对服务失败进行BIA分析。所以实施过程中形成的文档和输出内容,都可用于这两个实践。由此可以看出,系统拓扑图,VBF,风险评估,对于IT服务运维管理,是多么的重要,这些都是基础信息,除了用于这两个实践,还可以用于配置管理。可惜的是,很多企业在这个基础层面都是缺失的。很多人提了一堆高大上的方法论和技术,但是基础却做不到位,导致运维管理就是一团散沙,无据可依。


总结:

我们如果去做灾备,只看ITIL讲解的IT服务连续性管理其实是远远不够的,还需要结合行业标准和管理规范,来解读监管要求。主要原因是ITIL中所讲解的IT服务连续性管理实践主要是从IT层面来讲解的,但是从企业运维的角度,应该实行的是“业务连续性管理”。可惜的是,ITIL4对于这个层面有一些解释,但是解释的不够全面。关于业务连续性管理的监管解读,后面我会再写一篇。

连续性管理无论是从方法论还是技术实施方案,都是非常复杂的,尤其是很多企业目前在应用云架构和微服务的新技术。如何做灾备,其技术方案是目前讨论的热点。当前市场上出现了不少专门做服务连续性管理的公司,企业也可以选择将连续性管理外包,不过效果如何,还不得而知。

文章来源于CSDN 作者yazi0127

福利

圈子构建、学习资料获取 1000+份重磅材料已分享【ITIL4 PPT教材/试题/视频/信息化/IT运维管理各类文档解决方案报告等】、ITIL4培训视频已开放扫码加入社群观看学习哦

随着材料不断丰富社群会不定期涨价早加入更优惠

公众号发送如下关键字获取免费资料:

1.价值58元/套IT管理体系文档--回复"干货"

2.最新ITIL4中文教材--回复"ITIL教材"

免责声明:

本公众号部分分享的资料来自网络收集和整理,所有文字和图片版权归属于原作者所有,且仅代表作者个人观点,与ITIL之家无关,文章仅供读者学习交流使用,并请自行核实相关内容,如文章内容涉及侵权,请联系后台管理员删除。

更多推荐

你一定要掌握的三条IT运维面试技巧

冬奥会,通信保障“零故障”、网络安全“零漏洞”!

软件架构设计分层模型和构图思考

Linux常用命令大全 | 176个

ITIL 4知识系列之ITIL4的设计框架解析

ITIL4知识系列之事件管理 (Incident Management)

最全的 Linux 学习思维导图,建议收藏!

民生银行 IT运维故障管理 可视化案例

ITIL4知识系列之IT服务连续性管理相关推荐

  1. ITIL4 讲解: IT服务连续性管理(灾备)

    IT服务连续性简介 实施IT服务连续性管理的目标是确保发生灾难时,IT服务的可用性(可用性介绍,参见"DevOps运维系列:可用性管理")和性能保持在足够的水平.其实连续性管理就是 ...

  2. 信息技术服务连续性管理指南

    连续性资源 概述 行业机构根据业务影响分析和信息技术 服务连续性风险评估结果,在信息技术服务连续性策略指导下,建设信息技术服务连续性 管理所需资源并定期维护,保障信息技术服务连续性计划顺利执行.行业机 ...

  3. 信息技术服务连续性管理委员会

    组织架构 概述 行业机构明确信息技术 服务连续性管理的组织架构,确定各层级人员在信息技术服务连续性管理过程中的职责和分工. 信息技术服务中断事件发生后,行业机构启用应急处置组织架构. 高级管理层 行业 ...

  4. 线程基础知识系列(三)线程的同步

    本文是系列的第三篇,前面2篇,主要是针对单个线程如何管理,启动等,没有过多涉及多个线程是如何协同工作的. 线程基础知识系列(二)线程的管理 :线程的状态,控制,休眠,Interrupt,yield等 ...

  5. 信息技术服务连续性管理过程

    策划 概述 JR/T 0251-2022 4 行业机构策划信息技术服务连续性 管理过程,依据信息技术服务连续性管理的指导原则,明确各项任务并制定总体工作计划. 指导原则 行业机构开展信息技术 服务连续 ...

  6. 信息技术服务连续性计划

    连续性程序 10.1 概述 行业机构依据信息技术 服务风险评估和业务影响分析结果,在信息技术服务连续性策略指导下,建立信息技术服务连续性 程序,编制信息技术服务连续性计划,确保信息技术服务中断事件能够 ...

  7. ITIL的服务目录管理流程的关键知识

    ITIL的服务目录管理内容并不多,但不容易理解.总体上而言是分业务服务目录.技术服务目录两个层次,其中技术服务目录又是为业务服务目录提供支撑.支持服务. 在设计自己的服务目录时,重点是先定义出服务,分 ...

  8. DEVOPS 运维开发系列一:ITIL服务目录管理流程的设计与信息化管理系统功能的开发

    ITIL是世界范围内公认的运维服务管理的最佳实践.ITIL的理论落地,不需要什么信息系统的支持,使用word文件.Excel表格一样可以对ITIL的十几个关键管理流程做到很好的落地.虽然是这么讲,但现 ...

  9. 运维的进击“转型”:阿里业务连续性管理最佳实践

    公众号回复:干货,领取价值58元/套IT管理体系文档 公众号回复:ITIL教材,领取最新ITIL4中文教材 说明:本文根据付来文老师在 GOPS 全球运维大会 2021 · 深圳站的演讲速记整理而成. ...

最新文章

  1. ICCV2021 | SMCA:即插即用的共同注意力模型,可使DETR收敛加速10倍
  2. 手把手教你用Python进行回归(附代码、学习资料)
  3. html5摒弃的标记,全新改进的HTML5表单创建
  4. 自监督和语言监督我全都要?Facebook多模态预训练模型SLIP给你答案!
  5. rabbitmq 入门demo
  6. Vue指令篇_v-bind
  7. 4月15日见?疑似一加8 Pro真机谍照曝光:开孔双曲面屏加持
  8. java中的Card是什么_Java中diapCard是什么意思
  9. js中的forEach
  10. embedding.assign(embedding_input)的解读
  11. rsyslog mysql ip_使用rsyslog+loganalzey收集日志显示客户端ip
  12. Python实现社交网络可视化
  13. cns/clns搭建给clnc(udp转发)
  14. Deadlock found when trying to get lock; try restarting transaction 【MySQL死锁问题解决】
  15. table添加一行且可编辑 vue_Vue使用AntDesign 表格可添加 可编辑行 可选择
  16. java面试逻辑思维题目_逻辑思维面试题-java后端面试
  17. IE、360、百度三者的比较
  18. 华为机试HJ96:表示数字
  19. Jeff的错题集(九):奥利给!
  20. Linux SDIO WIFI Marvell8801/Marvell88w8801(三) --- Linux驱动以及组件的使用

热门文章

  1. HRNet 论文阅读笔记
  2. Python中的break、continue、pass和循环else语句
  3. C语言-数据结构-列表
  4. 移动互联广告传媒介绍
  5. Recursive sequence(矩阵快速幂)
  6. gitlab获取项目所有文件名
  7. SCIP求解整数规划实例
  8. css 文本两行显示,超出省略号表示
  9. 机器学习 ||《菜菜的sklearn机器学习》笔记——2 随机森林
  10. Centos7添加虚拟网卡