1 什么是容灾

容灾系统是指建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换。当一处系统因意外停止工作时,整个系统可以切换到另一处系统,使得系统功能可以继续工作。

容灾即使是系统的高可用性技术的一个组成部分,荣在系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。

2 容灾综述

2.1 容灾分类

从其对系统的保护程度来分,可以讲容灾系统分为:数据容灾和应用容灾。
  • 数据容灾:指建立一个异地的数据系统,该系统可以是本地关键应用数据的一个备份或实时复制。
  • 应用容灾:指在数据容灾的基础上,在异地建立一套完整的与本地应用生产系统相当的备份应用系统(可互为备份)。在灾难情况下,远程系统迅速接管业务运行。
数据容灾是对灾难抵御的保障,而应用容灾则是容灾系统建设的目标。

2.1.1 数据容灾

所谓数据容灾,就是至少在异地保存一份可用的关键业务数据,该数据可以是与本地生产数据的完全实时复制,也可以比本地数据稍微落后,但一定是可用的。
采用的主要技术是 数据备份数据复制技术。其中数据复制技术,按照实现的技术方式来说可分为 同步传输异步传输

2.1.2 应用容灾

所谓应用容灾,是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统。建立这样一套系统相对比较复杂,不仅需要一份可用的数据复制,还要有包括网络、主机、应用、甚至IP等资源,以及各资源之间良好协调。

2.1.3 应用容灾的机制

在远程的容灾系统中,要实现完整的应用容灾,既要包含本地系统的安全机制、远程的数据复制机制,还应具有广域网范围的 远程故障切换能力和 故障诊断能力
也就是说,一旦故障发生,系统要有强大的故障诊断和切换策略制定机制,确保快速的反应和迅速的业务接管。实际上,广域网范围的高可用能力和本地系统的高可用能力应形成一个整体,实现多级的故障切换和恢复机制,确保系统在各个范围的可靠和安全。

2.2 重要指标

2.2.1 RTO

恢复时间目标(Recovery Time Objective,简称RTO)是指灾难发生后,从IT系统宕机导致业务停顿时刻开始,到IT系统恢复至业务恢复运营为止,此两点之间的时间段称为RTO。

2.2.2 RPO

恢复点目标(Recovery Point Objective,简称RPO)是对系统和应用数据而言,指的是恢复业务系统所能容忍的数据丢失量。

3 灾备方法论

容灾系统建设包括分析、设计和实施三个阶段。共7个步骤,即“风险分析”、“业务影响分析”、“可恢复性评估”、“指定恢复策略”、“容灾方案设计”、“灾难恢复预案设计”、“容灾演练和维护”。
图3.1 容灾方法论

3.1 风险分析

  • 分析可能对用户业务系统和IT系统的安全性造成威胁的各种风险因素,并提出相应的对策和改进方案。
  • 定义出对于风险的预防措施

3.2 业务影响分析

业务影响分析(Business Impact Analysis,简称BIA)。
指收集、分析、汇总以及排序当信息系统一旦遭遇灾害对各项重要关键性业务的影响程度,并依据优先级提出恢复策略建议。
  • 确定用户的关键业务流程
  • 定义各关键业务中容许中断的最长时间
  • 确认各关键业务数据丢失的可容许程度

3.3 可恢复性评估

从IT架构、平台、技术、基础设施、组织结构、恢复流程等各层面来评估用户IT目前的恢复能力。
评估IT作业目前是否能够恢复、需要多少时间恢复、以及可能的数据丢失数量。

3.4 指定恢复策略

  • 依据前述各项分析,配合目前技术,提出适当的灾难恢复策略。
  • 召开研讨会确认恢复策略。

3.5 容灾方案设计

  • 根据恢复策略来设计最适合的容灾技术方案。
  • 各种容灾解决方案的比较。
  • 在设计容灾方案时,应综合考虑基础设施、硬件平台、软件技术、网络配置、IT组织、技术恢复流程等方面。

3.6 灾难恢复原设计

  • 定义可被接受的灾难恢复的规范
  • 定义必须遵循的恢复程序,包括IT系统和相关设施
  • 设计相应的容灾组织结构和人员职责

3.7 容灾演练和维护

  • 通过容灾演练、测试确保灾难恢预案的有效性。
  • 灾难恢复预案的维护包括:
    • 日常计划维护
    • 根据容灾演练结果的维护
    • 由于各项变更而产生的维护

4 系统高可用架构设计流程

4.1 系统的可用性评估

图4.1 系统的可用性评估

4.2 高可用性架构设计流程

图4.2 高可用性架构设计

4.3 高可用性模型

图4.3 高可用性模型

5.灾难恢复规范

5.1 六个灾难恢复等级

  • 等级六:数据令丢失和远程集群支持
  • 等级五:实时数据传输及完备设备支持
  • 等级四:电子传输及完整设备支持
  • 等级三:电子传输和部分设备支持
  • 等级二:备用场地支持
  • 等级一:基本支持

5.2 容灾的指标要求

图5.1 容灾的指标要求

5.3 容灾管理要素

七大技术管理要素:
  • 灾难恢复预案
  • 运行维护支持
  • 技术支持
  • 备用基础设施
  • 备用网络系统
  • 备用数据处理系统
  • 数据备份系统

5.4 容灾管理

图5.2 容灾管理

6 容灾建设技术

  • 数据库复制技术
  • 主机卷复制技术
  • 磁盘到磁盘的复制技术
  • 虚拟存储层的复制技术

7.容灾建设规划要点

7.1 灾备实现方法论

  • 分析评估:包括风险的分析、业务影响的分析和当前环境的分析。
  • 设计实施:包括容错策略的制定、容灾方案的规划和实施。
  • 维护管理:包括灾难恢复原的设计和管理。如何实现灾备/备份和其他资源的统一管理。

7.2 灾备建设目标和范围

  • 核心业务系统
  • 周边业务系统
  • 应用级容灾还是数据级容灾
  • RPO和RTO指标

7.3 容灾技术路线选型依据

  • 复制数据类型要求:数据库、文件系统
  • 链路带宽
  • 是否要求主机、存储异构
  • 传数距离
  • 是否要求双活
  • RTO、RPO要求

7.4 容灾恢复预案的规划

 

图7.1 容灾恢复预案的规划

7.5 灾难恢复计划的组织机构

图7.2 灾难恢复计划的组织机构

容灾技术及建设经验介绍相关推荐

  1. HP BusinessCopy同城/异地容灾技术方案

    第一章      灾难备份背景及优势.............................................................................. 3 1 ...

  2. 贵州省新农合业务系统容灾技术支撑服务项目

    2.1项目背景 新农合业务是中国移动贵州公司在医疗卫生行业类的一大重要信息化应用.贵州省新农合项目建设至今,在线运营业务包括68个县(区).1224个乡(镇).16508个村:建档总人数3358.44 ...

  3. 如何构建故障与危机的处理能力?《高可用及容灾架构体系化建设》下篇

    如何建设全面的高可用及容灾架构体系,是一个涉及到广泛领域的话题,将分成上.下两篇呈现给读者.本文将在上篇的架构基础上,构建完整的故障与危机的处理能力,同时通过持续运营与组织保障机制的协同,打造出全面的 ...

  4. 怎样建设稳定性基础架构?《高可用及容灾架构体系化建设》上篇

    如何建设全面的高可用及容灾架构体系,是一个涉及到广泛领域的话题,将分成上.下两篇呈现给读者.本文讨论的架构体系,解耦具体产品实现,尽量只从架构原理出发,从构建一个韧性的应用基础架构内核开始,到增强应用 ...

  5. 第一讲:双活容灾技术和方案概述

    容灾建设在我国已有十多年的历史了,尤其是2007年发布国标GB/T20988-2007<信息系统灾难恢复规范>后,各行各业对容灾建设都非常重视,各种新的容灾技术和产品也得到了快速的发展和应 ...

  6. 医疗行业:容灾备份平台建设及运维难点

    现在医院对信息系统的依赖性越来越大,如何避免数据丢失,当遇到数据灾难时如何快速地恢复数据,保障医院业务开展的连续性,已成为影响医院业务发展的关键因素. 以下内容来自社区针对医疗行业容灾备份平台建设及运 ...

  7. DSG-RealSync Oracle数据库同步复制及容灾技术简述

    DSG-RealSync Oracle数据库同步复制及容灾技术简述 1 为什么需要数据复制 1.1 信息系统存在的问题及需求 随着计算机应用系统的爆炸式发展,业务量迅速增加,业务种类日益复杂,企业必须 ...

  8. 长江证券集中交易系统本地查询及异地容灾备份系统建设

    1993年,世贸中心大楼发生爆炸,爆炸前约有350家企业在该楼中工作.1年后,再回到世贸大楼的公司变成150家,有200家企业由于无法存取重要的信息系统而倒闭.消失.1995年1月,日本神户地区大地震 ...

  9. 容灾技术中的数据一致性保障

    一. 数据容灾 许多用户都处在磁带库备份的应用上,有些使用了远程数据记录的技术.但容灾不只是简单备份.传统备份是将数据保留在非生产设备的其他介质上,更着重于数据的日志管理,记录并保护数据的增量.差分, ...

最新文章

  1. 性能测试总结(一)---基础理论篇
  2. 计算机三维作品说明,计算机三维技术
  3. Linux下通过源码编译安装程序
  4. JAVA中大小写转化函数_Java-切换大小写,多个大小写调用同一函数
  5. python输出结果空格分割_用Python编写固定宽度,以空格分隔的CSV输出
  6. Java中JSON的解析方式
  7. 音视频编解码标准简介
  8. 结巴分词python教程_Python笔记:用结巴分词制作词云图
  9. Ubuntu20+TendaU12驱动离线安装
  10. 推荐9个能让你看一天的网站
  11. SpringBoot项目解决@ResponseBody注解返回xml格式数据而不是json格式的问题
  12. 跟李沐学AI:实用机器学习 | 第九章
  13. 解决国内手机安装Google Play打开闪退问题
  14. c语言求三门课总成绩,C语言编程,求高手 编写程序求某班20位学生三门课(英语,数学,语文)总成绩,并按照总成绩从大到小...
  15. Part GeoAI----当ArcGIS遇上人工智能
  16. MySQL 使用自增ID主键和UUID 作为主键的优劣比较详细过程(500W单表)
  17. 【剑指offter】【C++】【二叉树】27. 二叉树的镜像
  18. 洛谷 P3258 松鼠的新家 题解
  19. JAVA初/中/高级程序员必须知道的知识
  20. LeetCode 刷题之路(python版)

热门文章

  1. dr/bdr选举的故事(有意思)
  2. CTF中MISC常见工具总结
  3. netcat常用命令
  4. Kotlin入门第四节
  5. Android【WebView】
  6. java web视频学习-ServletContext和Request和Response
  7. 自己制作Chrome绿色版本。
  8. 为什么要高内聚低耦合?
  9. html5火苗特效代码,视频添加火焰特效 视频画面中加动态的火苗效果
  10. windows下ntp时间校对