本次分享主要围绕以下三个方面:

一、Region和可用区介绍
二、Endpoints和资源作用域
三、多可用区容灾和Region化部署

弹性计算Region化部署和跨可用区容灾本身是非常复杂的课题,本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍如何选择Region,同时结合阿里云在Region化部署和跨可用区容灾的实践经验,分享多region部署场景中如何使用阿里云弹性计算的最佳实践,并结合弹性计算的实践经验探讨如何基于阿里云多可用区实现跨地域容灾。

一、Region和可用区介绍

该部分主要介绍Region和可用区,包括阿里云建设Region和可用区的原因、划分等。

1.Region(地域)与Available Zone(可用区)

Region(地域):根据定义,Region是相互独立的地理区域,Region中包含多个Available Zone。可通过阿里云Region和可用区分布图直观了解。

Available Zone(可用区):Available Zone是Region内网络和电力相互独立的区域,具有两个主要特点。第一,Available Zone网络和电力相互独立,具有故障隔离能力。当一个可用区内部网络、电力出现问题时,不会影响其他可用区。第二,相同Region内的可用区之间内网互通,通过高速网络连接,网络延迟低(ms级)。

即可用区之间有故障隔离,同时相同Region内的可用区之间网络延迟较低,可以将多个可用区视为整体提供服务,也为后续做跨可用区容灾提供了基础。
此处需要指明,并不是先规定了地域和可用区后才发现可支持高可用服务建设,而是在有高可用服务需求的基础上通过Region与可用区方式进行了资源划分。

2.如何选择Region?

选择一个Region有以下三点重要影响因素:

第一,地域选择需要符合相应政策和法律合规性需要。例如向美国提供服务,要求对应数据与服务器资源必须在该国家内部,那么根据下方Region与可用区分布,只能申请美西、美东两处资源。
第二,需要根据所需云产品在各个地域的功能开通情况和SLA选择合适区域。
第三,一般选择距离用户更近且网络延迟更低的地域,保证用户快速接入。

虽然Region的选择看似条款化,但是实际选择时是更为简单直观的,较易得到最优选择。

3.阿里云Region与可用区分布

目前为止,阿里云公共云在全球建设21个地域63个可用区,资源正在快速增长中,未来将支持更多形态。

下图所示体现了阿里云在全球多个地理位置提供服务的能力,可见Region是一个地理概念。例如当用户在华北2(北京)Region购买资源时,对应的ECS、RDS产品的确是在该地域范围内。

目前Region与可用区分布较集中在中国,其他国家地区也有分布,在南美与非洲缺少Region建设,是后续的发展方向。

而Region的使用稍显复杂。与各个Region交会并不直接使用其名字,而是通过REGION_ID。REGION_ID看似杂乱,其实具有一定特点,可大致分为以下三种:

中国REGION_ID为cn-(城市名),如cn-hangzhou。
大面积国家REGION_ID为(国家代码)-(方位)-(编号),如USA-EAST-2。
其他地区REGION_ID为(地区)-(方位)-(编号)。

二、Endpoints和资源作用域

该部分介绍使用Region与可用区时需要关注的两个关键点:Endpoints和资源作用域。

1. Endpoints

Endpoints是调用ECS API的接入地址。

调用ECS API首先需要获取Endpoints,即需要知道需要调用的地域的域名,才能调用到相应服务。第二需要有AK,通过某种阿里云特定的算法对调用串做一些加签。如此便可以完成一次请求。

如下表所示,根据不同Region类型,Endpoints接入方式有如下三种:

第一种类型是中心域名Region,其接入点域名地址是http://ecs.aliyuns.com。此类老地域使用兼容模式只能通过中心域名接入,如cn-beijing。
第二种类型是Region化域名,其接入点为Region化域名地址ecs.${REGION_ID}.http://aliyuns.com。此类Region使用Region化域名调用,兼容中心域名接入,如cn-zhangjiakou。
第三种类型开始考虑不兼容中心域名接入的Region化域名,只能通过Region化域名地址ecs.${REGION_ID}.http://aliyuns.com接入,如cn-heyuan。

针对以上三种类型Region的接入得到了最佳实践。非中心域名的地域,建议使用Region化域名地址ecs.${REGION_ID}.http://aliyuns.com。部分Region只能使用中心域名访问,后续会之间切换为Region化域名。

2.资源作用域

使用ECS过程中会有多种资源,每一种资源有其特定的作用域。

下表罗列了部分资源。如账号、角色、AK此类为全局性信息,所有Region共享。实例、云盘为可用区级别的概念,创建实例、云盘都需要选择一个特定的可用区,但是实例只能挂载相同可用区的云盘。快照、镜像资源、keypair、安全组的作用域均为Region,在Region内各个可用区均可访问。当需要跨Region使用快照、镜像资源时,需要先进行资源复制操作,在另一个Region上形成新资源才可以使用。

资源作用域并非规定成章,有时会存在变化,大部分时期是上述情况。

三、多可用区容灾和Region化部署

该部分介绍如何利用Region与可用区地域分布以及可用区电力、网络故障隔离和低延迟的特点实现多可用区容灾和Region化部署。

1.跨可用区容灾——冷备方式

冷备方式指两个可用区,一个主可用区运行,一个不运行作为备份。一旦运行中的可用区服务故障,部署并运行备份可用区。冷备方式较易实现,其缺点为主备切换耗时大(分钟级)。

单可用区提供服务:如下图所示,可用区a和可用区b同时提供两套服务,由单可用区提供服务。正常情况下可用区a提供服务,可用区b的ECS服务不进行部署和运行,对应的SLB没有流量。流量从DNS解析到可用区a的SLB,接入请求后SLB会分发到某个ECS。

RDS主备架构:两个ECS访问同一个RDS,RDS采用主备结构,主RDS提供读写服务,同时有一条路径自动同步数据到备RDS,保证两个可用区的数据一致性与及时性,为容灾切换提供基础。

无状态服务:ECS部署无状态服务,所有业务状态存储在数据库中或可从数据库恢复。如此才能在可用区a故障时将整个业务切换到可用区b。

故障恢复方案:可用区a、b存在电力、网络的物理隔离,延迟低,发生可用区级别故障时可切换可用区提供服务。可用区a发生问题时,部署并运行可用区b服务,RDS主备切换,可用区a恢复后可继续进行数据同步。切换DNS,可用区b SLB接收流量开始提供服务。

劣势:冷备方式比单纯的单个可用区提供服务有更强的容灾能力,但是其缺点是切换可用区启动ECS、启动服务等、运行SLB等等操作耗费一定时间,属于分钟级别的容灾。

2.跨可用区容灾——双活方式

双活容灾方式与冷备方式区别在于两个可用区同时运行,数据同步。一旦某一可用区服务故障,另一可用区继续提供服务。双活方式同样易于实现,且主备切换耗时低(s级)。

双可用区同时提供服务:如下图所示,有可用区a和可用区b同时提供两套服务。SLB同时挂载两个可用区的ECS服务,每个可用区的SLB需要将请求分发给两个可用区的ECS。

RDS主备架构:自动同步数据,保证两个可用区的数据一致性与及时性。正常情况下两可用区服务均访问RDS主节点。

无状态服务:ECS部署无状态服务,所有业务状态存储在数据库中或可从数据库恢复。

故障恢复方案:当一个可用区发生问题时,RDS可自动主备切换。DNS定时检测SLB状态,屏蔽故障可用区,SLB定时检测ECS服务状态,屏蔽故障服务。该场景下大部分检测自动实现,部分复杂场景下可能需要手动确认故障,但是该切换过程迅速,可实现秒级切换。

以上两种跨可用区容灾方式较为实用、常见,实现条件均是可用区之间具备网络、电力的物理隔离以及低延迟特点。

3.跨Region部署

此处仅介绍较为简单的跨Region部署模式。

首先进行地域划分。Region化部署完成后,每个Region中由可用区容灾的集群保证高可用性。但是客户端调用地域时一个Region不能支持所有用户与资源访问。因此首先需要根据用户或者资源所属地域进行划分,通过DNS服务获取Region化地址。该DNS可能是阿里云提供的服务或其他服务,DNS根据用户或资源返回相应的Region化地址。

例如某用户访问Region 1,则调用Region 1的服务提供相应支持,某用户访问Region 2,则调用Region 2的服务提供相应支持。

Region内双可用区容灾。地域划分完成后,当可用区级别问题扩大到Region级别问题场景下,并未提供Region级别容灾能力,但是提供了隔离能力。例如当Region1发生问题,无法切换到Region2进行容灾,但是可以实现隔离,当Region 1出现问题时Region 2不受影响,即能够保存一部分工作服务的能力。

若需要提供Region级别容灾能力,需要实现跨Region的数据同步或复制,将一个Region的数据、用户状态等复制到另一个Region,即可实现Region切换。如此将更加复杂。Region级别容灾等复杂方案此处不做介绍,有兴趣者可自行查阅资料。

故障影响和恢复。用户最终选择的容灾方式、故障隔离级别、故障恢复方案等需要根据自身业务需求、实现难度与故障概率等进行判断,选择最适合自身业务的方案。

综上所述,本次分享介绍了Region、可用区的定义、故障隔离与低延迟特性、关键点以及跨可用区容灾等基本概念。大家可以利用阿里云的基础架构以及业务相应支持提高服务可用性,在一定级别实现容灾,提供更好的服务。

感兴趣的同学可通过学习更加具体的场景下不同跨可用区容灾方案,更加深入了解跨Region容灾。

作者:李钟(谢顿),阿里云智能弹性计算高级技术专家。2015年7月加入阿里云弹性计算团队,目前负责阿里云弹性计算管控架构团队,主导弹性计算管控系统架构的优化和演进。

原文链接

本文为阿里云原创内容,未经允许不得转载。

玩转ECS第6讲 | 弹性计算 Region 化部署和跨可用区容灾介绍相关推荐

  1. 玩转ECS第6讲 | 弹性计算Region化部署和跨可用区容灾介绍

    简介:本次分享由阿里云弹性计算架构负责人李钟(谢顿)为大家介绍阿里云region化部署和跨可用区容灾的实践经验,说明多Region部署场景中使用阿里云弹性计算的最佳实践,并结合弹性计算的实践经验探讨如 ...

  2. 玩转ECS第5讲 | 弹性计算安全组最佳实践及新特性介绍

    简介:本次内容由阿里云智能技术专家王帝(丞浩)为大家介绍如何正确使用安全组.最佳实践以及新特性:详细了解安全组为何是云端的虚拟防火墙,以及为何是重要的网络隔离手段. 演讲嘉宾简介:王帝(丞浩),阿里云 ...

  3. 玩转ECS第8讲 | 服务器迁移中心SMC最佳实践及新特性介绍

    简介:本次分享由阿里云技术专家白辉万(百宝)为大家介绍免费的服务器迁移上云最佳实践方案和新功能特性,包括一键迁云.自动定期同步.一键验证.本次分享内容将帮助企业上云客户越过高高的服务器迁移门槛,快速体 ...

  4. 玩转ECS第7讲 | ECS数据保护-数据备份新特性与最佳实践

    简介:本文中,阿里云智能弹性计算专家余初武(悟元)将结合阿里云近期推出的数据备份新特性(快照极速备份.一致性快照组)来介绍云上环境如何做数据备份的最佳实践:适合需要构建云上架构的工程师,架构师和云上实 ...

  5. 发现在创建云服务器ecs实例的磁盘快照时_玩转ECS第7讲|ECS数据保护-数据备份新特性与最佳实践...

    简介: 本文中,阿里云智能弹性计算专家余初武(悟元)将结合阿里云近期推出的数据备份新特性(快照极速备份.一致性快照组)来介绍云上环境如何做数据备份的最佳实践:适合需要构建云上架构的工程师,架构师和云上 ...

  6. 基于弹性计算平台——构建高可用、可扩展的应用

    文 / 陈波 前不久,Facebook宣布投资10亿美元收购仅成立15个月的移动照片分享应用Instagram,消息传出时,人们不仅惊叹于这笔巨额的交易,更为这支13个人的小团队感到不可思议.Inst ...

  7. 阿里云弹性公网ip(EIP)是什么?eip详细介绍

    阿里云eip是什么?阿里云百科分享弹性公网IP详细介绍,阿里云弹性公网EIP是什么意思?EIP是可以独立持有的公网IP地址,EIP可以和阿里云专有网络VPC类型的云服务器ECS.NAT网关.ENI网卡 ...

  8. 阿里“去 IOE”十二年,弹性计算如何二次去 I 和 E?

    [CSDN 编者按]王坚院士曾讲过一句话让人印象深刻,他说「云计算的本质是服务,如果不能将计算资源规模化.大范围地进行共享,如果不能真正以服务的方式提供,就根本算不上云计算.」众所周知,阿里云是完全经 ...

  9. 【阿里云云计算工程师 ACP 认证】01、弹性计算 ECS

    目录 一.什么是 ECS 1.1 什么是弹性计算 ECS 1.2 弹性计算 ECS 的定位 1.2.1 弹性的伸缩能力 1.2.2 计算的基础运行环境 二.ECS 的基本概念 2.1 ECS 相关概念 ...

最新文章

  1. react native 开发笔记(二)
  2. 比较String、StringBuffer和StringBuilder
  3. java stream 求和_谈谈Java任务的并行处理
  4. 中俄国际社区大佬共话Java,苦Lambda表达式久矣?
  5. 爬楼梯 · Climbing Stairs
  6. 服务器硬盘一般怎样备份,GHOST对硬盘系统分区(一般是C盘)的备份和恢复图文教程,对操作系统的备份和恢复...
  7. Vue源码学习之Vue对于闭包的使用
  8. Python3学习笔记十三
  9. QObject::moveToThread: Current thread(...) is not the object`s thread. Cannot move to target thread(
  10. Android R 通知新特性—人与对话(气泡窗)
  11. 社群裂变营销“肩负”着公司百分之九十的流量
  12. android 微信 去广告插件,Xposed去除微信朋友圈广告
  13. JPA Criteria Query
  14. SysinternalsSuite
  15. 层次分析法之matlab代码实现
  16. Onvif再学习---MiniXml-介绍
  17. 这个题真实变态 怎么改呐!!!
  18. Canvas绘图在微信小程序中的应用:生成个性化海报 1
  19. fiddler4抓包修改Request,断点设置
  20. QT5.4 计算器程序 打包发布,解决dll的最新解决方案

热门文章

  1. 美通企业日报 | 应届生平均起薪7566元京沪最高;00后月均零花钱约470元
  2. erp系统 服务器在哪里的,云erp服务器在哪
  3. 布赖恩·克尼根位计数算法说明及简单使用
  4. 马云:大数据时代,最重要的是做最好的自己
  5. FAT12模拟-C语言读取
  6. linux 多播路由查看,实现Linux下多播路由
  7. 数字图像处理,自适应中值滤波的C++实现
  8. 自动驾驶地图中的深度学习
  9. HDU-5514 Frogs
  10. java 地铁费_通过java程序模拟实现地铁票价2+2=12