作者:范军 (Frank Fan) 新浪微博:@frankfan7

Stretched Cluster是一把双刃剑,会用的如行云流水,用不好反而受其限制。

传统的vSphere Cluster是指一个Cluster内的所有ESXi主机都在一个物理机房内。Stretched Cluster顾名思义是把Cluster的概念扩展到了不受物理位置的限制。主机可以是在同一个数据中心的不同物理机房,甚至可以分布在不同城市的数据中心。听上去很酷吧,

是否采用Stretched Cluster需要缜密的评估和设计。以下三个步骤可以帮助你理清思路。

一 明确想要什么?

容灾的大概念很模糊,每个人可能都有不同的理解。所以我们需要对以下几个名词吃透。

Disaster Recovery

在一个数据中心的应用意外中断后,在另外一个数据中心把该应用恢复。目的是在Infrastructure层出现大到故障的时候,应用可以在短时间内恢复,尽量减小影响。

Disaster Avoidance

通常指采用主动的措施来避免可能发生的应用中断。比如计划内的机房断电、飓风来袭,地震预警等等。在灾难发生之前,把应用从可能受影响的数据中心切换到另外一个安全的数据中心。在切换过程中可能有短时间内的服务中断。

Downtime Avoidance

与Disaster Avoidance不同,Downtime Avoidance更注重的是不能有服务的中断,不能有数据的损失。这也是vMotion和Storage vMotion大显身手之处。

Active Site Balancing

如果一个数据中心或者是Cluster专门为容灾而建,那么必须保证在灾难来临时有充足的空闲资源。很可能99.99%的时间内大量资源是闲置的。我们不希望灾难发生,可也希望能更有效的利用资源。怎么办?

Active Site Balancing指有效利用所有数据中心的所有资源,尽量避免资源闲置。

下图基于以上四个方面,对Site Recovery Manager 和 Stretched Cluster进行了比较。原文见此链接

如果你明确了Downtime  Avoidance和Active Site Balancing是你最最关注的方面,那么比起SRM来说,Stretched Cluster可能更好的满足需求。

二  评估是否满足先决条件

数据中心之间的距离在100KM之内

在两个数据中心内都可以访问扩展的二层网络。数据中心之间的网络延时(latency)<10ms

存储设备支持。查HCL。EMC VPLEX是支持的。我们后文详述。

其他细节见此文vSphere Metro Storage Cluster solutions, what is supported and what not? 链接

三 可能带来的影响

在方案设计中要解决好下面的问题:

Site Affinity

在数据中心A的主机仅仅能够访问本地的存储设备,对于数据中心B的主机,同理亦然。因为访问本地的速度快、可靠性高。

Failover Scenario

对所有可能出现中断的组件,都要验证中断的后果。比如有以下情形:

单个ESXi宕机、多个ESXi宕机、整个机房ESXi宕机、单个ESXi网络中断、数据中心之间用于存储同步的网络中断(StoragePartition)、数据中心之间二层网络中断(DataCenter  Partition)、存储阵列磁盘损坏、整个存储阵列宕机、整个数据中心中断

Operational Process

Stretched Cluster是高端技术,的确能解决不少问题。可有一点往往被人们忽视,就是其根本上是依赖于vSphereCluster的底层技术来支撑的。 vShpere Cluster本身有很多特性,比如vMotion,HA等等很不错,同样也有一些力不从心之处。比如在当数据中心A全面中断后,vSphere HA把虚拟机在另外一个数据中心B重新启动。启动顺序是无法保证的。而VMware SRM有完善的DR计划保证满足预先设计的启动顺序。

不能因为有Stretched Cluster就认为完事大吉,需要有严密的OperationalProcess来验证虚拟机极其支持的应用能够正常恢复。

参考:

VMwarevSphere Metro Storage Cluster Case Study

Implementing vSphere Metro Storage Cluster(vMSC) using EMC VPLEX

StretchedClusters and VMware vCenter Site Recovery Manager

vSphere Metro Storage Clustersolutions, what is supported and what not?

vSphere 5.0 HA and metro /stretched cluster solutions

【虚拟化实战】容灾设计之三Stretched Cluster相关推荐

  1. 从数据仓库双集群系统模式探讨,看GaussDB(DWS)的容灾设计

    摘要:本文主要是探讨OLAP关系型数据库框架的数据仓库平台如何设计双集群系统,即增强系统高可用的保障水准,然后讨论一下GaussDB(DWS)的容灾应该如何设计. 当前社会.企业运行当中,大数据分析. ...

  2. HCIE-Cloud Computing LAB备考第二步:实战解题–第五题:论述一--双活容灾设计--记忆宫殿

    文章目录 题目 解法 记忆宫殿 存储链路要求 存储业务网络链路 存储复制网络链路 仲裁网络链路 VRM要求 主机要求 存储要求 对比法 存储业务网络链路和存储复制网络链路 VRM和主机要求 提炼法 题 ...

  3. 【虚拟化实战】存储设计之一存储类型

    Problem Statement 存储设计是虚拟化设计的重要部分之一,确定合适的存储类型是展开存储设计的关键一步. FC/FCoE, iSCSI, NFS 甚至 Local Storage,  你会 ...

  4. 【虚拟化实战】VM设计之一vCPU

    作者:范军 (Frank Fan) 新浪微博:@frankfan7 虚拟机需要多少个vCPU呢?是不是个数越多性能越好呢?这方面存在着很多误区.给VM配置CPU资源的时候,要精打细算才能最大可能的利用 ...

  5. 【虚拟化实战】存储设计之七Block Size

    作者:范军 (Frank Fan)新浪微博:@frankfan7   微信:GetToCloud 在实战存储设计之六Latnecy我们介绍Latency过高的原因和一些建议.本文重点分析Block S ...

  6. 【虚拟化实战】存储设计之二LUN Sizing

    作者:范军 (Frank Fan) 新浪微博:@frankfan7   微信:frankfan7 我们经常在FC存储设计中常问的是:LUN多大合适,一个LUN能最大支持多少个虚拟机? 在存储扩容时常见 ...

  7. 谈谈双活业务中心和异地容灾备份设计

    点击下方公众号「关注」和「星标」 回复"1024"获取独家整理的学习资料! 今天谈下多数据中心和异地容灾备份方面的内容.在前面一篇文章里面我详细谈到过一个软件业务系统的高可用性设计 ...

  8. 肇庆市地方税务局采购容灾备份系统

    采购项目内容 一.项目概况 本项目为广东省肇庆市地方税务局采购容灾备份系统项目.肇庆市地税局目前拥有车船税征收管理系统.社保费对账系统.存量房交易计税价格评估系统.固定资产管理系统.绩效管理系统.涉税 ...

  9. 微信技术分享:微信的海量IM聊天消息序列号生成实践(容灾方案篇)

    1.引言 在本文的上篇<微信技术分享:微信的海量IM聊天消息序列号生成实践(算法原理篇)>中介绍了微信的消息序列号生成器 seqsvr 的算法原理.架构核心思想,以及 seqsvr 随着业 ...

最新文章

  1. 即时编译和提前编译_即时编译说明
  2. ASA用ASDM管理时报unable to launch device manager xxx.xxx.xxx.xxx
  3. #pragma execution_character_set的意义
  4. NUXT 入门第一课: 关于 Nuxt.js
  5. linux执行bz文件,Linux下解压bzImage为vmlinux
  6. 今日直播 | 全国高校人工智能人才与科技莫干山论坛直播来袭!
  7. boost::hana::nothing用法的测试程序
  8. mysql applicationcontext.xml_配置applicationcontext.xml文件
  9. 05-UIDynamic
  10. c语言国家二级培训机构,国家计算机二级C语言培训教案.doc
  11. sas table将缺失值计入百分比_SAS系列28:SAS宏语言(一)
  12. 在 Mac 上打开照片应用时遇到错误 4302,如何修复?
  13. Spring Boot 2.3 优雅停机来了,新特性真香!!
  14. 无法使用SQL login去登陆SQL Server - 'Password did not match'
  15. Linux brctl 详解
  16. 微信营销为什么需要云控
  17. 生态功能区划方法之二:生态服务功能重要性评价
  18. 阿里云邮推定制版 首创按量计费模式
  19. 阿波罗java_携程Apollo(阿波罗)配置中心的Java样例客户端启动和调试
  20. 五子棋网络对战 java实现

热门文章

  1. android studio butterknife自动生成,Android Studio使用ButterKnife和Zelezny的方法
  2. 彩虹物语服务器维护,11.19《彩虹物语》服务器维护及数据互通公告
  3. 编写运行tomcat后出现中文乱码的情况
  4. 在图片中如何生成带有文字边缘空心字体?
  5. 关于“航天•轻舟机器人国赛技术交流会”邀请函
  6. 磁棒 锰锌铁氧体高频磁条22x5x3mm,作为天线性能测试
  7. 2021年春季学期-信号与系统-第八次作业参考答案-第一小题
  8. 七分结构三分代码-直立车想节能
  9. python字典怎么排序_如何对python的字典进行排序
  10. python自动化接口测试中的cookies怎么实现_Python接口自动化之cookie、session应用