微信公众号 VMware中国 在 2017-07-20 发布了一篇好文:《为何选择 HCI 以及为何要立即开始使用?》

为何选择 HCI 以及为何要立即开始使用?

随后,有一位销售同事(没看错,是销售,厉害吧)做了言简意赅的总结。基于他的总结,我做了一下扩展,选择超融合架构时,需要关心的问题:

1、是不是开放式架构么?硬件是否有更广泛的兼容性?用户不愿被硬件锁定;

2、是否能轻易的过度到双活架构?并具备成熟的备份、容灾方案?

3、是不是能和软件定义存储的控制平面无缝集成,为私有云奠定存储自动化的基础;

4、是不是真正做到了计算、存储和网络三个关键组件的融合?

基于vSAN的VMware Cloud Foundation(VCF)就能做到三者融合,使得用户购买的vSAN成为未来就绪的超融合架构;

5、是不是更长远的延展性,形成私有云乃至混合云的基础架构?

不久后VMware和AWS基于VCF的方案将推出,使有状态的业务负载在私有云和公有云之间在线漂移成为可能;

6、厂商是不是业内所认可的?技术是不是具有前瞻性?生态是不是成熟?这关系到数据能否长期、安全地存放;也关系到万一出问题是否有足够的专业人员来解决?

言归正传,下面介绍vSAN双活(也即Virtual SAN Stretched Cluster)。自从vSAN双活推出了,国内已经陆陆续续不少用户使用了,甚至有些用户在上面运行Oracle、ERP等关键应用。

下面的介绍分成三个部分:

1是青岛农业大学客观地介绍vSAN双活,乃至整个VMware SDDC(还包含了NSX)的优劣;2是vSAN 6.6双活新特性;3是vSAN双活的基本介绍,包含最小带宽的计算公式;

一、青岛农业大学 vSAN双活案例视频

这个存储双活的项目,其实VMware介入的比较晚,此前已经有存储硬件双活的方案推荐给用户了。得益于当地的VMware同事的推荐,用户从成本、管理等方面进行综合考虑,最终选择了存储软件双活也即VMware vSAN延伸集群。

青岛农业大学的老师在vForum 2016中国大会上亲自演讲:

class="video_iframe" data-vidtype="2" allowfullscreen="" frameborder="0" data-ratio="1.7647058823529411" data-w="480" data-src="http://v.qq.com/iframe/player.html?vid=l0347vk9z17&width=670&height=376.875&auto=0" style="display: block; width: 670px !important; height: 376.875px !important;" width="670" height="376.875" data-vh="376.875" data-vw="670" src="http://v.qq.com/iframe/player.html?vid=l0347vk9z17&width=670&height=376.875&auto=0"/>

二、vSAN 6.6双活新特性

更多vSAN 6.6的其他特性,参见 微信公众号 乐生活与爱IT 《vSAN 6.6十大特性的文档和视频》

vSAN 6.6十大特性的文档和视频

vSAN 6.6新增的23个特性中,最亮眼的几个之一,一定包含双活新特性。在此之前,大家知道,VMware只支持FTT=1,两副本分别存放在数据中心的两个不同站点。这样确实有不方便的地方,举个例子,A站点的H11出了故障,虚机就必须利用vSphere HA在B站点的H21上启动。如果在A站点本地还有冗余数据,就不用那么费神了。vSAN 6.6在双活上新的增强就解决了这个问题,不仅如此,还有更出色的表现。

在vSAN 6.6支持Failure Tolerance Method (缩写为FTM) 配置:

混合阵列和全闪存阵列都支持的是:跨站点做RAID 1 , 每个站点内做RAID 1;

仅全闪存支持:跨站点做RAID 1 , 每个站点内做RAID 5或RAID 6;

跨站点的冗余特性,对应的存储策略是Primary Failures to Tolerate (缩写为PFTT) ,它的值可以设置为1,或者为0。设置为1时,表示跨站点做镜像;设置为0时,表示只在一个站点上有副本,其使用场景后面会介绍。

站点内的冗余特性,对应的存储策略是Secondary Failures to Tolerate(缩写为SFTT),它的值可以设置为0到3。

1 - vSAN 6.6双活 之PFTT和SFTT

2 - vSAN 6.6双活 双重数据保护

这样,即使发生站点级故障时,剩余站点仍具本地的数据冗余,提高了可用性。以跨站点的RAID 1+本地的RAID 1,也即SFTT=1且PFTT=1为例,虽然一份数据共有4份副本,存储利用率只有25%。但针对关键业务应用,牺牲一些存储利用率,换取更高的可用性是非常值得的。而且,这个冗余特性是可以在vmdk这个级别来设置的,也就是说,一个虚机里,可以根据不同的业务特性,为不同的vmdk设置不同的冗余度。有不少其他HCI产品,副本个数必须在整个集群设置,就过于粗糙了,这样它只适用于单一的业务场景。

前面提到,PFTT还可以设置为0时,表示只在一个站点上有副本。它的使用场景包括,例如开发测试数据可能不需要在两个站点上都有副本;或者,已经使用应用冗余(Exchange DAG、SQL AlwaysOn等)的解决方案。需要注意的是,Oracle RAC不太一样,RAC使用的是共享存储,如果要全部层级高可用则需要在存储这一级做双活,vSAN做为分布式的共享存储,其双活技术是可以支持Oracle RAC。白皮书《Oracle Real Application Clusters on VMware Virtual SAN - REFERENCE ARCHITECTURE》上有更多细节。

微软Exchange DAG和SQL AlwaysOn,更像是服务器+JBOD存储,在虚拟化环境里也即虚机+vmdk的方式,两个JBOD存储之间做镜像。也就是说,在应用层,就实现了两份副本,这样就不需要存储层来跨站点做两份副本了。所以,针对这种场景,需将PFTT设置为0。SFTT设置为多少,看用户希望在本地站点得到怎样的冗余度。

在vSAN双活上部署DAG或AlwaysOn的时候,还需要注意Affinity的设置。有两个不同层次的Affinity,计算资源池对应的是vSphere DRS Affinity,而存储资源池对应的是由SPBM设置的,决定存储组件存放位置的,与vSAN双活特性相关的Affinity。

白皮书《Microsoft Exchange Server on VMware vSphere》,里面清楚地提到,为了防止两个DAG的虚机运行在同一个ESXi Host,也即防止单点故障,建议设置为DRS anti-affinity或者guest-to-host affinity。原文如下:

Allowing two nodes from the same DAG to run on the same ESXi host for an extended period is not recommended when using symmetrical mailbox database distribution. This condition will create a single-point-of-failure scenario if the two nodes have the only copies of one or more mailbox

databases. DRS anti-affinity or guest-to-host affinity rules should be used to mitigate the risk of running active and passive mailbox databases on the same ESXi host.

在vSAN 6.6双活的配置过程中,是在配置SPBM,也即存储策略时进行选择的。Affinity可选择的值有三个:None,Preferred Fault Domain(首选故障域),Secondary Fault Domain ,如下图。

3 - vSAN site Affinity

其实,Preferred 和Secondary Fault Domain在vSAN 6.1(也即首次推出双活技术的vSAN版本)时出现过。

4 - vSAN 双活 首选故障域

设计的原则是,Exchange VM #1的DRS affinity 规则和vSAN双活站点的affinity 规则设置成,让虚机和存储(也即vmdk对象)都在同一站点,如站点A上;Exchange VM #2的DRS affinity 规则和vSAN双活站点的affinity 规则设置成,让虚机和存储(也即vmdk对象)都在另外的同一站点上,如站点B。这两个虚机属于一个DAG,两个vmdk对象是同步的。

三、vSAN延伸集群(Stretched Cluster)基础知识

以下描述围绕着vSAN 6.1版来展开。

在业界为数不多的存储双活方案中,VMware在原有成本较高的存储硬件厂商提供的双活方案之外,提供了具有高可靠、低成本、更细颗粒度、操作更简单的软件双活方案– VSAN延伸集群。

VSAN延伸集群相当于一个VSAN集群横跨两个不同的站点,每个站点是一个故障域。和其他存储硬件的双活方案类似,两个数据站点之间的往返延时少于5毫秒(距离一般在100公里以内),另外还需要一个充当仲裁的见证(Witness)存放在不同于两个数据站点之外的第三个站点上。Witness不一定是物理服务器的ESXi主机上,也可以运行在第三个站点的虚机上,或者可以运行在公有云上,如国内的天翼混合云,或者AWSAzure、阿里云等。如下图所示,Witness所在站点与数据站点之间的网络要求较为宽松,往返延时在200毫秒以内,带宽超过100Mb/s即可。

5-VSAN 6.1支持软件双活,也即延伸集群(Stretched  Cluster

用X+Y+Z的形式表示延伸集群的主机情况,XYZ分别代表ABC站点的主机数,A和B都是数据站点,C站点放置见证主机。当前情况下,vSAN延伸集群可支持最小1+1+1个主机,最大15+15+1个主机。

而两个数据中心站点之间的带宽,在VMware网站和博客里建议的是10Gb/s,但实际上,只需要满足业务需求即可,这个需求就是:

Bandwidth(B) >  Write bandwidth(Wb) * Data Multiplier(md)*Resynchronization Multiplier(mr)

其中,Data mutiplier指数据倍数,包含了VSAN传输及其他相关操作的元数据开销。VMware建议设为1.4Resynchronization指重同步倍数,将可能的重同步的事件考虑在内。VMware建议规划带宽的时候,在最大带宽基础之上,额外预留25%,用于偶尔可能发生的重同步需求。也即,这个值建议为1.25。举例来说:

假设VSAN上工作负载为每秒10000个写操作,写IO大小为4KB,这就意味着写带宽为40MB/s,或者320Mb/s。这样网络带宽要求为:

B = 40MB/s * 1.4 * 1.25 = 70MB/s或者560 Mb/s

VSAN延伸集群结合vSphereReplicationVR)、SRM可以实现自动化更高、成本较低的两地三中心的高级容灾。同城之间,利用VSAN延伸集群提供数据的同步复制,异地之间,利用VR提供数据的异步复制。

6 - VSAN延伸集群结合VRSRM实现两地三中心高级容灾

VMware建议VSAN延伸集群在二层上部署组播,这样比较简单。如果部署在三层,有NSXVMware的软件定义网络)的支持,会如虎添翼,通过NSX实现跨站点的网络虚拟化,包括跨三层的二层网络延伸,全分布式网关,以及安全策略延伸,无需昂贵的私有的硬件交换机,即可实现L2 Extension,如OTVVPLSEVI等。

不过需要注意的是,VSANNSX本身是相互独立的,没有相互依赖的关系。

7 - VSAN延伸集群结合NSX

---End---

微信公众号平台"乐生活与爱IT"在目前阶段,主要是分享软件定义存储(SDS),及VMware VSAN相关的文章,偶尔也会分享虚拟化、云计算、大数据,甚至生活类的好文章。欢迎投稿,特别是原创文章,我的QQ号:9269216

投稿一经采用并发布,获得的赞赏收入,作者可获得60%。投稿可微信私信我,或者通过QQ号 9269216联系我。

欢迎对SDS感兴趣的朋友,加入软件定义存储讨论 QQ群:122295009,可下载原创的一些文章,及其他有参考价值的文档。可直接搜索群号,或者扫描如下二维码:


同时,欢迎您加入 "开放讨论群-SDS&虚拟化" 微信群,并邀请其他对SDS和虚拟化感兴趣的朋友加入此微信群。可以通过添加如下管理员之一的微信号,建议添加管理员时,告知你的公司名和姓名,方便备注保存。

sdg8848

libo9538

yangzhuan

dts0103

欢迎您通过扫描关注微信公众号:“乐生活与爱IT”。


关注后,可以通过点击左下角的文章目录,通过输入三位数(记住!是三位数,目前第一位是0或者1)详细了解如何查看历史文章。

打开 阅读原文 ,是文章《vSAN 6.6十大特性的文档和视频》

vSAN 6.6双活新特性 和 vSAN双活用户的演讲视频相关推荐

  1. jdk7新特性学习笔记

    jdk7新特性学习笔记 从网络down了视频看,记录下学过的东西. 1.二进制字面量 JDK7开始,可以用二进制来表示整数(byte,short,int和long),语法:在二进制数值前面加 0b或者 ...

  2. java lambda表达式详解_Java8新特性Lambda表达式详解

    课程目标: 通过本课程的学习,详细掌握Java8新特性之Lambda表达式: 适用人群:有Java基础的开发人员: 课程概述:从Java 8出现以来lambda是最重要的特性之一,它可以让我们用简洁流 ...

  3. Microsoft Tech Summit 2018 课程简述:利用 Windows 新特性开发出更好的手绘视频应用...

    概述 Microsoft Tech Summit 2018 微软技术暨生态大会将于10月24日至27日在上海世博中心举行,这也会是国内举办的最后一届 Tech Summit,2019 年开始会以 Mi ...

  4. 华为云GaussDB(for openGauss)推出重磅内核新特性

    摘要:华为云新一代金融级分布式数据库GaussDB(for openGauss)正式推出了Ustore存储引擎.基于Paxos协议的DCF高可用组件等多个重大内核新特性. 数字化时代,技术迭代更新比以 ...

  5. Java 14 中令人期待的五大新特性!

    随着新的 Java 发布生命周期的到来,新版本预计将于 2020 年 3 月发布,本文将对其中的 5 个主要特性作些概述. 作者 | Sylvain Saurel 译者 | 苏本如,责编 | 郭芮 出 ...

  6. Android O(SDK 8.0)新特性,刘海屏

    > Android刘海屏 Android 屏幕,16:9,17:9,19:10,18:9,18.5:9所谓全面屏.挖孔屏.凹凸屏等. android 全面屏/刘海屏有效适配- https://b ...

  7. HTML5新特性(基本)

    1.HTML5改进 (1)兼容性 核心理念:保持一切新特性平滑过渡 (2)实用性和用户优先 (3)化繁为简 2.HTML新特性 (1)减少了对外部插件的需求(flash) (2)更优秀的错误处理 (3 ...

  8. InterSystems IRIS哪些新特性让用户开发体验得到了极大提升?

    谈到开发体验,什么最重要?如何为客户提供更好的开发体验?InterSystems IRIS的最新版本有哪些新特性极大优化了用户的开发体验?这是本月"极客聊吧"的话题,我们计划通过上 ...

  9. 新浪微博客户端新特性滚动视图和启动界面实现

    使用过新浪微博客户端的童鞋都清楚,客户端每一次升级之后第一次启动界面就会有新特性的介绍,用户通过左右滑动视图可以查看新的特性,查看完最后一个特性之后就进入了主界面了.如果再一次启动程序的时候,就不会再 ...

最新文章

  1. 如何锻炼自己的抗干扰能力
  2. SecureCRT的上传下载小技巧(Linux)
  3. 云计算炒作多过采纳 普及仍需时日
  4. 【原创】MVC+ZTree实现权限树的功能
  5. 万博智云上云 单机软件升级多并发SaaS平台
  6. 分享一篇关于社区团购的竞品分析
  7. codevs3143 二叉树的序遍历
  8. 知乎 Hive Metastore 实践:从 MySQL 到 TiDB
  9. Python数据分析报告
  10. oracle用户互信失效,LINUX SSH互信与用户家目录权限
  11. 改变屏幕分辨率的小程序
  12. 豆瓣8.0分,尺度堪比色戒,一部让人绝望的电影
  13. ppt图片设计素材下载网站搭建模板
  14. 台湾省九齐NY8B062E与NY8B062D对比区别差异
  15. 虚拟机内存不足的问题
  16. OpenSees安装时出现问题
  17. 计算机网络原理【八】之 网络安全基础
  18. python怎么算二元一次方程_使用 Python 解数学方程
  19. IPETRONIK电动汽车热管理方案
  20. sqlmap注入教程linux,Linux Sqlmap检测sql注入漏洞工具安装使用教程

热门文章

  1. Forward与include的区别
  2. Pytorch+Python实现人体关键点检测
  3. 开发者可在WindowsCoreOS创建自己的应用了
  4. Infinity Cache是什么
  5. 操作系统实验--spooling技术
  6. oracle spool 分隔符_SPOOL 命令使用实例
  7. IM聊天教程:发送图片/视频/语音/表情
  8. N026_只根据转入和转出两列来画桑基图_巡线追踪
  9. Android模拟器Webview打开网页报webpage not available
  10. 360手机用鸿蒙系统,鸿蒙系统为什么只用在中低端的手机上?