豆子使用学习windows 2012 Hyper-V的集群大概半年多了,这阶段看了很多人的博客,自己也搭建过实验环境,最后工作环境中也搭建了一个,但是直到上周,才发现双节点集群的在高可用方面的限制性。

上周末,豆子需要升级 Hyper-V 节点的firmware,心里想的很简单啊,首先做个live migration把虚拟机都挪到另外一个节点,然后关机,升级firmware,开机,另外一台主机上重复以上操作。但是呢,事实和豆子考虑的是有出入的~~  第一台主机成功升级了,但是操作第二台的时候,悲剧发生了,尽管SCVMM的migration操作显示成功了,但是当我关机以后,集群上面所有的VM都一起歇菜了~ 最开始 我以为是SAN的问题,因为我并不是使用传统的共享SAN,而是通过starwind软件把本地硬盘强行模拟成共享SAN,后来在另外一个实验环境里面使用了共享SAN,居然也发现了同样的问题,最后终于发现这个事故的罪魁祸首是Witness Disk的局限性造成的。

http://technet.microsoft.com/en-us/library/cc770620(v=ws.10).aspx

配置witness disk有4种模式,如下所示。

  • Node Majority: Each node that is available and in communication can vote. The cluster functions only with a majority of the votes, that is, more than half.

  • Node and Disk Majority: Each node plus a designated disk in the cluster storage (the “disk witness”) can vote, whenever they are available and in communication. The cluster functions only with a majority of the votes, that is, more than half.

  • Node and File Share Majority: Each node plus a designated file share created by the administrator (the “file share witness”) can vote, whenever they are available and in communication. The cluster functions only with a majority of the votes, that is, more than half.

  • No Majority: Disk Only: The cluster has quorum if one node is available and in communication with a specific disk in the cluster storage.

当初我也没怎么考虑,直接用的是软件的自动最佳配置,我使用的是Nodes and Disk majority。经过分析,如果我只有2个节点和1个witness disk,那么总共有3票(votes),任何时候如果有2票通过,那么集群就会正常运作。很不幸的是,witness disk总是位于其中一台节点上的,如果刚好是这台主机重启,那么就意味着有2票同时都没了,cluster会立刻紊乱,上面的虚拟机自然也就会出现各种异常,自动关机了。如果是那台没有witness的主机重启,剩下还有2票工作,自然是没有问题的,这就是为什么豆子的第一个操作是成功的,而第二个却失败了。

那怎么解决这个问题呢,按照这4个配置选项,我可以使用选项3 Node and File Share majority,重新找个服务器,上面设置共享,这样一来,因为这个共享文件始终在线,任何一台主机重启,都能保证2个投票,那肯定是一直工作的;或者呢,豆子有钱的话,在现有的集群里面再安装一个节点,那么可以使用选项1 Nodes Majority以便保证2个投票;如果更有钱,能够安装一共4个节点的集群,那么才可以使用Node and Disk Majority。

这些选项考试和配置实验的时候豆子都遇见过,可是当时都没在意,考试嘛很容易就过了,实验默认配置啊 Failover, Live Migration好像也都工作。不少老师前辈的博客实验一般也是搭建个双节点的集群,貌似也就测试一下live migration就表示实验成功。

不足之处 欢迎拍砖!

Hyper-V 2节点集群高可用的限制相关推荐

  1. 【kubernetes】k8s集群高可用部署安装和概念详细说明【含离线部署】,客户端连接haproxy访问高可用流程

    文章目录 说明 高可用原理 K8S多master节点架构图 测试环境说明 部署高可用 安装包准备[可选] 高可用架构说明 配置haproxy 说明[必看] 安装haproxy 编辑配置文件 配置etc ...

  2. redis进阶持久化、事务、主从复制、集群高可用

    一.redis持久化 1 Rdb方式 Rdb方式一般为redis的默认数据持久化方式.默认开启,是通过手动(save-阻塞式,bgsave-异步)或周期性方式保存redis中key/value的一种机 ...

  3. PostgreSQL HA集群高可用方案介绍 pgpool-II+PostgreSQL HA方案部署

    PostgreSQL HA集群高可用方案介绍 & pgpool-II+PostgreSQL HA方案部署 一.PostgreSQL HA集群高可用方案介绍 二.pgpool-II+Postgr ...

  4. SpringCloud(第 051 篇)EurekaServer集群高可用注册中心以及简单的安全认证

    SpringCloud(第 051 篇)EurekaServer集群高可用注册中心以及简单的安全认证 - 一.大致介绍 1.前面章节分析了一下 Eureka 的源码,我们是不是在里面注意到了 Peer ...

  5. golang检查tcp是否可用_宕机处理:Kubernetes集群高可用实战总结

    导语 | 在企业生产环境,Kubernetes高可用是一个必不可少的特性,其中最通用的场景就是如何在Kubernetes集群宕机一个节点的情况下保障服务依旧可用.本文对在该场景下实现集群和应用高可用过 ...

  6. Hadoop集群高可用及zookeeper+kafka组件搭建

    目录 一.Hadoop集群高可用 1.Zookeeper概述 1)Zookeeper基本概述 3)Zab协议 3)observer 4)zookeeper集群图例 2.zookeeper集群搭建 3. ...

  7. mysql-mmm 集群高可用软件介绍

    mysql-mmm 集群高可用软件介绍 MMM即Master-Master Replication Manager for MySQL(mysql主主复制管理器)    关于mysql主主复制配置的监 ...

  8. 让数据库无惧灾难,华为云GaussDB同城双集群高可用方案正式发布!

    摘要:在华为全联接2021期间,华为云GaussDB(for openGauss)正式推出重大内核新特性--同城双集群高可用方案,提供金融级高可用服务,支持RPO=0 .RTO<60s的同城双集 ...

  9. 宕机处理:Kubernetes集群高可用实战总结

    导语 | 在企业生产环境,Kubernetes高可用是一个必不可少的特性,其中最通用的场景就是如何在Kubernetes集群宕机一个节点的情况下保障服务依旧可用.本文对在该场景下实现集群和应用高可用过 ...

最新文章

  1. MySQL下mysql.sock丢失问题的解决[ubuntu, linux, mysqld.sock]
  2. MySQL 语句外键 连接
  3. Web前端开发笔记——第二章 HTML语言 第四节 超链接标签
  4. 用CSS让DIV上下左右居中的方法
  5. CoreJava学习第五课 --- 进入第二阶段:面向对象编程思想
  6. python 添加数据库表_通过时间表(Python库)简化复杂的计划
  7. 蓝桥杯 ALGO-58 算法训练 字串逆序
  8. 【Oracle】Oracle GoldenGate简介及搭建过程
  9. 特征检测和特征匹配方法汇总
  10. LINUX下调节屏幕亮度(Intel核显)-续
  11. python爬取网易付费音乐包_爬取网易云音乐“三部曲”(三):轻松下载网易音乐歌曲!...
  12. 使用meshBaker合并多个mesh进行优化
  13. 车马邮件都慢,一生只够爱一个人
  14. 【Opencv综合应用】自制训练集的人脸识别2——制作csv文件
  15. [Azure]经典模式下关于云服务配置多个VIP的使用说明
  16. uniapp——操作成功返回首页
  17. php导出excel表格 打不开,phpspreadsheet 导出的EXCEL 文件打不开
  18. 技术团队如何开展团队分享
  19. win10下修改rabbitmq默认端口
  20. NCH Eyeline Video System

热门文章

  1. SAP MM ME1M报表结果不科学?
  2. AI研究员收集NLP数据的四种创意方法(大牛分享)
  3. 人工智能改进传统云ERP的10种方法
  4. 控制流分析-自然循环识别
  5. 数字孪生:连结现实与数字世界
  6. 2019与下一个十年:我们将要放弃的和将要拥抱的
  7. 科技创新2030---“新一代人工智能”重大项目2018年度项目申报指南征稿
  8. 理性解读中国科技实力:不震惊式吹捧,也不全盘抹杀
  9. 无人驾驶急需解决:规划控制和传感器价格高两大问题
  10. 消费机器人今年爆发!四大品类瓜分百亿蛋糕