某2节点万兆网卡直连vSAN延伸群集(网络拓扑如图1所示),在某一天晚上,首选站点节点1服务器(图1中IP地址为192.168.251.2的计算机)的一条64GB内存出问题导致服务器死机。第二天管理员到单位之后,发现所有的业务虚拟机都无法使用。此时vCenter Server已经无法连接。使用vSphere Host Client可以直接登录到192.168.251.2、192.168.251.3、192.168.251.6等每台主机,但虚拟机的信息不正常,已经无法显示虚拟机的名称,另外vSAN存储容量只有其中一台主机的容量(每台主机配置了1个磁盘组,每个磁盘组有1块400GB的SSD、5块1.2TB的HDD,总容量是10.92T,现在只有5.46TB)。

图1 拓扑图

在关闭这三台服务器,然后打开服务器的电源之后,业务仍然没有恢复。后来检查发现,将IP地址为192.168.251.2的故障主机关闭,只打开IP地址为192.168.251.3与192.168.251.6的主机(包括见证虚拟机,IP地址为192.168.251.8),此时包括vCenter Server在内的所有虚拟机都自动启动并可以对外提供服务。如果此时再打开192.168.251.2的主机,则所有的虚拟机都会死机。为了不影响业务的办理,用户暂时关闭了192.168.251.2的主机。此时在vSphere Web Client中显示192.168.251.2无响应,主机已从VC断开连接,如图2所示。

图2 IP地址为192.168.251.2的主机已断开连接

在“监控→vSAN→虚拟对象”中,可以看到所有的服务器都提示“可用性降低但未重建”,如图3所示。因为此时首选站点节点主机不在线,系统无法重建冗余数据。

图3 虚拟对象

在“配置→vSAN→磁盘管理”中,看到192.168.251.2状态为“未响应”,见证主机与192.168.251.3的状态正常,如图4所示。

图4 磁盘管理

在关机之后,用户使用备用内存,更换了192.168.251.2这台主机的内存。

晚上下班之后,在不影响业务虚拟机使用的情况下,使用下述的方法修复了192.168.251.2的主机。主要方法与步骤如下。

(1)使用vSphere Web Client登录到vCenter Server,从清单中移除IP地址为192.168.251.2的主机。移除之后如图5所示。

图5 移除节点1的主机

(2)因为IP地址为192.168.251.2的主机无法上线,所以,将192.168.251.2的管理端口网线暂时断开,等服务器开机并进入控制台界面之后,按F2进入系统配置,在“System Customization”中移动光标到Reset System Configuration按回车键,在弹出的对话框再次按回车键重置系统配置,如图6所示。重置之后,系统将会重新启动,root密码重置为空(无密码)

图6 系统重置

(3)再次进入系统后,使用用户名root、密码为空登录。进入系统之后,为服务器重新设置管理IP地址、选择管理网卡,仍然使用原来的IP地址192.168.251.2、使用原来的网卡端口,并设置为原来的密码。然后重新插上服务器管理网卡的网线。

(4)在vSphere Web Client中,将192.168.251.2加入清单。参照192.168.251.1的网络设置,为192.168.251.2重新创建虚拟交换机,并为192.168.251.2的主机设置vSAN流量。如图7所示。

图7 重新配置vSAN流量

(5)此时在“群集→配置→磁盘管理”中,可以看到192.168.251.2的磁盘组已经添加,但状态不正常。如图8所示。

图8 重新加入的节点主机磁盘状态不正常

(6)使用ssh登录到节点1的ESXi主机,执行esxcli vsan network ip add -I vmk0 -T=witness命令将192.168.251.2的管理地址设置为见证流量。如图9所示。

图9 设置见证流量

(7)在“配置→vSAN→故障域和延伸群集”中,重新将IP地址为192.168.251.2的主机添加到“首选”站点,注意,两台节点主机,必须一台主机在“首选”站点,一台在“辅助”站点,其他名称都不行。如图10所示。

图10 配置故障域

(8)在“配置→vSAN→磁盘管理”中,可以看到192.168.251.2的磁盘组状态已经正常,如图11所示。

图11 磁盘组状态正常

(9)在“监控→vSAN→虚拟对象”中,看到大多数的虚拟机状态都恢复正常,只有一台虚拟机数据需要重建,如图12所示。

图12 查看虚拟对象

(10)在“监控→vSAN→重新同步组件”中,可以看到正在重新同步的组件,当前只有一个磁盘文件需要同步,如图13所示。

图13 查看重新同步组件

(11)在导航器中选中每台主机,在“监控→问题”中,检查确认当前主机的问题。

(12)在“监控→vSAN→运行状况”中,查看vSAN运行状况,在解决所有问题后,运行状态都是显示“已通过”,如图14所示。此时表示vSAN恢复正常。

图14 运行状况正常

【总结】这个故障现象比较特殊。正常情况下,如果节点主机出现故障,只要修复了节点主机并重新上线,vSAN会重新连接。很少出现vSAN主机都在线而导致虚拟机无法访问的情况。因为首选站点的主机上线就会导致vSAN群集出错,所以本次修复的关键就是在首选站点不在线的前提下重新配置首选站点。如果重新配置首选站点,可以重新安装ESXi,也可以重置ESXi然后再重新配置。本节就选择了第二种方法。

kvm上添加万兆网卡_某2节点万兆网卡直连vSAN延伸群集故障修复相关推荐

  1. vsan 延伸集群_某2节点万兆网卡直连vSAN延伸群集故障修复

    某2节点万兆网卡直连vSAN延伸群集(网络拓扑如图1所示),在某一天晚上,首选站点节点1服务器(图1中IP地址为192.168.251.2的计算机)的一条64GB内存出问题导致服务器死机.第二天管理员 ...

  2. kvm上添加万兆网卡_烂泥:为KVM虚拟机添加网卡

    本文首发于烂泥行天下. 前几篇文章介绍了有关KVM安装虚拟机以及如何给虚拟机添加硬盘,今天我们再来介绍下有关如何给KVM虚拟机添加网卡. 给KVM虚拟机添加网卡,可以分为两种形式:图形界面的和virs ...

  3. kvm上添加万兆网卡_部署kvm(二)

    6.管理KVM虚拟机 virsh list//查看 正在运行 virsh list --all//查看所有 id 名称 状态 centos7.3 running virsh start 名字 //启动 ...

  4. kvm上添加万兆网卡_万兆网卡使用经验总结

    遇到两台机器的万兆铜线网卡怎么也弄不通(万兆网卡的类型为:Intel Corporation 82598EB 10 Gigabit AF Network Connection),这种情况发生过几次了, ...

  5. 网页怎么在图片上添加文字_想给图片添加文字,留白,添加小印章?用手机三步搞定...

    如今越来越多的伙伴喜欢手机摄影,拍好的照片,还可以制作各种精美的图文,直接表达心情的同时,还能获得一片"赞"! 效果1: 图片下方留白+圆形印章 效果2: 图片上下方留白+椭圆形印 ...

  6. 网页怎么在图片上添加文字_抖音一天可见怎么添加文字-抖音一天可见添加文字文案方法介绍...

    抖音一天可见怎么添加文字?在抖音短视频app中,支持用户将自己的日常生活以日常一天可见的形式发布,那我们发布的一天可见视频,怎么添加文字文案呢,抖音一天可见怎么添加文字,下面就和小编一起来看看吧! 1 ...

  7. 在 echarts关系图动态线上添加文字_多折线堆叠图如何制作?

    润乾报表有丰富的图形展现效果,不仅自带了多种统计图形,还内置了第三方统计图形 D3 还有 echarts 统计图.最近好多客户提出想要实现多折线堆叠的统计图,我用自带的图形和 echarts 两种方式 ...

  8. gridview 在已有数据的基础上添加数据_基于Python的数据分析-1.语法基础(上)

    开篇 惯例:print('hello world') 运算符 比较运算符 返回类型为布尔值(True/False),多用于判断 数值运算符 顺序结构 代码按照顺序按行执行 判断结构 if 条件:代码块 ...

  9. 网页怎么在图片上添加文字_教你同时将图片水印和文字水印添加到视频画面

    随着剪辑软件的层出不穷,现在会制作创意视频的人越来越多.今天小编给大家分享一款剪辑软件--视频剪辑高手,以同时给视频添加图片水印和文字水印的效果为例,教大家如何操作. 编辑文字水印命令 勾选视频剪辑高 ...

最新文章

  1. Linux内核TCP/IP参数分析与调优
  2. 如何通过HBuilderX运行微信小程序,启动Enable IDE Service,X initialize 解决方案
  3. Fiddler抓取https的设置
  4. JavaScript 技术篇-通过代码获取dom元素绑定的监听事件,chrome浏览器查看js元素绑定的监听事件
  5. flex module不编译的问题
  6. 关于字符编码,你所需要知道的
  7. 智能运维监管系统终端_智能运维系列(十三)| 面向智能化运维的CMDB系统构建...
  8. 17 | 如何正确地显示随机消息?
  9. 全球权威MLPerf基准测试再发榜,浪潮AI服务器创18项AI性能纪录
  10. 我能想到的圆角背景的实现方法
  11. 每个Python程序员都应该有它。
  12. 如何使用jMeter对某个OData服务进行高并发性能测试
  13. 安卓boot.img文件详细介绍-解包,编辑,打包
  14. stm32 OV7670摄像头模块的介绍以及应用(SCCB的使用)
  15. 统计推断—参数估计—点估计、区间估计、t分布、Z分布
  16. SecureCRT创建串口连接
  17. 搜索习题-传教士与野人问题
  18. 推荐系统论文阅读:Entire Space Multi-Task Model
  19. Concatenated Multiples(串联倍数)
  20. 服务器怎么安装debian系统,图解Debian10Linux系统的安装步骤

热门文章

  1. DPDK多线程:EAL pthread和lcore Affinity(F-Stack配置文件的配置参数:lcore_mask、lcore_list)
  2. 没有为此文件配置应用程序上下文_如何在macOS中管理文件关联?
  3. Python项目实践:霍兰德人格分析雷达图
  4. OpenCV之图像的运算(笔记05)
  5. python中将字符变为大写_python如何同时把字符串大写变小写,小写变大写
  6. java webinf lib jar_java web项目中classes文件夹下的class和WEB-INF/lib中jar里的class文件加载顺序...
  7. mysql约束条件整型_MySQL 表的操作
  8. linux thread 状态检查,Linux下查看进程的线程 - pstree
  9. c语言学习进阶-C语言程序实现生成指定区间指定个数随机数
  10. c语言学习-输入一个十进制数,输出其对应的八进制数据