今天一早接到客户电话,说单位内部分用户不能访问网络,我登录检查之后发现存储的一个控制器损坏导致,主要原因概述如下。

当前客户核心业务运行在vSphere虚拟化平台,该单位有3台HP服务器+1台IBM 3524存储,服务器与存储之间采用SAS接口连接,其中2台HP服务器使用SAS线连接到A控制器,另1台HP服务器使用SAS线连接到B控制器,服务器与存储之间无冗余连接。3台HP服务器安装ESXi 6.0配置成HA,所有虚拟机都保存在IBM 3524存储中,当A控制器损坏之后,前2台HP服务器丢失到存储的连接导致部分虚拟机不能启动,因为HA中损坏了2台服务器,HA失效。知道原因之后,让客户将其中1台HP服务器的SAS线连接到B控制器的空闲端口(当前IBM 3524有两个控制器,每个控制器有2个SAS接口,所以B控制器当前有一个端口空闲),将这台服务器重新启动,此时会有2台服务器可以正常工作,之后将业务虚拟机启动,此时单位应用暂时恢复。

在业务恢复之后,因为当前的存储已经过保,所以申请购买新的同型号的控制器,控制器到货之后更换损坏的A控制器,在更换的过程中又发现Slot 8的磁盘即将失效,在更换控制器后同时替换了即将失效的磁盘,下面介绍一下主要的过程与步骤。

(1)进入IBM DS Storage Manager管理软件,可以看到A控制器已经离线,同时有两块盘有黄色的五星符号,如图1-1所示。

图1-1 已经离线

【说明】当前示意图中Slot 3与Slot 8都有黄色的五星符号,其中Slot 3里面有一块磁盘,因为最初该盘位有点故障帮此盘位未分配到陈列中,故当前磁盘未分配未使用,但此磁盘是一块可用的磁盘,可以将其从盘位取出,放到其他需要的位置;而Slot 8分配为Array-2逻辑磁盘,该磁盘有数据丢失的风险。

(2)在"Recovery Guru"的进一步检查中,看到第8盘位的磁盘即将失效,有数据丢失的风险,如图1-2所示。

图1-2 slot 8磁盘

(3)将损坏的A控制器从存储中拆下,更换上新购置的控制器。

(4)在存储管理中,右击A控制器,在弹出的快捷菜单中选择"Advanced→ Place→ Online"将其置于在线状态,如图1-3所示。

图1-3 将控制器置于在线

(5)控制器处于在线状态,如图1-4所示。

图1-4 控制器在线

但控制器在线后,连接A控制器的服务器没有发现LUN,近一步检查发现A控制器的flash状态不对,如图1-5所示。

图1-5 A控制器的flash状态不对

估计控制器在快递过来的过程中,可能有颠簸或其他原因导致控制器中的SD卡(是一个8GB的高速缓存卡)松动,或者有问题。将新安装上的控制器设置为"离线状态",打开控制器,将原来损坏的控制器的SD卡插到新购置的控制器中。

(6)右击A控制器,在弹出的快捷菜单中选择"Advanced→ Place→ Offline"将其置于离线状态,如图1-6所示。

图1-6 将控制器置于离线状态

(7)在弹出的"Confirm Place Offline"对话框中单击"yes"按钮确认,如图1-7所示。

图1-7 确认设置为离线

(8)当控制器A处于离线之后,拆下控制器,如图1-8所示。然后换上原来损坏控制器的SD卡,重新插上控制器。

图1-8 控制器处于离线状态

(9)再次将控制器设置为在线状态,此时看到SD卡状态正常,如图1-9所示。

图1-9 控制器正常

此时连接到A控制器的服务器应该能发现存储分配的LUN,如果不能发现LUN,则可以在"Storage & Copy Services",右击LUN在弹出的快捷菜单中选择"Change→ Ownership/Preferred Path"选择"Controller in Slot A",如图1-10所示。

图1-10 更换LUN到A控制器

对于盘位8即将失效的磁盘,可以将其置于"Fail"然后用热备磁盘代替,然后在盘位8换上新的磁盘即可,主要步骤如下。

(1)右击Slot 8的磁盘在弹出的快捷菜单中选择"Advanced→ Fail",如图1-11所示。

图1-11 将磁盘设置为失败

(2)在弹出的"Confirm Fail Drive"对话框中输入yes然后单击"OK"按钮,如图1-12所示。

图1-12 确认设置

(3)右击Slot 6(这个盘位的磁盘是热备磁盘),在弹出的快捷菜单中选择"Hot Spare Converage",如图1-13所示。

图1-13 热备磁盘转换

(4)在弹出的"Hot Spare Drive Options"对话框中选择"Automatically assign drives",然后单击"OK"按钮,如图1-16所示。

图1-16 自动分配驱动器

(5)在"Replace Drives"对话框中将显示将Slot 8的失效的磁盘替换到Slot 6,如图1-17所示。

图1-17 替换驱动器

(6)返回到"Storage & Copy services"对话框,浏览LUN可以看到涉及到逻辑磁盘会重建,如图1-18所示。当时的时间是10点02。

图1-18 磁盘重建

(7)此时可以将盘位8的磁盘拆下,换上新的同容量的磁盘。等图1-18重构完成之后,盘位8的磁盘会被替换回来,如图1-19所示。此时盘位8的磁盘有个黄色的五星标志,而盘位6的有个红色的十字标志。

图1-19 替换磁盘

(8)在"Storage & Copy services"对话框浏览涉及到的LUN,可以看到状态变为"Copyback Progress data unavailable",当前时间是22:23分,复制过程进行了大约60%,如图1-20所示。因为在替换Slot 8的时间大约是上午10点,时间到现在大约过了12小时,以此计算,整个更换、替换磁盘所需要时间大约15小时。

图1-20 复制过程

(9)第二天早晨7点33分检查,复制进度已经完成,如图1-21所示。

图1-21 复制完成

(10)在"Hardware"选项卡中单击Slot 8,可以看到当前磁盘已经分配到Array-2,原来Slot 6仍然变为热备磁盘,如图1-22所示。至此整个维护完成。

图1-22 系统状态正常

IBM V3500存储更换控制器一例相关推荐

  1. IBM V3500存储更换控制器实例

    作者:王春海 今天一早接到客户电话,说单位内部分用户不能访问网络,我登录检查之后发现存储的一个控制器损坏导致,主要原因概述如下. 当前客户核心业务运行在vSphere虚拟化平台,该单位有3台HP服务器 ...

  2. IBM DS3500存储添加控制器

    作者:王春海 一次很详细的升级操作说明,非常值得参考学习,在运维工作中每次的新部署.升级或更改配置,都需要预先编写好技术文档预先编排好操作步骤避免实操过程的失误(忘.谎.乱),出现突发状况时有依据条理 ...

  3. oracle rac v3500_OEL6.X IBM v3500存储多路径配置

    本文是一次两台IBM x240安装OEL6.5x64连接IBM V3500存储多路径配置过程记录,当时用于安装Oracle 11g rac集群环境的. IBM v3500系列存储由于官方不再提供多路径 ...

  4. IBM V3500存储初始化,配置文档教程

    1.初始化系统,网线连接V3500存储和笔记本,配置笔记本IP. 2.登陆V3500用户名:superuser 密码passw0rd 是数字零不是o. 3.添加管理IP. 4.系统初始化成功 5.重新 ...

  5. IBM DS5020存储更换磁盘

    通过 SM 查看,确认已经坏的硬盘的物理位置 1.(特别要注意一定不要弄错坏硬盘的物理维护,如果拔错硬盘,可能引起灾难性后果.) 2.确认RAID level (注意:更换硬盘的时候,更换上去的硬盘最 ...

  6. 联想v3500存储Linux配置手册,OEL6.X IBM v3500存储多路径配置

    5. 根据udev号码创建multipath配置文件 配置文件如下: [root@node1 ~]# cat /etc/multipath.conf defaults { user_friendly_ ...

  7. IBM V3500存储恢复步骤实例(linux)

    本环境是一有台IBM3500存储,将存储挂载至linux的/data目录,模拟测试当主服务器挂了,将数据恢复到另一台服务器,存储有两个地址,我配置的是192.168.80.59是用于web管理,192 ...

  8. IBM V5000E存储更换故障硬盘

    把故障硬盘把下来,换上新的硬盘,状态是备件,mdisk阵列报错没有足够的热备,已降级. 因为做的是分布式raid5,热备盘是平均分配到块盘上,所以备件状态,运行修订时找不到这块盘 新换的硬盘一定要是候 ...

  9. 《深入学习VMware vSphere 6》——1.6 IBM V3500存储配置

    本节书摘来自异步社区<深入学习VMware vSphere 6>一书中的第1章,第1.6节,作者:王春海著,更多章节内容可以访问云栖社区"异步社区"公众号查看 1.6 ...

最新文章

  1. 【转】OpenGL随笔(1)—— mipmap 详解
  2. 这篇文章让我步入了无线时代,感激原创。
  3. MySQL学习笔记(十二)—— MySQL的命令集(2)
  4. oneday2mybatis下载
  5. CS中mdl文件的解析
  6. HUSTOJ平台的搭建
  7. 英飞凌TC297 PSPR与DSPR
  8. 计算机组成原理什么是模,计算机组成原理中字、位元组、位各指什么?单位用什么表示?...
  9. 人工智能项目案例:AI+企业智能化管理
  10. 汽车芯片严重短缺,价格全线上涨,“缺芯”仍将延续
  11. exchange创建邮箱组_Exchange批量创建用户组及启用通讯组邮箱
  12. 小米商城——HTML,CSS(附:源码)
  13. 微信小程序完成简单的模仿抖音点赞效果动画wx.createAnimation
  14. 谈谈传递闭包以及自己杂想
  15. 京东股权众筹投后总结和反思
  16. html 删除事件,HTML DOM removeEventListener() 方法
  17. Android实现第三方登录并获取到头像、名字
  18. 安全漏洞之Log4j2漏洞复现绕过分析
  19. SEO菜鸟之笨鸟先飞
  20. el-table 选择列合计,fixed固定某列,合计行放在表格上方,设计合计行样式

热门文章

  1. openwrt nas_NAS里整个软路由
  2. c语言 冒泡排序算法,排序算法_冒泡排序改进(c语言实现)
  3. python获取请求中的参数_python – 在Tastypie中获取请求参数
  4. 在 vue/cli 中使用 Module Federation
  5. linux程序没有对日志文件写的权限_好程序员云计算培训分享Linux文件权限简单说明...
  6. 体重 年龄 性别 身高 预测鞋码_孩子身高低于同龄人就说明发育迟缓?这个简单公式可以算出来...
  7. linux 下的igv软件,Linux IGV 自动画图 -- for 自动化报告
  8. 怎么搭建服务器集成环境配置文件,怎么搭建服务器集成环境配置文件
  9. php动态柱形图,php生成柱状图(统计图)程序
  10. javax maven项目缺少_maven冲突解决流程