IBM SVC (2145-CF8) node脱机故障恢复分享
背景:
某客户一套SVC集群共6个node,其中一个node脱离集群,业务发生短暂切换后恢复正常。
(服务助手显示node1丢失)
处理步骤:
1、登陆SVC查看事件有1195代码的事件,即节点脱机超过30分钟。
查看SVC液晶面板,其余5个显示1195, 脱机节点显示 1203
(查看1203错误信息为 检查到FC通道有异常)
2、分别登陆SAN交换机查看4个端口的状态都不正常(MDS交换机,init状态),拨线发现都有光。
交换机端几乎不可能同时出两台交换机4个端口故障,光纤线同理,怀疑NODE的硬件有问题,接显示器查看 有 kernel panic!!显示无法操作!!
3、目前只能重启节点,拨除光纤线以及管理网线(避免启动过程中对其它节点造成影响),保留用于检测UPS的串口线。强接开机键关机,然后再开机。大约10分钟后SVC软件启动完成,提示如下:
4、将节点重新添加回去SVC集群,对业务基本无影响(成功的话,负载会切换部分到该节点,应用一般不会感知),添加时间一般不会超过30分钟。这些信息需要和客户交待清楚。一般直接插回光纤线和网线会,节点会自动加入SVC集群,但本次故障中,由于节点非正常挂死,导致不能自动添加回SVC集群。报错代码是578,脱机节点自动 恢复失败。点击该错误信息,运行修复过程
5、按要求除去节点的系统数据,注意一定在左上角确认节点信息,否帽后果严重!!(在服务助手进行如下操作。)
6、节点变成候选状态后,返回SVC 的管理GUI,点下一步,系统提示正在将节点重新添加到系统(一般30分钟内会完成,如30分钟后仍是该状态,点取消然后手动将节点加入)
7、选择“监控”-“系统,原来node所在的iogroup 会提示有个空槽,选择将候选节点加回系统,整个过程不会超过30分钟,一般几分钟就搞定了。群集状态正常后,切换到“性能”项,可以看到node1有业务读写 了。
最后,收集日志,“支持”,下载支持包,选第3个(常规则支持包+所有节点的当前状态)
转载于:https://blog.51cto.com/kakayang/1748226
IBM SVC (2145-CF8) node脱机故障恢复分享相关推荐
- RHEL7下使用iSCSI协议挂载IBM SVC V7000
1.iscsiadm -m discovery -t st -p 192.168.10.85 -m discovery 扫描并发现可用的存储资源,-t st 执行扫描操作的类型,-p 192.168. ...
- IBM ACE User Defined Node
说明 IBM ACE 前身为 IBM IIB 再之前为 WebSpere 的一部功能,版本 11 后称为 ACE (App Connect Enterprise) 图片来源 : https://iib ...
- IBM服务器专用无线键盘,经典老物分享:IBM UltraNav USB小型键盘
经典老物分享:IBM UltraNav USB小型键盘 2018-09-23 18:25:00 37点赞 46收藏 21评论 本人接触电脑比较早,家里购买的第一台PC应该88年的中国仿制的appleI ...
- v7000更换电池步骤_[原创]IBM V7000 SVC更换已经告警的UPS电池详细步骤
共73 条记录, 每页显示 50 条, 页签: [1] [2] 标题:[原创]IBM V7000 SVC更换已经告警的UPS电池详细步骤 1楼 admin 发表于:2017-11-9 13:37:32 ...
- IBM朱近之在软件渠道会上分享IBM智慧云计算
4月20日,第四届中国软件渠道大会在北京拉开帷幕,本次大会的主题是"给力2011,打造软件业"4S店,吸引了来自各软件领域的渠道商.ISV和专家学者的关注. 作为世界知名品牌,IB ...
- aix linux运维,运维老司机分享的八个AIX日常运维经验及案例
原文来自微信公众号:AIX专家俱乐部 [经验分享]在AIX启动时,打开debug模式 经常遇到aix无法启动,但又不知道pending在哪,因此打开启动过程的debug模式,对于诊断问题有很大的帮帮助 ...
- ibm aix_IBM AIX SAN Volume Controller更新和迁移
本文讨论了在更新或迁移到新的IBM SVC版本时要在AIX上执行的任务. 您可能正在从SVC V6.2.x更新到SVC V6.4.x,或者可能是从SVC V6.4.x迁移到新版本SVCV7.2.x. ...
- linux ibm 多路径,IBM V7000多路径解决
1.查看主机上光纤卡的WWN [root@test1 host2]# pwd /sys/class/fc_host/host2 [root@test1 host2]# cat port_name 0x ...
- 内置虚拟化,自动分层,重复数据删除,固态硬盘,IBM Storwize V7000亮点解析
最近IBM 新一代中端虚拟存储产品Storwize V7000在业内反响挺大,Storwize V7000是一款被IBM寄予厚望的产品,在发布这款新品之前,IBM特意为其制作了具有强烈神秘感的广告,并 ...
最新文章
- 第三章--数据链路层
- python3 类字符串名实例化对象
- js代码实现购物车效果
- HTML button 和 input type=“button”的区别 / input type=submit 和button的区别
- 精通 RPM 之查询篇
- JavaScript—获取参数(23)
- 亚信数据吴岸城:保险行业大数据应用
- java学生宿舍管理系统,来了就点个赞再走呗,即将毕业的兄弟有福了
- python自学1.2-运算符和表达式
- 精益管理研究院陈逸超 | 用精益思维创造数据价值金矿
- ESX4 安装前的考虑
- 定常系统(时不变系统)和时变系统
- 【python】numpy.percentile()函数
- 漫画 | 悲催的中国式软件开发
- 图像处理方面的一些期刊
- 三菱PLC编程-MOV指令
- shell-login-session-环境设置流程
- oracle ora 02437,给表追加主键-----报错ORA-02437: 无法验证 (DENGCHAO.TEST) - 违反主键
- Linux 挂载2TB以上硬盘
- #arcgis 中无法连接mdb数据库解决方法
热门文章
- [RMAN]控制文件的恢复
- Linux之mkdir命令
- Linux之file命令
- 黑客新技术在ATM钻洞就让其吐钱
- 《智能数据时代:企业大数据战略与实战》一2.3 自我评估、完善度、信息架构...
- 设置phpMyAdmin连接本机已存在数据库
- HTTP协议状态码详解(HTTP Status Code)(转)
- [Linux] Linux命令之pstree - 以树状图显示进程间的关系
- python缓存技术_高级Python技术:如何在Python应用程序中实现缓存
- 用python做数据分析教程_Python运用于数据分析的简单教程