记录HP刀箱故障处理
刀箱是HP-C700,一共4个刀片、6个电源、2个VC、2个OA、2个FC,电源采用的是N+N的模式、OA、VC、FC采用的是高可用的模式,刀箱是我们单位测试环境。
端午前2天5号电源告警,查看时电源故障,安排厂商更换电源,本以为更换电源是小事,不会影响系统的使用,就更换了,可能是电源线有线路有问题,在更换电源的时候,导致刀箱宕机,虚拟机自动迁移,因内存资源有限,导致大面积的虚拟机出现宕机,当刀片恢复时,发现刀片的网络不通,登录到OA后查看日志,显示电源级别降低,其他没有告警,怀疑是刀箱自带的VC故障,没有日志显示VC故障,找到厂商排查故障,没有找到问题的点,日志收集拿到原厂分析也没有结论,把设备按照刀片、VC、OA、刀箱的顺序关机,把整个刀箱关机后等一会在重启,过程很长,故障依然存在。从现象上来看VC故障是最大的,登录VC没有任何问题的,没有报错,也怀疑是刀箱中板的问题,换刀箱这是最坏的打算。心理还是报有一丝希望的,总感觉问题要解决了。
经过反复的研究决定先把刀箱的降级处理,厂商发来的刀箱上有3个电源,加上本身有一个电源的备件,采用N+N的模式,刀箱的网络恢复了,折磨我们2天的故障解决了,告诉厂商在给配置2个电源,节后把其他的电源配置上。彻底解决硬件问题。
刀片网络恢复后,虚拟机的网络到网关不通,在同一个刀片里的虚拟机互相之间可以通,我们又排查了虚拟机、虚拟化平台的虚拟交换机,看不到任何问题。虚拟化平台时hyper-V,懂这个虚拟化产品的人不是很多,大多都是懂基本的操作,懂刀箱的人不懂虚拟化,懂虚拟化的人不懂刀箱,对于我懂交换机的只能考经验分析了,找人排查交换机上,导出备份,查看少了我们正常使用的网段,添加后,测试虚拟机的网络正常了。
写的可能没有突出此次故障处理中又多难,局限性多大,这是我到现在职业生涯中遇到的最大难题,也是不会忘记的,这次经历增加的我的人生阅历。
记录HP刀箱故障处理相关推荐
- HP刀箱无法识别刀片的处理方法
最近出差去实施一个项目,客户买了一个新的服务器,装在了两年前买的一个刀箱里.服务器无法启动,原因是新买的服务器版本较高,刀箱的版本低,不能支持新的服务器. 刀箱:C3000 新刀片:BL620C G7 ...
- 华为高性能服务器刀箱,云平台服务器刀箱
云平台服务器刀箱 内容精选 换一换 将外部镜像文件注册成云平台的私有镜像后,您可以使用该镜像创建新的云服务器,或对已有云服务器的系统进行重装和更换.本节介绍使用镜像创建云服务器的操作.您可以按照通过镜 ...
- IBM bladecenter H刀箱BladeCenter北电交换机VLAN配置
原创作者:运维工程师 谢晋 配置刀箱交换机 前提 环境说明 配置方法 交换机配置 配置新VLAN 配置端口 配置TRUNK组 前提 环境说明 客户有台刀箱交换机原先端口全放通,现需要对Vlan进行限制 ...
- HP存储P2000故障处理之管理IP丢失不能管理实例
在实际运维中,遇到一台HP存储P2000故障处理之管理IP丢失不能进入到管理页面,以下是实际处置过程. 当网络不能连接时,可采用1394线连接,方式如下: 1394线USB头接笔记本,另一头接存储的管 ...
- linux自动挂载fcoe存储,刀箱服务器上部署集群模式CloudOS挂载FCoE存储方法
1.通过iLO口检查,发现Boot to FCoE Target一项是enable的: 3.检查刀箱VC配置,确认该CloudOS节点的FCoE HBA卡的MAC地址: 4.进到该节点后台,用ip a ...
- HP superdome2刀片故障处理记录-实战篇
1.telnet控制台ip并输入用户名密码登录 2.消除黄色告警指示灯 OA-9C8E992A9825> show hr Health Repository - User Interface 2 ...
- 惠普微型计算机t628电源,HSTNS-PL18 DPS-750RB A 506822-201 750W HP服务器电源
HSTNS-PL18 DPS-750RB A HSTNS-PD18 512327-B21 511778-001 506821-001 506822-201开关电源 交换式电源供应器M ...
- 服务器硬件资源监控--PIGOSS BSM
方案背景 当前IT信息技术正处于高速发展状态中,底层平台的支撑离不开海量的物理服务器做为平台运行的载体.保障服务器的连续不间断运行在运维体系中是最为基础,也是最为重要的部分之一. 传统对于服务器的运维 ...
- HP刀片服务器系统Flex-10 VC配置与VMware vSphere网络设计
原文地址:http://delxu.blog.51cto.com/975660/932902 本文主要描述了HP C7000刀片服务器系统中的Flex-10 VirtualConnect模块的配置 及 ...
最新文章
- 【HDU】1284 钱币兑换问题 (想一想)
- 武汉首座无人驾驶电动汽车充电站投入使用
- vb6 数据自动生成excel文件_Excel随机生成数据
- 【612页】Android 大厂面试题及解析大全(中高级)
- linux c 线程属性 pthread_attr_t 简介
- 【最佳解法】剑指 Offer 32 - III. 从上到下打印二叉树 III
- Mongoose 预定义模式修饰符 Getters 与 Setters 自定义修饰符
- QAQ的幸运数字 数学
- java ibatis 获取执行的sql_阿里Java技术面开源框架面试真题曝光,这些真题你能答对多少?...
- AD教程系列 | 2-认识其他电子元器件的封装
- Base64---加密
- MATLAB怎么做出三叶玫瑰线,matlab复习题
- 0402 0603 0805 1206焊盘封装尺寸
- Unity3D中使用Leap Motion进行手势控制
- Qt项目移植出现的问题(No rule to make target ‘……’, needed by ‘……’. Stop.)
- Oracle存储过程实现X日均线计算
- zbb20180921 spring事物的七种事物传播属性行为及五种隔离级别
- py中lambda和apply的使用总结
- echart实现中国地图
- 【每日新闻】换脸视频后 AI又出偏门应用:用算法“脱掉”女性衣服
热门文章
- 【python爬虫专项(29)】链家二手房源数据采集2(深度信息采集)
- 路由和远程访问 连接被远程计算机终止,通过RRAS(路由和远程访问)进行PPPOE拨号连接总是出现连接接口时出现一个错误,连接被远程计算机终止...
- 76. Lotus Notes编程中的命名习惯
- 区块链,开启数字时代的金钥匙
- googletest简介
- leetcode 5607. 生成平衡数组的方案数 前缀和
- Unity 获取iPhone机型
- Contour 学习笔记(二):使用级联功能实现蓝绿部署和金丝雀发布
- IntelliJ IDEA File Header
- 【1024】写给最好的你-程序员