刀箱是HP-C700,一共4个刀片、6个电源、2个VC、2个OA、2个FC,电源采用的是N+N的模式、OA、VC、FC采用的是高可用的模式,刀箱是我们单位测试环境。

端午前2天5号电源告警,查看时电源故障,安排厂商更换电源,本以为更换电源是小事,不会影响系统的使用,就更换了,可能是电源线有线路有问题,在更换电源的时候,导致刀箱宕机,虚拟机自动迁移,因内存资源有限,导致大面积的虚拟机出现宕机,当刀片恢复时,发现刀片的网络不通,登录到OA后查看日志,显示电源级别降低,其他没有告警,怀疑是刀箱自带的VC故障,没有日志显示VC故障,找到厂商排查故障,没有找到问题的点,日志收集拿到原厂分析也没有结论,把设备按照刀片、VC、OA、刀箱的顺序关机,把整个刀箱关机后等一会在重启,过程很长,故障依然存在。从现象上来看VC故障是最大的,登录VC没有任何问题的,没有报错,也怀疑是刀箱中板的问题,换刀箱这是最坏的打算。心理还是报有一丝希望的,总感觉问题要解决了。

经过反复的研究决定先把刀箱的降级处理,厂商发来的刀箱上有3个电源,加上本身有一个电源的备件,采用N+N的模式,刀箱的网络恢复了,折磨我们2天的故障解决了,告诉厂商在给配置2个电源,节后把其他的电源配置上。彻底解决硬件问题。

刀片网络恢复后,虚拟机的网络到网关不通,在同一个刀片里的虚拟机互相之间可以通,我们又排查了虚拟机、虚拟化平台的虚拟交换机,看不到任何问题。虚拟化平台时hyper-V,懂这个虚拟化产品的人不是很多,大多都是懂基本的操作,懂刀箱的人不懂虚拟化,懂虚拟化的人不懂刀箱,对于我懂交换机的只能考经验分析了,找人排查交换机上,导出备份,查看少了我们正常使用的网段,添加后,测试虚拟机的网络正常了。

写的可能没有突出此次故障处理中又多难,局限性多大,这是我到现在职业生涯中遇到的最大难题,也是不会忘记的,这次经历增加的我的人生阅历。

记录HP刀箱故障处理相关推荐

  1. HP刀箱无法识别刀片的处理方法

    最近出差去实施一个项目,客户买了一个新的服务器,装在了两年前买的一个刀箱里.服务器无法启动,原因是新买的服务器版本较高,刀箱的版本低,不能支持新的服务器. 刀箱:C3000 新刀片:BL620C G7 ...

  2. 华为高性能服务器刀箱,云平台服务器刀箱

    云平台服务器刀箱 内容精选 换一换 将外部镜像文件注册成云平台的私有镜像后,您可以使用该镜像创建新的云服务器,或对已有云服务器的系统进行重装和更换.本节介绍使用镜像创建云服务器的操作.您可以按照通过镜 ...

  3. IBM bladecenter H刀箱BladeCenter北电交换机VLAN配置

    原创作者:运维工程师 谢晋 配置刀箱交换机 前提 环境说明 配置方法 交换机配置 配置新VLAN 配置端口 配置TRUNK组 前提 环境说明 客户有台刀箱交换机原先端口全放通,现需要对Vlan进行限制 ...

  4. HP存储P2000故障处理之管理IP丢失不能管理实例

    在实际运维中,遇到一台HP存储P2000故障处理之管理IP丢失不能进入到管理页面,以下是实际处置过程. 当网络不能连接时,可采用1394线连接,方式如下: 1394线USB头接笔记本,另一头接存储的管 ...

  5. linux自动挂载fcoe存储,刀箱服务器上部署集群模式CloudOS挂载FCoE存储方法

    1.通过iLO口检查,发现Boot to FCoE Target一项是enable的: 3.检查刀箱VC配置,确认该CloudOS节点的FCoE HBA卡的MAC地址: 4.进到该节点后台,用ip a ...

  6. HP superdome2刀片故障处理记录-实战篇

    1.telnet控制台ip并输入用户名密码登录 2.消除黄色告警指示灯 OA-9C8E992A9825> show hr Health Repository - User Interface 2 ...

  7. 惠普微型计算机t628电源,HSTNS-PL18 DPS-750RB A 506822-201 750W HP服务器电源

    HSTNS-PL18  DPS-750RB  A   HSTNS-PD18  512327-B21  511778-001  506821-001  506822-201开关电源  交换式电源供应器M ...

  8. 服务器硬件资源监控--PIGOSS BSM

    方案背景 当前IT信息技术正处于高速发展状态中,底层平台的支撑离不开海量的物理服务器做为平台运行的载体.保障服务器的连续不间断运行在运维体系中是最为基础,也是最为重要的部分之一. 传统对于服务器的运维 ...

  9. HP刀片服务器系统Flex-10 VC配置与VMware vSphere网络设计

    原文地址:http://delxu.blog.51cto.com/975660/932902 本文主要描述了HP C7000刀片服务器系统中的Flex-10 VirtualConnect模块的配置 及 ...

最新文章

  1. 【HDU】1284 钱币兑换问题 (想一想)
  2. 武汉首座无人驾驶电动汽车充电站投入使用
  3. vb6 数据自动生成excel文件_Excel随机生成数据
  4. 【612页】Android 大厂面试题及解析大全(中高级)
  5. linux c 线程属性 pthread_attr_t 简介
  6. 【最佳解法】剑指 Offer 32 - III. 从上到下打印二叉树 III
  7. Mongoose 预定义模式修饰符 Getters 与 Setters 自定义修饰符
  8. QAQ的幸运数字 数学
  9. java ibatis 获取执行的sql_阿里Java技术面开源框架面试真题曝光,这些真题你能答对多少?...
  10. AD教程系列 | 2-认识其他电子元器件的封装
  11. Base64---加密
  12. MATLAB怎么做出三叶玫瑰线,matlab复习题
  13. 0402 0603 0805 1206焊盘封装尺寸
  14. Unity3D中使用Leap Motion进行手势控制
  15. Qt项目移植出现的问题(No rule to make target ‘……’, needed by ‘……’. Stop.)
  16. Oracle存储过程实现X日均线计算
  17. zbb20180921 spring事物的七种事物传播属性行为及五种隔离级别
  18. py中lambda和apply的使用总结
  19. echart实现中国地图
  20. 【每日新闻】换脸视频后 AI又出偏门应用:用算法“脱掉”女性衣服

热门文章

  1. 【python爬虫专项(29)】链家二手房源数据采集2(深度信息采集)
  2. 路由和远程访问 连接被远程计算机终止,通过RRAS(路由和远程访问)进行PPPOE拨号连接总是出现连接接口时出现一个错误,连接被远程计算机终止...
  3. 76. Lotus Notes编程中的命名习惯
  4. 区块链,开启数字时代的金钥匙
  5. googletest简介
  6. leetcode 5607. 生成平衡数组的方案数 前缀和
  7. Unity 获取iPhone机型
  8. Contour 学习笔记(二):使用级联功能实现蓝绿部署和金丝雀发布
  9. IntelliJ IDEA File Header
  10. 【1024】写给最好的你-程序员