dell 7525 raid50 单盘故障,无法自动重建问题

{1}生产故障表现

单块raid5中,某块磁盘出现故障,raid出现降级,重建插入后,查看磁盘状态,未进入自动重建状态。

{2}生产环境描述

生产环境下,dell 7525 服务器挂载8个megaraid控制器,每个控制器包含84块盘,84块盘组raid50(先组raid5,后组riad0), 单个控制器一共14组raid5,每组riad5 6块磁盘 ,a3控制器下,EID 512 SID 18盘出现问题,进行更换。

{3}问题分析

<1>安装megacli64

查看官网,megarcli是LSI 公司的针对scsi卡的管理工具,LSI公司涉及的产业较广,基本围绕在服务器内部线缆,如SAS SATA, NVME PCIE线缆,SAS交换机,各类SAS,SATA 芯片, 本次生产环境使用的为 SAS 3508 sas raid芯片,目前已被博通收购,针对此类sas 或raid操作,dell 有perccli64, 或者storcli64,个人感觉都是在megacli 上换了皮肤,建议还是使用原本的工具较好。
LSI官网

找到对应的rpm包,本次使用centos 系统,直接安装即可
rpm -ivh Lib_Utils-1.00-09.noarch.rpm
rpm -ivh MegaCli-8.04.07-1.noarch.rpm
安装结束在安装部分依赖库
yum install libncurses* -y

注意: 由于安装包没有debain的 deb,若在ubuntu上跑起来,需要利用alien进行rpm到deb的转换,官方也有说明,并且ubuntu要安装依赖库, apt-get install libncurses5 -y

软件默认安装在 cd /opt/MegaRAID/MegaCli/
cd /opt/MegaRAID/MegaCli/
./MegaCli64 pdlist -aAll | more

<2>问题定位

#查看所有控制器信息
./MegaCli64 -AdpAllinfo -aAll | more
#查看问题控制器信息
./MegaCli64 -LDInfo -L0 -a3

#查看问题控制器下磁盘丢失信息
./MegaCli64 -PDGetMissing -a3

#定位问题磁盘的EID UID
粗过滤问题硬盘
./MegaCli64 -PDList -a3| grep -Ei “(Firmware state)”

#带上eid 和sid进行问题磁盘定位
./MegaCli64 -PDList -a3| grep -Ei “(Enclosure Device|Slot Number|Raw Size|Firmware state)”

<3>开始恢复

更换问题磁盘为新磁盘后,未进入自动重建状态
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:18] -a3
查看问题硬盘固件状态为ugood, Spun Up, Foreign State为None
因此无需进行硬盘make good和 Spun Up操作,由于Foreigh State不为Foregin,无法进行强制Foregin import操作
./MegaCli64 -pdInfo -PhysDrv[251:18] -a3 | more

尝试对硬盘进行下上线操作,均失败
./MegaCli64 -PDOffline -PhysDrv[251:18] -a3 #硬盘卸载(下线)
./MegaCli64 -PDOnline -PhysDrv[251:18] -a3 #硬盘装载(上线)
#尝试手动重建,失败
./MegaCli64 -pdrbld -Start -physdrv[251:18] -a3

最后尝试添加热备的方式(热备恢复指定的问题槽位硬盘,指定成功后立即进入重建状态),显示当前状态无法进行热备操作
#添加热备
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3
经过排查,发现硬盘处在初始化状态
#查看磁盘初始化进度
./MegaCli64 -PDClear -ShowProg -physdrv[251:18] -a3
扫描和清除之前磁盘的外部配置信息(如之前残留raid配置)
./MegaCli64 -cfgForeign -Scan -a3
./MegaCli64 -cfgforeign -clear -a3
关闭磁盘初始化进程,再次进行热备操作
./MegaCli64 -PDClear -Stop -physdrv[251:18] -a3
#再次进行热备操作
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3
磁盘已进入重建进程,查看重建进度
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3

{4}问题总结

本次无法自动重建原因可能是硬盘插入后进入初始化状态,若想快速进入重建状态,需先查看当前磁盘是否有在做其它操作(如初始化,重建,热备等) 关闭硬盘的所有操作,再次利用热备的方式进行快速恢复,做热备恢复前一定要保证硬盘无其它raid信息,还有一种恢复的方式是重建一个radi50,将新磁盘也添加进来,慎用,风险较大,本次生产环境磁盘数据量巨大,未敢尝试!!!!!

{5}相关命令附录

硬盘事件
./MegaCli64 -AdpEventLog -GetEventLogInfo -a3
./MegaCli64 -AdpEventLog -GetEvents -info -a3
配置文件
./MegaCli64 -CfgSave -f a3.cfg -a3
./MegaCli64 -CfgRestore -f a3.cfg -a3
#查看虚拟磁盘信息
./MegaCli64 -LDInfo -Lall -aAll | more
./MegaCli64 -LDInfo -L0 -a3 | more
./MegaCli64 -LdPdInfo -a3
./MegaCli64 -GetBbtEntries -Lall -a3
./MegaCli64 -PDGetNum -a3
./MegaCli64 -LDGetNum -a3
./MegaCli64 -PDList -a3| grep -Ei “(Enclosure Device|Slot Number|Raw Size|Firmware state)”
./MegaCli64 -PDList -a3| grep -Ei “(Firmware state)”
#硬盘状态相关操作
./MegaCli64 -pdInfo -PhysDrv[251:18] -a3 | more
./MegaCli64 -PDOnline -PhysDrv[251:18] -a3
./MegaCli64 -PDRbld –Start -PhysDrv[251:18] -a3
./MegaCli64 -PDGetMissing -a3
./MegaCli64 -PDReplaceMissing -PhysDrv[251:18] -Array1 -Row4 -a3
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:75] -a2
#显示硬盘框信息
./MegaCli64 -EncINfo -a2 | more

#查看丢失磁盘信息
./MegaCli64 -PDGetMissing -a3
#清理之前磁盘的残留的raid信息 (a3对应控制器4)
./MegaCli64 -cfgForeign -Scan -a3
./MegaCli64 -cfgforeign -clear -a3
#添加热备,将磁盘添加到指定在线raid组(由于当前槽位磁盘无信息),立即开启重建
#注意热备需保证磁盘不在初始化或重建状态
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3 #添加热备
./MegaCli64 -pdhsp -Rmv -physdrv[251:18] -a3 #移除热备
初始化相关命令:
./MegaCli64 -PDClear -ShowProg -physdrv[251:18] -a3 #查看初始化进度
./MegaCli64 -PDClear -Stop -physdrv[251:18] -a3 #关闭初始化
./MegaCli64 -PDClear -Start -physdrv[251:18] -a3 #开启初始化
查看重建进度
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3 #方法1
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:18] -a3 #方法2

dell 7527 raid50 故障处理相关推荐

  1. 戴尔6850服务器维修,Dell EMC PowerEdge 服务器 故障处理指南

    如果没有 RAID 划伤功能,阵列重建将失败并且阵列处于降级状态.在某些情况下,故障可能会导致附加驱动器失败,并会导致阵列处于未正常工作的脱机状态.阵列划伤不会影响在阵列上引导或访问任何数据的功能. ...

  2. Zabbix 3.2.6 通过SNMP和iDRAC监控DELL服务器

    一.总览 SNMP是监控服务器以外设备的非常好的方式,比如可以用于监控打印机.交换机.路由器等,只要是有SNMP功能,Zabbix都可以监控. SNMP检查是通过UDP协议,从Zabbix 2.2.3 ...

  3. zabbix snmp 协议监控 dell iRDAC

    转摘:http://blog.csdn.net/wanglei_storage/article/details/52789921 http://blog.csdn.net/wanglei_storag ...

  4. 戴尔服务器设置文件存储,DELL服务器RAID配置详细教程-20210730001009.pdf-原创力文档...

    DELL服务器 RAID 配置教程 在启动电脑的时候按 CTRL+R 进入 RAID 设置见面如下图 名称解释: Disk?Group :磁盘组,这里相当于是阵列,例如配置了一个 RAID5 ,就是一 ...

  5. Zabbix 3.2.6通过SNMP和iDRAC监控DELL服务器

    一.总览 SNMP(简单网络管理协议),由一组网络管理的标准组成,包含一个应用层协议(application layer protocol).数据库模型(database schema)和一组资源对象 ...

  6. Dell做RAID配置图文全教程

    首先准备工作:Dell服务器 首先重启Dell,我们会看到Dell服务器的启动页面: 当我们看到出现下面这个界面的时候,根据提示按下Ctrl+R进到SAS磁盘阵列里面 备注:大多数Dell服务器进磁盘 ...

  7. zabbix企业应用:通过SNMP和iDRAC监控DELL服务器硬件

    来自http://qicheng0211.blog.51cto.com/3958621/1749986 监控DELL服务器硬件一般有两种途径: 1.操作系统上安装OMSA,编写脚本调用omreport ...

  8. zabbix3.2通过snmp v2采集Dell服务器iDRAC口信息监控硬件

    模板下载 https://files.cnblogs.com/files/LuckWJL/zbx_export_templates.xml 模板源代码 <?xml version="1 ...

  9. Dell服务器RAID常用管理命令总结

    介绍 MegaCli是一款管理维护硬件RAID软件,可以通过它来了解当前raid卡的所有信息,包括 raid卡的型号,raid的阵列类型,raid 上各磁盘状态,等等.通常,我们对硬盘当前的状态不太好 ...

最新文章

  1. Neuron 2020 | 深度强化学习和神经科学
  2. 你最常用的构建和发布管理工具是什么
  3. javascript--arguments callee caller
  4. DevExtreme 学习应用[1]
  5. MySQL—事务隔离级别
  6. iphone11右上角信号显示_苹果iOS11信号强度的标志变了意味着什么?
  7. 牛客网---Java题库(11~20)
  8. [转载]虚拟机磁盘空间已满的发现和解决
  9. C++ Primer Plus学习(七)——函数简介
  10. 9本R语言书,从入门到进阶都在这了
  11. 计算机系统结构模拟试卷3,计算机系统结构全真模拟试卷.pdf
  12. python插值算法_python插值算法
  13. 想成为影视后期制作特效师要学什么?
  14. 【笔记】项目工作中总结(三)
  15. 支付宝小程序访问浙里办应用,提示页面访问受限,IOS无法访问
  16. 事业人员辞职后自己怎么样交社保,到退休年龄可正常领养老金?
  17. 推荐书籍《流畅的Python》
  18. 长文】多家大厂春招实习经历汇总,我的春招回忆流水账+面经
  19. 错误:error C1853:Debug\...pch预编译头文件来自编译器版本,或者预编译头C++而在C中使用它
  20. Python实现桌面悬浮窗(显示网速,内存,CPU)

热门文章

  1. requests+正则表达式爬取猫眼电影TOP100
  2. 一、RHS和LHS查找 异常
  3. TCP中的状态转移(三种情况)
  4. 解决Eclipse乱码
  5. 想飞的种子----梦开始的地方【20100301】
  6. SpringMVC学习笔记(一):mvc流程和思路
  7. html css JavaScript web网页设计期末作业 共5页【视频演示】
  8. 圆柱坐标系(Polar或Cylindrical coordinate system)
  9. SppNet详述 附代码
  10. 乐视网发布公告:将转租部分办公楼