dell 7527 raid50 故障处理
dell 7525 raid50 单盘故障,无法自动重建问题
{1}生产故障表现
单块raid5中,某块磁盘出现故障,raid出现降级,重建插入后,查看磁盘状态,未进入自动重建状态。
{2}生产环境描述
生产环境下,dell 7525 服务器挂载8个megaraid控制器,每个控制器包含84块盘,84块盘组raid50(先组raid5,后组riad0), 单个控制器一共14组raid5,每组riad5 6块磁盘 ,a3控制器下,EID 512 SID 18盘出现问题,进行更换。
{3}问题分析
<1>安装megacli64
查看官网,megarcli是LSI 公司的针对scsi卡的管理工具,LSI公司涉及的产业较广,基本围绕在服务器内部线缆,如SAS SATA, NVME PCIE线缆,SAS交换机,各类SAS,SATA 芯片, 本次生产环境使用的为 SAS 3508 sas raid芯片,目前已被博通收购,针对此类sas 或raid操作,dell 有perccli64, 或者storcli64,个人感觉都是在megacli 上换了皮肤,建议还是使用原本的工具较好。
LSI官网
找到对应的rpm包,本次使用centos 系统,直接安装即可
rpm -ivh Lib_Utils-1.00-09.noarch.rpm
rpm -ivh MegaCli-8.04.07-1.noarch.rpm
安装结束在安装部分依赖库
yum install libncurses* -y
注意: 由于安装包没有debain的 deb,若在ubuntu上跑起来,需要利用alien进行rpm到deb的转换,官方也有说明,并且ubuntu要安装依赖库, apt-get install libncurses5 -y
软件默认安装在 cd /opt/MegaRAID/MegaCli/
cd /opt/MegaRAID/MegaCli/
./MegaCli64 pdlist -aAll | more
<2>问题定位
#查看所有控制器信息
./MegaCli64 -AdpAllinfo -aAll | more
#查看问题控制器信息
./MegaCli64 -LDInfo -L0 -a3
#查看问题控制器下磁盘丢失信息
./MegaCli64 -PDGetMissing -a3
#定位问题磁盘的EID UID
粗过滤问题硬盘
./MegaCli64 -PDList -a3| grep -Ei “(Firmware state)”
#带上eid 和sid进行问题磁盘定位
./MegaCli64 -PDList -a3| grep -Ei “(Enclosure Device|Slot Number|Raw Size|Firmware state)”
<3>开始恢复
更换问题磁盘为新磁盘后,未进入自动重建状态
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:18] -a3
查看问题硬盘固件状态为ugood, Spun Up, Foreign State为None
因此无需进行硬盘make good和 Spun Up操作,由于Foreigh State不为Foregin,无法进行强制Foregin import操作
./MegaCli64 -pdInfo -PhysDrv[251:18] -a3 | more
尝试对硬盘进行下上线操作,均失败
./MegaCli64 -PDOffline -PhysDrv[251:18] -a3 #硬盘卸载(下线)
./MegaCli64 -PDOnline -PhysDrv[251:18] -a3 #硬盘装载(上线)
#尝试手动重建,失败
./MegaCli64 -pdrbld -Start -physdrv[251:18] -a3
最后尝试添加热备的方式(热备恢复指定的问题槽位硬盘,指定成功后立即进入重建状态),显示当前状态无法进行热备操作
#添加热备
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3
经过排查,发现硬盘处在初始化状态
#查看磁盘初始化进度
./MegaCli64 -PDClear -ShowProg -physdrv[251:18] -a3
扫描和清除之前磁盘的外部配置信息(如之前残留raid配置)
./MegaCli64 -cfgForeign -Scan -a3
./MegaCli64 -cfgforeign -clear -a3
关闭磁盘初始化进程,再次进行热备操作
./MegaCli64 -PDClear -Stop -physdrv[251:18] -a3
#再次进行热备操作
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3
磁盘已进入重建进程,查看重建进度
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3
{4}问题总结
本次无法自动重建原因可能是硬盘插入后进入初始化状态,若想快速进入重建状态,需先查看当前磁盘是否有在做其它操作(如初始化,重建,热备等) 关闭硬盘的所有操作,再次利用热备的方式进行快速恢复,做热备恢复前一定要保证硬盘无其它raid信息,还有一种恢复的方式是重建一个radi50,将新磁盘也添加进来,慎用,风险较大,本次生产环境磁盘数据量巨大,未敢尝试!!!!!
{5}相关命令附录
硬盘事件
./MegaCli64 -AdpEventLog -GetEventLogInfo -a3
./MegaCli64 -AdpEventLog -GetEvents -info -a3
配置文件
./MegaCli64 -CfgSave -f a3.cfg -a3
./MegaCli64 -CfgRestore -f a3.cfg -a3
#查看虚拟磁盘信息
./MegaCli64 -LDInfo -Lall -aAll | more
./MegaCli64 -LDInfo -L0 -a3 | more
./MegaCli64 -LdPdInfo -a3
./MegaCli64 -GetBbtEntries -Lall -a3
./MegaCli64 -PDGetNum -a3
./MegaCli64 -LDGetNum -a3
./MegaCli64 -PDList -a3| grep -Ei “(Enclosure Device|Slot Number|Raw Size|Firmware state)”
./MegaCli64 -PDList -a3| grep -Ei “(Firmware state)”
#硬盘状态相关操作
./MegaCli64 -pdInfo -PhysDrv[251:18] -a3 | more
./MegaCli64 -PDOnline -PhysDrv[251:18] -a3
./MegaCli64 -PDRbld –Start -PhysDrv[251:18] -a3
./MegaCli64 -PDGetMissing -a3
./MegaCli64 -PDReplaceMissing -PhysDrv[251:18] -Array1 -Row4 -a3
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:75] -a2
#显示硬盘框信息
./MegaCli64 -EncINfo -a2 | more
#查看丢失磁盘信息
./MegaCli64 -PDGetMissing -a3
#清理之前磁盘的残留的raid信息 (a3对应控制器4)
./MegaCli64 -cfgForeign -Scan -a3
./MegaCli64 -cfgforeign -clear -a3
#添加热备,将磁盘添加到指定在线raid组(由于当前槽位磁盘无信息),立即开启重建
#注意热备需保证磁盘不在初始化或重建状态
./MegaCli64 -pdhsp -set -physdrv[251:18] -a3 #添加热备
./MegaCli64 -pdhsp -Rmv -physdrv[251:18] -a3 #移除热备
初始化相关命令:
./MegaCli64 -PDClear -ShowProg -physdrv[251:18] -a3 #查看初始化进度
./MegaCli64 -PDClear -Stop -physdrv[251:18] -a3 #关闭初始化
./MegaCli64 -PDClear -Start -physdrv[251:18] -a3 #开启初始化
查看重建进度
./MegaCli64 -pdrbld -ProgDsply -physdrv[251:18] -a3 #方法1
./MegaCli64 -PDRbld -ShowProg -PhysDrv [251:18] -a3 #方法2
dell 7527 raid50 故障处理相关推荐
- 戴尔6850服务器维修,Dell EMC PowerEdge 服务器 故障处理指南
如果没有 RAID 划伤功能,阵列重建将失败并且阵列处于降级状态.在某些情况下,故障可能会导致附加驱动器失败,并会导致阵列处于未正常工作的脱机状态.阵列划伤不会影响在阵列上引导或访问任何数据的功能. ...
- Zabbix 3.2.6 通过SNMP和iDRAC监控DELL服务器
一.总览 SNMP是监控服务器以外设备的非常好的方式,比如可以用于监控打印机.交换机.路由器等,只要是有SNMP功能,Zabbix都可以监控. SNMP检查是通过UDP协议,从Zabbix 2.2.3 ...
- zabbix snmp 协议监控 dell iRDAC
转摘:http://blog.csdn.net/wanglei_storage/article/details/52789921 http://blog.csdn.net/wanglei_storag ...
- 戴尔服务器设置文件存储,DELL服务器RAID配置详细教程-20210730001009.pdf-原创力文档...
DELL服务器 RAID 配置教程 在启动电脑的时候按 CTRL+R 进入 RAID 设置见面如下图 名称解释: Disk?Group :磁盘组,这里相当于是阵列,例如配置了一个 RAID5 ,就是一 ...
- Zabbix 3.2.6通过SNMP和iDRAC监控DELL服务器
一.总览 SNMP(简单网络管理协议),由一组网络管理的标准组成,包含一个应用层协议(application layer protocol).数据库模型(database schema)和一组资源对象 ...
- Dell做RAID配置图文全教程
首先准备工作:Dell服务器 首先重启Dell,我们会看到Dell服务器的启动页面: 当我们看到出现下面这个界面的时候,根据提示按下Ctrl+R进到SAS磁盘阵列里面 备注:大多数Dell服务器进磁盘 ...
- zabbix企业应用:通过SNMP和iDRAC监控DELL服务器硬件
来自http://qicheng0211.blog.51cto.com/3958621/1749986 监控DELL服务器硬件一般有两种途径: 1.操作系统上安装OMSA,编写脚本调用omreport ...
- zabbix3.2通过snmp v2采集Dell服务器iDRAC口信息监控硬件
模板下载 https://files.cnblogs.com/files/LuckWJL/zbx_export_templates.xml 模板源代码 <?xml version="1 ...
- Dell服务器RAID常用管理命令总结
介绍 MegaCli是一款管理维护硬件RAID软件,可以通过它来了解当前raid卡的所有信息,包括 raid卡的型号,raid的阵列类型,raid 上各磁盘状态,等等.通常,我们对硬盘当前的状态不太好 ...
最新文章
- Neuron 2020 | 深度强化学习和神经科学
- 你最常用的构建和发布管理工具是什么
- javascript--arguments callee caller
- DevExtreme 学习应用[1]
- MySQL—事务隔离级别
- iphone11右上角信号显示_苹果iOS11信号强度的标志变了意味着什么?
- 牛客网---Java题库(11~20)
- [转载]虚拟机磁盘空间已满的发现和解决
- C++ Primer Plus学习(七)——函数简介
- 9本R语言书,从入门到进阶都在这了
- 计算机系统结构模拟试卷3,计算机系统结构全真模拟试卷.pdf
- python插值算法_python插值算法
- 想成为影视后期制作特效师要学什么?
- 【笔记】项目工作中总结(三)
- 支付宝小程序访问浙里办应用,提示页面访问受限,IOS无法访问
- 事业人员辞职后自己怎么样交社保,到退休年龄可正常领养老金?
- 推荐书籍《流畅的Python》
- 长文】多家大厂春招实习经历汇总,我的春招回忆流水账+面经
- 错误:error C1853:Debug\...pch预编译头文件来自编译器版本,或者预编译头C++而在C中使用它
- Python实现桌面悬浮窗(显示网速,内存,CPU)