1. 故障描述

本案例是HP P2000的存储vmware exsi虚拟化平台,由RAID-5由10块lT硬盘组成,其中6号盘是热备盘,由于故障导致RAID-5磁盘阵列的两块盘掉线,表现为两块硬盘亮黄灯。 经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别。

2. 数据备份与修复

故障发生后用户方工程师与我公司联系,经过详细咨询,了解到故障比较严重,必须把RAID-5磁盘阵列带到我公司进行检测,检测RAID-5的每块成员盘是物理故障(磁头损坏或者盘片划伤)还是逻辑故障。由于情况紧急,工程师在接到原盘以后,立即着手准备检测。对能识别的好盘用连接到北亚镜像服务器上使用WinHex做扇区级镜像,同时对不能识别的坏盘进行检测。

首先将坏盘连接到外部的SAS扩展卡上,加电后通过硬盘工作声音判断硬盘电机能够起转,但是磁头没有进行寻道操作,于是尝试把硬盘PCB分离下来对HDA组件氧化部分进行清洁操作,将PCB还原后故障依旧。于是和客户沟通使用6号热备盘的好PCB替换到故障盘上进行尝试性修复,再将故障盘PCB上的ROM芯片替换到6号盘的好PCB上面后硬盘工作时起转和磁头寻道声音都正常,但是在寻道结束后,有明显的敲盘声音,于是判断有可能磁头损坏。在和用户沟通后尝试使用6号热备盘中的好磁头对故障盘进行替换操作以读取数据。在无尘室对故障盘进行开盘更换磁头操作后,将故障盘连接到专业硬盘维修工作上进行检测,发现故障盘已经不能识别,数据无法读取。

因为用户有两块故障盘,之前尝试修复的都是其中一块,再次和客户沟通尝试对另一块故障盘进行修复操作。和先前的故障盘一样,这块盘的故障依旧是磁头损坏,因为用户的HP OEM盘价格昂贵,于是尝试在网上购买ST原厂的相同型号硬盘进行磁头更换。这块硬盘的磁头更换完成后,设备能够正常识别硬盘,于是将故障盘所有扇区完整镜像到一块相同容量的备份盘中。

3.重组RAID-5步骤

【判断起始扇区】所有硬盘都镜像好后就可以重组了,用WinHex打开9块盘(热备盘不需要加进去重组),先把镜像文件解析成磁盘。可以看到这9块盘的0扇区都有“55 AA”标志,如图1所示。

图1

查找结果如图2所示,0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。因此从0扇区看这是一个不正常的MBR分区结构。

图2

按图1方式继续往下找,分别在9号盘和8号盘找到了“55 AA”的标志。9号盘查询结果如图3所示。这是一个正常的MBR分区,其0x01C6处数值代表指向的下一个扇区为GPT的头部。

图3

8号盘查询结果如图4所示。其0x01C6处数值代表指向下一个扇区。但是下一个扇区很明显不是GPT的头部。

图4

由此可以确定9号盘是第一块盘,8号盘可能是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。

【判断条带(stripe)大小】条带也称块,它是RAID处理数据的基本单元。不同的RAID其条带大小有所不同。RAID-5的1个条带组中有1个校验区,1个校验区的大小等于1个条带的大小,根据这一点,针对这个RAID-5案例做分析。如果对VMFS的文件系统不熟悉,可以通过比较法确定条带大小。如某一条带组中的校验区跟这一条带组中的非校验区可能相差的很明显,通过WinHex查看并做对比,就可以找到条带大小。本案例判断出一个条带是1024个扇区。

【判断RAID-5成员盘盘序】按照1024扇区分割,使一个记录为一个条带的大小,如图5所示。并且9块盘跳到同一记录283123。

图5

当9块盘都定位到同一位置时,通过对比可以判断校验区的走向,继而判断整个RAID-5的走向。之前已经判断出9号盘是第一块盘了,把9号盘放在第一个位置,接着就可以判断走向了,结果如图6所示(drive9是第4块盘)。确定RAID-5为左走向,盘序为9,2,3,4,10,1,7,8,5。

图6

前面内容初步确定了LUN的起始扇区是172032扇区。用WinHex跳到172032扇区,观察各硬盘实际情况。如果172032扇区是LUN的起始扇区,那么这个扇区所属条带中的5号盘应该是校验区,但是此条带中却显示8号盘是检验区,根据本案例RAID-5的左走向,5号盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为5号盘。因此可以确定LUN的起始扇区为171008扇区。

【重组RAID-5】使用专业恢复工具按照确定的盘序组好,添加进去,如图7所示。选择RAID-5,Stripe size 512KB,左异步。

图7

点击Build进行重组。组好后,由于数据从1024*8=8192个扇区开始,若专业恢复工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。RAID的起始扇区(Start sectors)选择8192,这个文件可以任意选择起始扇区和大小大小(Count sectors),如图8和图9所示,图10是组好的RAID-5。

图8

图9

图10

4.移交数据

整个RAID-5就重建好后,由我公司商务联系用户方验收数据,用户方确定数据没问题,签订完验收合同后,完整的RAID-5数据即可移交。移交时根据用户方要求把数据移交到用户方带来的新盘上。恢复完的数据保留在我公司服务器上3天,之后数据自动被系统销毁。

转载于:https://blog.51cto.com/sun510/1933389

HP P2000 RAID-5两块盘离线的数据恢复报告相关推荐

  1. 【服务器数据恢复】HP StorageWorks系列存储RAID5两块盘离线的数据恢复

    服务器存储数据恢复环境: HP StorageWorks系列存储: VMWARE ESX虚拟主机平台,VMFS文件系统: 8块硬盘组成RAID5,1块热备盘. 服务器存储故障: 服务器在正常运行中两块 ...

  2. 【服务器raid数据恢复】RAID5两块盘离线的数据恢复案例

    服务器数据恢复环境: raid5磁盘阵列: 10块磁盘,单盘容量1TB: 6号盘是热备盘. 服务器故障: 阵列中2块磁盘离线,黄色警报灯亮起.管理员对服务器初步检测,发现阵列磁盘序列号不能读取/无法通 ...

  3. RAID5服务器磁盘阵列,两块盘坏了数据恢复

    RAID5服务器磁盘阵列,两块盘坏了数据恢复,全国×××,现场进行服务器 RAID5数据修复 专业提供服务器数据恢复,服务器硬盘维修,RAID数据恢复,RAID阵列数据恢复,RAID5数据恢复,RAI ...

  4. P2000 RAID-5两块盘离线数据恢复过程

    服务器数据恢复故障描述 服 务  器  型  号:HP P2000 服务器操作系统:VMWARE ESX 服务器文件系统:VMFS 磁盘阵 列 级 别:RAID-5 需要进行数据恢复的服务器挂载了8块 ...

  5. 又一例两块硬盘离线的数据恢复成功案例

    服务器数据恢复背景 北京某国企的一台服务器在正常运行过程中突然崩溃,该服务器共有240块硬盘,其中元数据存储使用了24块硬盘,硬盘搭配情况为9组raid1磁盘阵列和1组raid10磁盘阵列.其余所有硬 ...

  6. HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据过程

    故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空 ...

  7. HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据方案

    故障描述   HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存 ...

  8. Dell 2850服务器磁盘阵列两块硬盘离线恢复过程

    服务器故障描述: 客户使用Dell 2850服务器组建了raid5磁盘阵列,阵列中包含有6块硬盘(SCSI硬盘,单盘容量300G),服务器操作系统为linux Redhat4:文件系统为ext3文件系 ...

  9. Raid5损坏两块盘

    以下为浪潮Inspur NF5460M4型号服务器故障处理过程: 设备raid5组损坏两块硬,并raid组处理离线状态,情况如图: 由于硬盘数据比较重要,面对此情况不要慌我们尽量做到安全保守的保证数据 ...

最新文章

  1. java三段式if_Java几种常用的断言风格你怎么选?
  2. STM 32 窗口看门狗
  3. python偶数列表_使用条件偶数列表创建带有地图的元组 - python
  4. mysql8从入门到精通电子书_MySQL 8从入门到精通(视频教学版)
  5. IDEA插件开发实战
  6. 八爪鱼爬虫采集天猫商品数据教程
  7. 火狐浏览器“正在检查您的附件组件与Firefox此版本的兼容性” -- 解决方案
  8. 无法获取 vmci 驱动程序版本句柄无效解决办法
  9. 迅雷对电驴资源的限制
  10. 2017.05.22 房多多 曾熙闭门会
  11. 二手房比新房贵的原因
  12. Windows批处理 - 小程序大作用
  13. 国外10款开源的HTML 5小游戏
  14. Apache Bench的安装与使用(前端使用apache-bench进行并发测试)
  15. SQL 左外连接,右外连接,全连接,内连接 4种连接的区别
  16. 常见的关系型数据库与非关系型数据库对比详解。
  17. WiFi辐射比手机电脑辐射数值小 60厘米外基本为0
  18. 破解Navicat Premium
  19. 雷电模拟器9指针位置不显示,怎么办?
  20. 1508-张晨曦总结《2016年-11月-3日》【连续13天总结】

热门文章

  1. android自定义push通知_20个海外Web和App推送通知服务工具
  2. 生成FaceBook所需的散列哈希值
  3. kafka学习-环境搭建
  4. Python函数之 ceil, floor,round
  5. 在线课程学习、科研科技视频网站
  6. 计算机网络之-嵌入式学习
  7. 2018-06-29 西游记主题Python入门示例尝试-数据结构 5.1-5.1.2
  8. (五)Unity插件生成
  9. Spring Cloud Sleuth 中id的使用
  10. 基于Docker的GoldenGate部署