服务器数据恢复环境:
IBM某型号服务器,5个SAS硬盘组建RAID5(4个数据盘,1个热备盘);
linux redhat操作系统;
上层应用为oa,数据库为oracle;oracle已经不对本案例中的oa提供后续支持。
    
服务器故障&初检&恢复方案:
RAID5中有一块盘离线,但热备盘由于未知原因未被激活rebuild,直到另外一块盘离线导致RAID崩溃。用户联系我们数据恢复中心要求恢复数据和操作系统。
经过数据恢复工程师检测,发现热备盘完全没有启用,没有发现有物理故障,也没有同步的表现。
经过北亚数据恢复工程师团队会诊,确定最终的数据恢复方案:
1、关闭服务器,将硬盘标好序号取出。
2、将硬盘挂载到只读环境对所有硬盘做镜像备份。后续的数据恢复操作都在镜像文件上进行,避免对原始数据造成二次破坏。
3、基于镜像文件分析故障RAID5的结构,获取RAID级别、条带规则、条带大小、校验方向、META区域等RAID信息。
4、根据获取到的RAID信息搭建虚拟的RAID5环境。
5、解释虚拟磁盘及文件系统。
6、检测虚拟结构是否正确,如不正确,重复3-5步骤。
7、最终确定数据没有问题后按照用户要求回迁数据。如果仍然使用原盘,需确定已经完全对原盘做过备份之后再重建RAID,然后做回迁。可以使用linux livecd回迁操作系统,也可以在故障服务器上用另外的硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。

服务器数据恢复过程:
1、对故障服务器中所有硬盘进行完整镜像,镜像过程中发现后掉线的那个硬盘有10-20个坏扇区,其余磁盘均没有发现坏道。
2、分析RAID得到RAID最佳结构、块大小、校验方向等RAID信息,如下图:

3、根据第2步获取到的信息虚拟重建RAID后进行数据验证,200M以上的压缩包解压无报错,确定结构正确。
4、直接按此结构生成虚拟RAID到一块单硬盘上,打开文件系统无明显报错。
5、确定备份包安全的前提下经用户同意后利用原盘重建RAID,重建时已经用全新硬盘更换那块后掉线的已经损坏的硬盘。将恢复好的单盘用USB方式接入故障服务器,用linux SystemRescueCd启动故障服务器。
6、通过dd命令进行全盘回写,启动操作系统。
7、dd所有数据后,启动操作系统但是无法进入,报错:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied。数据恢复工程师怀疑此文件权限有问题,使用SystemRescueCd重启后检查,结果发现此文件时间、权限、大小均有明显错误,这意味着节点损坏。
8、重新分析重组数据中的根分区,定位出错的/sbin/pidof,发现问题是后掉线的那块硬盘坏道所引起的。
9、使用其他完好的3个数据盘对后掉线硬盘的损坏区域进行xor补齐。补齐后重新校验文件系统依然报错误,再次检查inode表,发现后掉线硬盘损坏区域有部分节点表现为(下图中55 55 55部分):

很明显,虽然节点中描述的uid还正常存在,但属性、大小、最初的分配块全部是错误的。确定无法找回此损坏节点后只能修复此节点,或复制一个相同的文件过来。
10、对所有可能有错的文件通过日志确定原节点块的节点信息,然后由北亚数据恢复工程师修正。
11、修正后重新dd根分区,执行fsck -fn /dev/sda5命令进行检测,依然报错,如下图:

12、根据报错提示,在系统中发现有多个节点共用同样的数据块。通过底层分析发现存在节点信息的新旧交集问题。
13、按节点所属的文件进行区别,清除错误节点后执行fsck -fn /dev/sda5,依然有报错但已经很少。根据错误提示发现这些节点多位于doc目录下,不影响系统启动,于是直接使用fsck -fy /dev/sda5命令强行修复。修复后重启系统,成功进入系统桌面。
14、启动oracle数据库服务和OA应用软件,一切正常无报错。
15、让用户亲自对恢复出来的数据和操作系统进行检测,确定没有问题,本次数据恢复工作完成。

【服务器数据恢复】RAID5多块硬盘离线但是热备盘未激活导致RAID崩溃的数据恢复案例相关推荐

  1. 【北亚数据恢复】IBM服务器raid5硬盘离线,热备盘未激活导致raid崩溃的数据恢复案例

    服务器数据恢复环境: IBM X系列服务器: 操作系统为linux redhat: 5块73G SAS硬盘,4块组成RAID5,1块作为热备盘(Hot-Spare). 故障: 3号盘最早离线,热备盘未 ...

  2. 【服务器数据恢复】EMC存储Raid5中2块硬盘损坏,热备盘未激活的数据恢复案例

    服务器数据恢复环境: EMC存储: stat硬盘组成raid5,两块热备盘. 故障: 2块硬盘出现故障,只有一块热备盘被激活,raid崩溃.服务器管理员联系数据恢复中心进行数据恢复. 服务器故障检测: ...

  3. raid5需要几块硬盘_Raid5盘阵2块硬盘损坏【热备盘未激活】数据恢复概述

    [Raid5阵列数据恢复案例简介] 今天记录一次raid5磁盘阵列数据恢复的成功案例.首先简单介绍一下需要数据恢复的服务器基础配置情况: 客户的服务器设备为EMC存储,raid5磁盘阵列,由多块sta ...

  4. HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据过程

    故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空 ...

  5. HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据方案

    故障描述   HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存 ...

  6. 【服务器数据恢复】哪些故障会导致服务器数据丢失?多块硬盘离线的数据恢复案例

    在服务器运行过程中难免出现故障导致数据的丢失,哪些服务器故障会导致数据丢失呢? 1.同一阵列内多块硬盘出现故障: 2.服务器模块老化: 3.服务器系统更新: 4.意外断电: 5.错误的拔插服务器硬盘: ...

  7. 2个硬盘离线导致raid崩溃的数据恢复案例

    案例1:多块硬盘离线导致raid6崩溃的数据恢复案例 服务器数据恢复环境: 6块750G磁盘的RAID6: WEB服务器+MYSQL数据库: 存放了大量其它文件. 服务器故障: 先后有两块磁盘离线,服 ...

  8. 【raid5数据恢复】服务器RAID5中一块硬盘亮黄灯被踢出导致raid崩溃的数据恢复

    服务器数据恢复环境: 3U戴尔机架式服务器 SAS接口硬盘 Windows操作系统 100个125GB硬盘组成的RAID5 故障: 一块盘亮黄灯,被raid卡踢出后,raid崩溃.联系北亚数据恢复中心 ...

  9. 【服务器数据恢复】华为OceanStor服务器热备盘同步数据失败的数据恢复案例

    服务器数据恢复环境: 华为OceanStor系列服务器: 24块硬盘组成一组raid5盘阵,其中一块硬盘为热备盘. 服务器故障情况: 服务器运行过程中有一块硬盘离线,热备盘激活上线进行数据同步,在数据 ...

最新文章

  1. 练习5-3 数字金字塔 (15 分)
  2. [转载翻译][重新整理]西川善司的”METAL GEAR SOLID 4”图形讲座(5)
  3. Android 之 ProgressDialog用法介绍(矩形进度条 和 圆形 进度条)
  4. C语言实现链表(附完整源码)
  5. postman使用_postman如何使用集合断言?
  6. leetcode1169. 查询无效交易
  7. matlab求傅里叶级数展开式_连续时间的傅里叶级数
  8. Ms sql pivot unpivot
  9. eclipse bookmark
  10. 现代化智能一体化机柜
  11. latex公式及表格识别
  12. 「干货」从动态的角度分析DDR的时序结构
  13. 天宫初级认证答案_跨境电商人才初级认证试题以及答案
  14. 如何在C#中将 加载、编辑WPS表格?国产控件就能搞定
  15. 【列表的使用】用python完成购物打印商品列表
  16. 基于飞桨图像分类套件PaddleClas的柠檬分类竞赛实战
  17. 孔子最得意的弟子颜回不幸英年早逝
  18. visual studio 2015 下载
  19. 基于keras实现房价预测 (神经网络入门)
  20. USSD 原理 框架 MSC/VLR/SSP

热门文章

  1. 【数学建模】6 近十年江西省研究生建模赛题及近三年全国建模赛题目录
  2. 如何在九酷·轻音乐上下载MP3格式的音乐素材?
  3. 点击table中的某一个td,获得这个tr的所有数据
  4. 建筑业企业施工劳务资质备案申请条件及劳务分包的种类
  5. 谷歌浏览器chrom兼容问题
  6. chorme-调试模式基本使用
  7. java实现抓包jacap_java 抓包工具 jpcap的下载与eclipse配置
  8. 站在程序员的角度,来谈谈B站的《后浪》,真情流露
  9. 如何求函数渐近线(水平、铅直、斜)
  10. 魔趣吧致力于为中文站长提供助力