简短的版本:我有一个失败的RAID 5阵列,其中有一堆进程挂起等待I / O操作;我该如何从中恢复?

长版本:昨天我注意到Samba访问非常零星;从Windows访问服务器的共享将在单击一个或两个目录后完全随机锁定资源管理器.我以为是Windows很痛苦而且离开了.今天问题是一样的,所以我做了一点挖掘;我注意到的第一件事是运行ps aux | grep smbd给出了很多像这样的行:

ben 969 0.0 0.2 96088 4128 ? D 18:21 0:00 smbd -F

root 1708 0.0 0.2 93468 4748 ? Ss 18:44 0:00 smbd -F

root 1711 0.0 0.0 93468 1364 ? S 18:44 0:00 smbd -F

ben 3148 0.0 0.2 96052 4160 ? D Mar07 0:00 smbd -F

...

“D”状态中存在很多进程.运行ps aux | grep“D”显示了一些其他进程,包括我的夜间备份脚本,所有这些都需要在某些时候访问我的RAID阵列上安装的卷.经过一些谷歌搜索,我发现可能是由于RAID阵列失败,所以我检查了/ proc / mdstat,它显示了这个:

ben@jack:~$cat /proc/mdstat

Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10]

md0 : active raid5 sdb1[3](F) sdc1[1] sdd1[2]

2930271872 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

unused devices:

并运行mdadm –detail / dev / md0给出:

ben@jack:~$sudo mdadm --detail /dev/md0

/dev/md0:

Version : 00.90

Creation Time : Sat Oct 31 20:53:10 2009

Raid Level : raid5

Array Size : 2930271872 (2794.53 GiB 3000.60 GB)

Used Dev Size : 1465135936 (1397.26 GiB 1500.30 GB)

Raid Devices : 3

Total Devices : 3

Preferred Minor : 0

Persistence : Superblock is persistent

Update Time : Mon Mar 7 03:06:35 2011

State : active, degraded

Active Devices : 2

Working Devices : 2

Failed Devices : 1

Spare Devices : 0

Layout : left-symmetric

Chunk Size : 64K

UUID : f114711a:c770de54:c8276759:b34deaa0

Events : 0.208245

Number Major Minor RaidDevice State

3 8 17 0 faulty spare rebuilding /dev/sdb1

1 8 33 1 active sync /dev/sdc1

2 8 49 2 active sync /dev/sdd1

我相信这说sdb1失败了,所以阵列运行时有三个’up’中的两个驱动器.我发现有些建议要检查/ var / log / messages是否有失败通知,而且确实有足够的建议:

ben@jack:~$grep sdb /var/log/messages

...

Mar 7 03:06:35 jack kernel: [4525155.384937] md/raid:md0: read error NOT corrected!! (sector 400644912 on sdb1).

Mar 7 03:06:35 jack kernel: [4525155.389686] md/raid:md0: read error not correctable (sector 400644920 on sdb1).

Mar 7 03:06:35 jack kernel: [4525155.389686] md/raid:md0: read error not correctable (sector 400644928 on sdb1).

Mar 7 03:06:35 jack kernel: [4525155.389688] md/raid:md0: read error not correctable (sector 400644936 on sdb1).

Mar 7 03:06:56 jack kernel: [4525176.231603] sd 0:0:1:0: [sdb] Unhandled sense code

Mar 7 03:06:56 jack kernel: [4525176.231605] sd 0:0:1:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE

Mar 7 03:06:56 jack kernel: [4525176.231608] sd 0:0:1:0: [sdb] Sense Key : Medium Error [current] [descriptor]

Mar 7 03:06:56 jack kernel: [4525176.231623] sd 0:0:1:0: [sdb] Add. Sense: Unrecovered read error - auto reallocate failed

Mar 7 03:06:56 jack kernel: [4525176.231627] sd 0:0:1:0: [sdb] CDB: Read(10): 28 00 17 e1 5f bf 00 01 00 00

对我来说很明显设备sdb已经失败了,我需要停止阵列,关闭,替换它,重新启动,然后修复阵列,重新启动它并挂载文件系统.我无法热插拔替换驱动器,也不希望让阵列在降级状态下运行.我相信我应该在停止数组之前卸载文件系统,但这是失败的,这就是我现在被困住的地方:

ben@jack:~$sudo umount /storage

umount: /storage: device is busy.

(In some cases useful info about processes that use

the device is found by lsof(8) or fuser(1))

它真的很忙; I / O上有大约30或40个进程在等待.

我该怎么办?我应该杀死所有这些进程并再试一次吗?当它们“不间断”时,这是明智之举吗?如果我尝试重启会怎么样?

请让我知道你认为我应该做些什么.请询问您是否需要任何额外信息来诊断问题或提供帮助!

php raido mysql,linux – 如何停止并修复已失败且I / O挂起的RAID 5阵列?相关推荐

  1. Linux启动/停止/重启Mysql数据库的方法

    1.查看mysql版本 方法一:status; 方法二:select version(); 2.Mysql启动.停止.重启常用命令 a.启动方式 1.使用 service 启动: [root@loca ...

  2. Linux 文件系统错误的修复方法 ddrescue替代dd的恢复软件 备用超级块

    Linux 文件系统错误的修复方法  ddrescue替代dd的恢复软件  备用超级块 http://www.mamicode.com/info-detail-1372846.html 最近处理的一件 ...

  3. 修复mysql的view_MYSQL数据损坏修复方法

    1.myisamchk 使用 myisamchk 必须暂时停止 MySQL 服务器.例如,我们要检修 discuz 数据库.执行以下操作: # service mysql stop (停止 MySQL ...

  4. mysql linux 中文乱码怎么解决_如何解决mysql linux 中文乱码的问题

    解决mysql linux中文乱码的方法: 1.查看mysql的默认字符集#mysql -u root - p #(输入密码) mysql> show variables like 'chara ...

  5. linux怎样重启mysql,linux正确重启MySQL的教程

    <linux正确重启MySQL的教程>由会员分享,可在线阅读,更多相关<linux正确重启MySQL的教程(2页珍藏版)>请在装配图网上搜索. 1.linux正确重启MySQL ...

  6. 非正常关机宝塔mysql启动失败_宝塔mysql启动立刻停止启动失败解决办法

    宝塔mysql启动立刻停止和启动失败大部分原因是主机的内存小了,这种情况多发生于1G内存及以下的主机上面,随着wordpress越来越消耗内存,宝塔也是个非常吃内存的玩意,所以建议购买主机的时候选择1 ...

  7. linux完美卸载mysql,Linux下彻底卸载mysql详解

    一.使用以下命令查看当前安装mysql情况,查找以前是否装有mysql rpm -qa|grep -i mysql 二.停止mysql服务.删除之前安装的mysql 删除命令:rpm -e –node ...

  8. mysql linux版安装

    首先请大家允许吐点口水,本来为了省点事,参照了菜鸟教程mysql的安装步骤 那叫一个坑爹啊,好不容易安找教程上的所有步骤安装完后,发现竟然缺少一些 重要文件如(pid),在网上找了好久,发现很多人都遇 ...

  9. Linux下的文件系统修复

    Linux下的文件系统修复 一.进行磁盘分区 二.格式成xfs文件系统 1.查看分区 2.格式化分区 三.挂载分区 1.查看分区的uuid 2.将挂载信息写入/etc/fstab 3.挂载分区 四.破 ...

最新文章

  1. 实战matlab之并行程序设计.pdf,实战Matlab之并行程序设计_IT教程网
  2. img标签使用默认图片的一种方式
  3. 【深度学习】锐化滤波器核 与 边缘检测核
  4. hdu 1226(bfs+同余剪枝)
  5. FastJson的常用操作
  6. ASP.NET Core 中间件的几种实现方式
  7. 58如何调出eclipse左边文件栏
  8. linux tcp server开源,GitHub - 06linux/cellnet: 高性能,简单,方便的开源服务器网络库...
  9. 用python提取图片主要颜色_Python可视化|09-使用python和R提取图片颜色绘图(五-颜色使用完结篇)...
  10. 关于数据型驱动自动化测试实现
  11. jQuery特效:实现微博发布界面
  12. Unity3D(五)渲染管线
  13. 哈佛大学凌晨4点半的景象
  14. 带农历日期的html代码,网页日历代码 包含日期时间 阴历
  15. 百度指数是什么意思?其中的数值又代表什么?
  16. 投资是一个非常专业的领域,亏钱容易赚钱难
  17. 知识表示学习(KG Embedding)—— TransX系列
  18. 辐射避难所买了东西显示服务器异常,辐射避难所有哪些BUG 现存BUG说明及解决方法盘点...
  19. 三维动画渲染用什么软件好?
  20. Jmeter读取CSV文件读取不到解决方法

热门文章

  1. spring中context:property-placeholder/元素
  2. html中hr的各种样式使用
  3. 提高Axure设计效率的10条建议 (转)
  4. UIKit框架-高级控件Swift版本: 6.UIAlertView方法/属性详解
  5. 乱码解决方案SecureCRT中文乱码解决方案
  6. 删除MyEclipse 6.5.1自带的Maven4MyEclipse
  7. Python稳基修炼之计算机等级考试易错概念题3(含答案与解析)
  8. Python稳基修炼之计算机等级考试易错概念题1(含答案与解析)
  9. android unity 关闭应用_Unity 之 唤起调用 Android 其它应用app的方法
  10. 微课--Python嵌套函数定义与使用