我的故事很简单.我有一台轻型服务器,运行Arch

Linux,它将大部分数据存储在由两个SATA驱动器组成的RAID-1上.它大约4个月没有任何问题.然后,我突然开始在其中一个驱动器上读取错误.总是,消息看起来很像这样:

Apr 18 00:20:15 hope kernel: [307085.582035] ata5.01: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0

Apr 18 00:20:15 hope kernel: [307085.582040] ata5.01: Failed command: READ DMA EXT

Apr 18 00:20:15 hope kernel: [307085.582048] ata5.01: cmd 25/00:08:08:6a:34/00:00:27:00:00/f0 tag 0 dma 4096 in

Apr 18 00:20:15 hope kernel: [307085.582050] res 51/40:00:0c:6a:34/40:00:27:00:00/f0 Emask 0x9 (media error)

Apr 18 00:20:15 hope kernel: [307085.582053] ata5.01: status: { DRDY ERR }

Apr 18 00:20:15 hope kernel: [307085.582056] ata5.01: error: { UNC }

Apr 18 00:20:15 hope kernel: [307085.621301] ata5.00: configured for UDMA/133

Apr 18 00:20:15 hope kernel: [307085.640972] ata5.01: configured for UDMA/133

Apr 18 00:20:15 hope kernel: [307085.640986] sd 4:0:1:0: [sdd] Unhandled sense code

Apr 18 00:20:15 hope kernel: [307085.640989] sd 4:0:1:0: [sdd] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE

Apr 18 00:20:15 hope kernel: [307085.640993] sd 4:0:1:0: [sdd] Sense Key : Medium Error [current] [descriptor]

Apr 18 00:20:15 hope kernel: [307085.640998] Descriptor sense data with sense descriptors (in hex):

Apr 18 00:20:15 hope kernel: [307085.641001] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00

Apr 18 00:20:15 hope kernel: [307085.641010] 27 34 6a 0c

Apr 18 00:20:15 hope kernel: [307085.641020] sd 4:0:1:0: [sdd] Add. Sense: Unrecovered read error - auto reallocate Failed

Apr 18 00:20:15 hope kernel: [307085.641023] sd 4:0:1:0: [sdd] CDB: Read(10): 28 00 27 34 6a 08 00 00 08 00

Apr 18 00:20:15 hope kernel: [307085.641027] end_request: I/O error,dev sdd,sector 657746444

Apr 18 00:20:15 hope kernel: [307085.641035] ata5: EH complete

Apr 18 00:20:15 hope kernel: [307085.641672] md/raid1:md16: read error corrected (8 sectors at 657744392 on sdd1)

Apr 18 00:20:17 hope kernel: [307087.505082] md/raid1:md16: redirecting sector 657742336 to other mirror: sdd1

每个错误都抱怨不同的扇区号,并伴随着用户(我)访问磁盘几秒钟的延迟.

我检查了smartctl输出,并看到以下输出(不相关的部分被剪裁):

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_Failed RAW_VALUE

1 Raw_Read_Error_Rate 0x002f 193 193 051 Pre-fail Always - 1606

5 Reallocated_Sector_Ct 0x0033 194 194 140 Pre-fail Always - 0

196 Reallocated_Event_Count 0x0032 162 162 000 Old_age Always - 0

197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 51

回顾日志,我发现错误实际上已经发生了几天,主要是在备份期间,但也经常在非常轻的使用期间(意味着大约每5次我试图保存一个文本文件).我得出结论,我的磁盘正在死亡,RAID-1正在适当地处理它,并且是时候订购替换磁盘了.我订购了一个新磁盘.

令我惊讶的是,一天后,错误……停止了.我没有做任何事来解决它们.我没有重新启动,没有将驱动器脱机,没有.但错误才刚刚停止.

此时,好奇地看到坏扇区现在是否只是在磁盘的空闲部分,我将磁盘从RAID中取出,将其放回RAID中,并允许它完成随后的完全重新同步. 9小时后重新同步完成没有任何错误(2TB磁盘需要一段时间).

此外,smartctl输出稍有变化,如下所示:

ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_Failed RAW_VALUE

1 Raw_Read_Error_Rate 0x002f 193 193 051 Pre-fail Always - 1606

5 Reallocated_Sector_Ct 0x0033 194 194 140 Pre-fail Always - 43

196 Reallocated_Event_Count 0x0032 162 162 000 Old_age Always - 38

197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0

所以,当然,这个部分让我感到高兴的是“从什么时候坏磁盘自我修复?”

我想这可能是驱动器的一小部分区域自然坏了,驱动器只需要3天(!)就可以在扇区重新分配代码开始之前将其映射到磁盘的坏区域…但我不能说我见过这种事.

有没有人见过这种行为?如果是这样,您之后对驱动器的体验是什么?它又发生了吗?磁盘最终完全失败了吗?或者它只是一个无法解释的故障仍然无法解释?

在我的情况下,我已经有了替换驱动器(在保修期内获得),所以我可能只是更换驱动器.但我很想知道我是否以某种方式误诊了这一点.如果有帮助,我会在问题发生时提供完整的’smartctl -a’输出.它只是有点长,所以我没有在这里发布.

linux 硬盘错误,linux – 硬盘读取错误……停止?相关推荐

  1. linux读苹果格式文件,mac os 如何读取 Linux ext4 格式的硬盘

    mac os 如何读取 Linux ext4 格式的硬盘 很多时候需要在macOS上操作Linux的ext4分区,然后macOS系统默认并不支持ext4等分区格式.而MacOS并不支持读取这个格式的文 ...

  2. linux 文件系统的管理 (硬盘)

    RH133-Unit4 文件系统的管理 一.系统在初始化时如何识别硬盘 1.系统初始时根据MBR的信息来识别硬盘,其中包括了一些执行文件就来载入系统,这些执行文件就是MBR里前面446bytes里的b ...

  3. linux添加磁盘后进入grub,从硬盘安装 Linux 和从 GRUB 命令行启动操作系统

    标题 +=================================================+ |  从硬盘安装 Linux 和从 GRUB 命令行启动操作系统  | +======== ...

  4. php 文件写入磁盘错误,Linux磁盘读写故障的通常处理流程

    问题 使用Linux作为服务器操作系统的时候 维护少不需要重新启动的优势非常明显 但有时候会遇到莫明其妙的故障 例如数据无法写入,执行某程序报错 这个时候建议检查一下,是否是磁盘子系统的故障 例如SC ...

  5. 2.1 linux 存储结构和硬盘划分

    2.1 一切从"/"开始 Linux系统中的目录.字符设备.块设备.套接字.打印机等等都被抽象成了文件,即刘遄老师所一直强调的--Linux系统中一切都是文件.既然平时跟咱们打交道 ...

  6. 双系统 Win10下安装Linux(单/双硬盘)

    双系统 Win10下安装Linux(单/双硬盘) 单硬盘 Centos Ubuntu 准备工作 正式安装Ubuntu系统 踩坑 双硬盘 首先非常感谢博客作者们分享的双系统安装教程,其中一些博客对笔者双 ...

  7. linux磁盘第一个扇区分析,[转]Linux中如何读写硬盘上指定物理扇区

    读指定物理扇区: dd  if=  of=   skip=  bs=512 count=1 写指定物理扇区: dd   if=   of=   seek=  bs=512 count=1 实例: 我们 ...

  8. 安装Linux系统时卡在命令行了,从硬盘安装Linux和从Grub命令行启动操作系统

    从硬盘安装Linux和从Grub命令行启动操作系统 发表于:2007-07-04来源:作者:点击数: 标签: 内容简介 ---------------------------------------- ...

  9. 关于Linux中使用USE(使用率/饱和度/错误)方法分析系统性能的一些笔记

    写在前面 今天和小伙伴们分享通过USE方法对系统进行性能分析和性能调整 博文内容涉及: 什么是USE方法,以及USE的使用建议 具体的USE指标采集分析 食用方式: 需要Linux基础知识 理解不足小 ...

最新文章

  1. 杀毒软件已经 OUT 了!未来 CPU 也可以检测病毒
  2. 毕加索发布轻量化转化引擎及BIMSOP协作云平台
  3. Android五:Activity
  4. SpringBoot项目新建之后修改编译版本
  5. [JSOI2008]Blue Mary的战役地图——全网唯一一篇dp题解
  6. Java / Web项目中的NPM模块Browser-Sync
  7. 剥开比原看代码15:比原是如何转帐的
  8. 搜索一个问题 C、C++判断操作系统 是 Linux还是windows 还是Unix【编译器内置宏 探索(不是特别满意)】...
  9. 图纸怎么发给别人_微信语音怎么转发?微信语音转发给别人最新办法10秒解决...
  10. 某互联网后台自动化组合测试框架RobotFramework+Python+Sikuli
  11. 计算机一级cad试题,全国计算机等级考试一级试题与答案(25套)(1)2
  12. 2016.2.14-2016.2.21 中大信(北京)工程造价咨询有限公司实习有感
  13. 天啦,这才是英国退欧的真相!
  14. 搜索引擎使用技巧详解
  15. 使用Apache OpenNLP探索NLP概念
  16. alg 停用sip_为什么使用3CX要关闭SIP ALG
  17. 行业分析-全球与中国3D自动X射线检测(AXI)市场现状及未来发展趋势
  18. 远程服务器用户多开,服务器安全之修改远程桌面限制同一用户使用同一个会话。一个用户只开一个会话禁止多开。...
  19. 接码平台源码_你的票被服务器上的爬虫“吃”了,本文解析爬虫抢票的源码!...
  20. linux逆向分析之ELF文件详解

热门文章

  1. day06ViewPager
  2. 【Unity大气散射】GAMES104:3A中如何实现大气散射
  3. php+mysql实现统计网站访问量(一)
  4. jq使用请求报405错误
  5. SLCP验厂辅导,工厂进行社会劳工整合项目(SLCP认证)验证的具体步骤
  6. Ubuntu系统迁移至固态硬盘(生产环境勿用)
  7. python爬虫基础知识
  8. 车联网-App车况展示数据设计思路
  9. mysql 排除节假日_MYSQL 两日期之间的工作日(去掉周六日,不考虑节假日)_mysql...
  10. 模拟登录12306(selenium+超级鹰)