推荐:10年技术力作:《高性能Linux服务器构建实战Ⅱ》全网发行,附试读章节和全书实例源码下载!

一、故障现象描述

NAS操作系统内核为Linux,自带的存储有16块硬盘,总共分两组,每组做了RAID5,Linux操作系统无法正常启动,在服务启动到cups那里就停止了,按键ctrl+c强制断开也没有响应,查看硬盘状态,都是正常的,没有报警或者警告现象。


二、问题判断思路

通过上面这些现象,首先判断NAS硬件应该没问题,NAS存储盘也应该正常,现在Linux无法启动,应该是Linux系统本身存在问题,因此,首先从Linux系统入手进行排查。


三、问题处理过程

1、第一次处理过程

NAS系统本身就是一个Linux内核装载了一个文件系统管理软件,管理软件可以对系统磁盘、系统服务、文件系统等进行管理和操作,正常情况下,基于Linux内核的NAS系统应该启动到init3或者init5模式下,由于NAS仅用了Linux一个内核模块和几个简单服务,所以判断NAS下的Linux系统肯定是启动到init 3模式下,那么现在无法启动到多用户字符界面下,何不让Linux直接进入单用户(init 1)模式下呢,因为单用户模式下仅仅启用系统所必须的几个服务,而cpus服务是应用程序级别的,肯定不会在“init 1”模式下启动,这样就避开了cups无法启动的问题,所以,下面的工作就是要进入Linux的单用户模式下。

很多的Linux发行版本都可以在启动的引导界面通过相关的设置进入单用户模式下,通过查看NAS的启动过程,基本判断这个Linux系统与RHEL/Centos发行版极为类似,因此,就通过RHEL/Centos进入单用户模式的方法试一试。

RHEL/Centos进入单用户模式很简单,就是在系统启动到引导欢迎界面下,按键e,然后编辑正确的内核引导选项,在最后面加上“single”选项,最后直接按键“b“即可进入单用户了。

接下来,重新启动NAS,然后硬件自检,接着开始启动Linux,一直在等待这个NAS的启动欢迎界面,但是欢迎界面一直没出来,就直接进入内核镜像,加载内核阶段了,没有内核引导界面,如何进入单用户啊,经过简单思考,还是决定在硬件检测完毕后直接按键盘”e“键,奇迹出现了,还真的可以,NAS进入到了内核引导界面,通过简单观察,发行第二个正是要引导的内核选项,于是移动键盘上下键,选择这个内核,然后在按键”e“,进入内核引导编辑界面了,在这行的最后面,输入“single”,然后按回车键,返回上个界面,接着按键“b”开始进行单用户引导,经过一分钟的时间,系统如愿以偿的进入了单用户下的shell命令行。

进入单用户模式后,能做的事情就很多了,首先要做的就是将cups服务在多用户模式下自启动关闭,执行命令如下:

chkconfig --levle 35 cups off

执行成功后,重启系统进入多用户模式下,看看系统是否能正常启动。

2、第二次处理过程

将cups服务开机自启动关闭后,重启NAS,发现问题依旧,NAS还是启动到cups服务那里停止了,难道上面的命令没有执行成功吗?明明已经禁止了cups服务启动了,怎么还是启动了呢?于是,继续重启NAS,再次进入单用户模式下,看看问题究竟出在哪里了。

进入单用户后,再次执行chkconfig 命令,依旧可以成功,难道是cups服务有问题,先看看配置文件,执行如下命令:

vi /etc/cups/cupsd.conf

在这里发现了一个问题,vi打开cupsd.conf时,提示“write file in swap”,文件明明真实存在,怎么说在虚拟内存中呢,经过思考,只有一种可能,NAS设备的Linux系统分区应该没有正确挂载,导致在进入单用户的时候,所有文件都存储在了虚拟内存中,要验证非常简单,执行“df”命令查看即可,如下图所示:

从这里可以看出,Linux的系统分区并未挂载,通过"fdisk -l"检查下磁盘分区状态,输出如下图所示:

通过输出可知,NAS的系统盘是/dev/sda,仅划分了/dev/sda1和/dev/sda2两个系统分区,而数据磁盘是经过做RAID5完成的,在系统上的设备标识分别是/dev/sdb1和/dev/sdc1,由于单用户默认没有挂载任何NAS磁盘,这里尝试手动挂载NAS的系统盘,执行如下命令:

[root@NASserver ~]#mount /dev/sda2 /mnt

[root@NASserver ~]#mount /dev/sda1 /opt

这里的/mnt、/opt是随意挂载的目录,也可以挂载到其他空目录下,挂载完成,分别进入这连个目录看看内容有什么,如下图所示:

通过这两个内容的查看,初步判断,/dev/sda2分区应该是Linux的根分区,而/dev/sda1应该是/boot分区。现在分区已经挂载上去了,再次执行df命令看看挂载情况,如下图所示:

到这里为止,发现问题了。/dev/sda2磁盘分区已经没有可用的磁盘空间了,而这个分区刚好是NAS系统的根分区,根分区没有空间了,那么系统启动肯定就出问题了。

下面再把思路转到前面介绍的案例中,由于系统cups服务在启动的时候会写启动日志到根分区,而根分区因为没有空间了,所以也就无法写日志了,由此导致的结果就是cups服务无法启动,这就解释了此案例中NAS系统每次启动到cups服务就停止的原因。

四解决问题

由于NAS系统只有根分区和/boot分区,所以系统产生的相关日志都会存储在根分区中,现在根分区满了,首先可以清理的就是/var目录下的系统相关日志文件,通常可以清理的目录有/var/log,执行如下命令查看/var/log日志目录占据磁盘空间大小:

[root@NASserver ~]#  du -sh /var/log

50.1G    /var/log

通过命令输出发现/var/log目录占据了根分区仅70%的空间,清理这个目录下的日志文件即可释放大部分根分区空间,清理完毕,重启NAS系统,发现系统cups服务能正常启动了,NAS服务也启动正常了。

一次因NAS存储故障引起的Linux系统恢复案例相关推荐

  1. linux nas目录老是掉,Linux运维:NAS存储故障案例

    原标题:Linux运维:NAS存储故障案例 1.故障现象描述 NAS 操作系统 内核为 Linux ,自带的存储有16块硬盘,总共分两组,每组都做了RAID5, Linux无法正常启动,在服务启动到c ...

  2. linux系统挂载emc存储,EMC-VNX5100存储设备挂载到linux系统

    1.安装软件PowerPath: #rpm -ivh EMCpower.LINUX-5.7.1.02.00-004.el6.x86_64.rpm 2.PowerPath许可证注册: #emcpreg ...

  3. 华为3COM NAS 存储 XFS文件系统数据恢复案例及方案

    最近接到一个华为3COM NAS存储故障咨询电话,以下是达思数据恢复工程师提供的数据恢复方案. 故障描述及检测结果: NAS文件目录出现异常,有些目录下大部分文件丢失,还有少量文件能访问,有些目录下会 ...

  4. linux下挂载nas存储异常处理

    1.故障现象: 挂载nas前,需要挂载nas存储的目录权限和所属者设置: drwxr-xr-x  5 www www 4096 Apr 21 11:50 nas_storage 使用如下命令进行nas ...

  5. 基于华为高端NAS存储双活的POC测试

    [摘要]近年来,银行业积累了越来越多的非结构化数据,在业务场景和存储系统建设上都在不断进行优化.本文以作者所在企业的业务需求以及存储系统优化实际出发,在高端NAS存储双活系统上线前进行了深度POC测试 ...

  6. 家用nas存储,家庭个人云推荐

    Nas是什么 NAS是一种网络连接的存储设备,是一种小型的在线计算机,通常用于备份计算机和向本地网络上的设备提供文件.它包括至少一个但通常是两个(或更多)硬盘,一个(通常)基于Linux的操作系统,为 ...

  7. 网络存储技术:DAS存储、NAS存储和SAN存储

    目录 一.直连式存储(DAS) 二.网络直连式存储(NAS) 三.存储网络(SAN) 四.NAS与SAN的区别 网络存储技术(Network Storage Technologies)基于标准网络协议 ...

  8. 网络存储nas linux,群晖NAS存储nas服务器linux网络存储服务器nas网络存储器

    群晖NAS存储nas服务器linux网络存储服务器nas网络存储器 网际百科资讯    知识宝库    2021-2-20    619    0评论 我们今天来了解群晖,NAS存储,nas服务器,l ...

  9. 华为联合openEuler发布全新NFS+协议,实现NAS存储性能与可靠性倍增

    在openEuler开发者大会2023上,华为携手openEuler发布NFS+协议,实现单客户端访问NAS存储可靠性提升3倍.性能提升6倍,助力NAS存储全面满足新型生产核心场景下苛刻要求. 在数字 ...

最新文章

  1. 视频 + PPT 下载 | 挣脱流量束缚,社交电商的未来在哪里?
  2. html laber上下居中,CSS未知高度垂直居中的实现
  3. 「Python」为什么Python里面,整除的结果会是小数?
  4. 计算机比特块的输出概念,第1讲-比特的概念及计算机的组成原理.ppt
  5. Number 和 Math 类
  6. 惠普台式电脑引导不了系统_惠普电脑进入bios设置引导模式操作步骤图文
  7. idea快捷键,可摆脱鼠标
  8. win10桌面穿越,多桌面切换
  9. linux中tmp文件在哪,学习LINUX入门,/tmp文件夹
  10. ART 虚拟机 — Interpreter 模式
  11. 将 ERP 与 PPM 系统集成的 5 个理由
  12. Unity 的 Scroll View组件
  13. Excel如何完成多权重计算
  14. 稀疏表示中KL1p库的配置及Demo
  15. MOSFET管(MOS管)基础
  16. centos发现网络连不上了,重启网络服务报错“systemctl status network.service” and “journalctl -xe” for details. [失败]
  17. 【笔记】input data to the valid range for imshow with RGB data [0..1] for floats or [0.255] for integers
  18. 服务器阵列卡安装win7系统,乐扩阵列卡IO-PCE9230-4IR组阵列方法和windows7系统安装到阵列组详细讲解(附视频) - 常见问题 - 技术支持 - 乐扩...
  19. 用ABBYY把PDF如何转换成HTML的方法
  20. HBuilder webApp开发(七)微信/QQ/新浪/腾讯微博分享

热门文章

  1. python调用数据库数据类型_ajax 读取python的数据库数据类型
  2. 坚果 android 系统升级,坚果手机的系统是什么?坚果手机能升级安卓5.0吗?
  3. java changelistener_ListChangeListener.Change
  4. java编写最大公约数_Java编写最大公约数和最小公倍数
  5. mysql属性配置提高查询_MYSQL性能优化-安装时优化参数配置提高服务性能
  6. 求矩阵两条对角线元素之和
  7. 数据结构,堆和栈和队列的概念
  8. 个人建议之PHP面试的准备
  9. Pycharm去掉项目所有 # 注释
  10. MySQL , MHA , Haproxy 配置