作为一名运维工程师经常会遇到各式各样的系统故障,如何根据故障特征锁定问题根源,需要的不仅仅是技巧,还有遇到故障时的思路,和对系统内部的理解,本文列出了一些常见的系统故障和处理方法,在那之前首先需要对系统启动流程有一个比较完整意义上的了解,以便问题出现后判断其属于哪个环节。

Linux系统启动流程的基本知识

1、加电自检(PowerOnSelfTest)

开机自动映射rom中程序到cpu可以寻址的空间中,cpu执行指令检查基本硬件是否正常

2、BIOS(Boot Sequence)

如果正常则按照CMOS中保存的BootSequnece依次寻找对应设备上的MBR

3、MBR(BootLoader)

读取第一个MBR存在的设备中的BootLoader,并交与其控制权。

Linux下的常见BootLoader有两种:

LILO: LInux LOader(不能引导1024柱面以后的分区内核(嵌入式))

GRUB: GRand Unified Bootloader

MBR空间有限,无法展示其特性,所以将GRUB分为2阶段程序,如下:

Stage1(被装载MBR当中)                主要目的是为了引导第二阶段

Stage1.5(/boot/grub/Stage1_5)   识别常见不同类型的文件系统

Stage2(/boot/grub/Stage2)         引导操作系统(突破了446字节的限制)         并借助配置件/boot/grub/grub.conf

4、Kernel

设备探测

驱动初始化(可能会从initrd(RHEL6 initramfs)文件中装载驱动模块)

为内核提供访问根文件系统的基本驱动能力

以只读挂载根文件系统

装载第一个进程init

5、init(etc/inittab)

/sbin/init         其配置文件(etc/inittab)

/etc/inittab     主要任务如下:

1、设定偶人运行级别

2、运行系统初始化脚本

3、运行制定运行级别目录下的脚本

4、设定Ctrl+Alt+Del组合键的操作

5、定义UPS电源在电源故障/恢复时执行的操作

6、启动6个虚拟终端(2345级别)

7、启动图形终端(5级别)

常见系统错误

1、忘记密码

启动进入单用户模式

使用passwd修改root密码

2、bootloader损坏

载入安装光盘进入紧急救援模式

进入grub模式

重复成功

3、bash丢失系统无法启动

进入救援模式后

4、加密grub和内核

5、因某服务异常导致系统无法启动

总结七个点:

1、确定问题的故障特征

2、重现故障

3、使用工具收集进一步信息,确定问题根源

4、排除不可能的原因

5、定位故障

6、备份源文件

7、尽可能借助于工具

Linux常见系统故障排除相关推荐

  1. linux系统故障实验,Linux常见系统故障排除

    导读: 前言 运维人员经常会遇到各式各样的系统故障,如何根据故障特征锁定问题根源,需要的不仅仅是技巧,还有遇到故障时的思路,和对系统内部的理解,本文列出了一些常见的系统故障和处理方法,在那之前首先需要 ...

  2. Linux学习笔记2(root密码忘记重置,Linux系统更新yum源,YUM安装卸载,常见故障排除,vim,用户/组)

    目录 Linux忘记root密码 CentOS     Kali 更新软件源 CentOS 更新yum源(阿里源配置方法) Kali 更新apt源 ​yum安装,卸载 Yum 简介 常用的 Yum 命 ...

  3. linux系统无法启动 备份恢复,Linux运维 第二阶段 (十四) 备份与恢复及常见故障排除...

    Linux运维 第二阶段 (十四) 备份与恢复 常见的系统故障排除(经常备份源文件,尽量借助于工具): 1.确定问题的故障特征 2.重现故障 3.使用工具收集进一步信息 4.排除不可能的原因 5.定位 ...

  4. linux 系统盘无法ls,系统故障排除

    1.系统故障排除 1)模拟磁盘/dev/sda的MBR故障,并执行修复 01.备份磁盘/dev/sda的MBR扇区 选择一个/dev/sda以外的文件系统(比如/dev/sdb1)来存放备份文件: [ ...

  5. ceph(7)--Ceph 的基本操作和常见故障排除方法

    本系列文章会深入研究 Ceph 以及 Ceph 和 OpenStack 的集成: (1)安装和部署 (2)Ceph RBD 接口和工具 (3)Ceph 物理和逻辑结构 (4)Ceph 的基础数据结构 ...

  6. linux的的符号,Linux 常见特殊符号

    Linux 常见特殊符号 1,> 重定向输出符号 用法:命令 >文件名 特性:覆盖(当输入文件和输出文件是同一文件,文件内容被清空:不适合连续重定向) 典型应用:合并文件(cat a b ...

  7. Linux常见疑难问答

    Linux常见疑难问答 (1)按a~z顺序排列启动服务进程. exportLC_ALL=C#英文环境变量设置,主要用于解决乱码问题 chkconfig–list|grep[z-a]:|grepon$s ...

  8. flink常见故障排除

    本博客总结为B站尚硅谷大数据Flink2.0调优,Flink性能优化视频中常见故障排除的的笔记总结. 1. 非法配置异常 如果看到从 TaskExecutorProcessUtils 或 JobMan ...

  9. 我所用的一些linux常见命令

    linux常见命令 自用的一些命令,特地整理下来,以备以防不时之需 .. //上级目录 ./ //当前目录 / //根目录cd cd.. //返回上级目录 cd~ //home目录 cd- //返回之 ...

  10. Linux常见死机原因

    Linux常见死机原因 在排除了硬件故障/firmware版本/BIOS等等问题之外, Linux死机通常可能碰到如下几种情况 1, 如果你的Linux死机的时候控制台上有乱七八糟的字符.恭喜你,这种 ...

最新文章

  1. DASH流媒体MPD文件存储
  2. Unity3D中暂停时的动画及粒子效果实现
  3. socket多线程方式案例
  4. Leecode题解汇总(附题型归类)
  5. mysql加锁语法_MySql 加锁问题
  6. linux-x86_64 error,ORA-09817/Linux-x86_64 Error: 28: No space left on device/ORA-01075
  7. 怎么保存 html静态页面,静态页面怎么实现,就是把数据写入到html页面在缓存起来?...
  8. The Quad - Directory Explorer(一款四窗口的文件资源管理器)
  9. Javascript ES6 Set、Map、Proxy、Symbol
  10. snmpwalk访问华为防火墙snmp服务超时失败问题
  11. 新移动硬盘 测试软件,西部数据移动硬盘检测工具WD Drive Utilities 2.0.0.54中文免费版...
  12. 你在为谁工作——IT帮深圳分站2019年3月线下活动回顾
  13. 802.11协议精读1:学习资料整理
  14. nginx配置详细说明
  15. android ui web,AndroidUI4Web:最适合Android开发者的WebApp框架
  16. STARK/SNARK加速小技巧
  17. texmaker中图片过大怎么办_latex 图或表和正文间距过大怎么处理
  18. 【每天一个Python小知识】用yaml的yaml.safe_load()方法读取配置文件中的参数
  19. git 问题解决之remote: Permission to xxx/xxx.git denied to xxx.
  20. 前端JS 烧脑面试题大赏

热门文章

  1. Mysql调优(updating~)
  2. 齐治 堡垒机 mysql_齐治堡垒机:让数据库运维审计无死角
  3. 残酷事实:程序员没有真正的「睡后收入」,解决办法是利用「复利思维」放大「复业收入」...
  4. 008_生成设备节点
  5. 快讯分类_如何从Google快讯创建RSS Feed
  6. Pycharm Traceback (most recent call last):
  7. ubuntu 上交叉编译 linaro 的库
  8. Alink漫谈(十一) :线性回归 之 L-BFGS优化
  9. 可用性及测试方法小介绍
  10. 记一次axsi2调用 web services 提示 java.net.SocketException: Connection reset 的解决