全程约5小时高清,140多页ppt,8大实验,基于x86_64的Centos 7.6arm64,提供全套实验素材和环境。全面介绍kdump+crash在死机黑屏方面的实战应用,全部案例源自线上云服务器和嵌入式产品开发实际案例!

看死机黑屏专题,今年薪水翻一番!!

订阅方法:(进入taobao店搜索店铺:奔跑吧linux内核总店)

1. 直接订阅。

原价:399

早鸟价格:299 (截止3月底)

2. 订阅第一季+第二季旗舰篇,送:

*价值399元的死机黑屏专题视频+

*签名本奔跑吧入门篇纸质书,

优惠多多,干货满满,今年加薪!!

 小明是某IT公司的资深架构运维攻城狮,一次,老板来了个大活,给A股某个券商安装系统。第一天开盘,股价一直狂跌,然后就死机了,老板损失惨重。老板喊小明来解决。小明翻遍了某哥的私房宝典,也找不到解决办法,两手一摊:搞不定,要找红帽。老板怒:滚

现在是Linux系统大行其道的年代,虽然Linux系统是由全球顶尖的程序猿开发的,但是蛮难不会发生死机黑屏的问题。就连牛气冲天的微软也经常在关键时刻蓝屏死机。小的时候看到windows蓝屏死机了,总在想,如果我能分析出来蓝屏死机的原因就牛了。

windows的死机

Linux的死机黑屏

可是到了今天,依然不会分析windows蓝屏死机,但是如果今天你还不会分析Linux内核的黑屏死机的话,就会被淘汰了。不管你是Linux/Centos运维还是Linux驱动内核研发,不管有多少个RHEL的认证证书,什么RHCE/RHCA(Red Hat Certified Architect, 红帽最高级的架构师证书)只是敲门砖,重要的是帮助老板和客户快速定位和解决RHEL/Centos或者产品的死机黑屏问题。

01 Kdump+Crash介绍

1.  kdump+Crash工具是啥?

当系统发生崩溃的时候,需要有一种方法能把发生崩溃时候的现场(上下文)保存下来,提供给系统管理人员和开发人员进行定位分析。早在2005年的时候,kdump这个想法已经实现了,到了现在各大Linux发行版都支持kdump,包括RHEL和Centos。

当系统崩溃时,kdump 使用 kexec 启动到第二个内核。第二个内核通常叫做捕获内核,以很小内存启动以捕获转储镜像。第一个内核保留了内存的一部分给第二内核启动用。由于 kdump 利用 kexec 启动捕获内核,绕过了 BIOS,所以第一个内核的内存得以保留。这是内核崩溃转储的本质。

2. kdump+crash工具能解决啥问题?

笨叔把死机黑屏有两种情况,从CPU角度来看:

一种是真死:比如硬件的bug把系统总线挂死,CPU也不跑了,这是真死。这种情况有一个显著的特点:就是系统需要 poweroff下电(也叫冷启动)之后才能恢复,热启动是不行的。冷启动之后,发生奔溃的现场就从DDR内存里消失了。

第二种是假死:假死是我们看到设备没反应了,屏幕灭了,键盘鼠标也不动,ssh也访问不了等等,但是CPU是活的,这种没有相应的死,笨叔把它叫做假死,英文称为unresponsive,好比一个人休克了,但是心脏还是跳动的,医生可以利用电击等手段救活。

kdump+crash工具最擅长医治假死的情况,百医百治,药到病除。对于第一种情况,因为系统需要把电重新上电才能启动,kdump无计可施了,遇到这种情况只能上硬件仿真器等等了。

3. kdump+crash工具在Centos上的安装

kdump+crash工具在Centos 7.x系统上已经很成熟了,简单几步就安装完成。

4. 怎么测试kdump+crash工具已经部署成功?

输入命令“service kdump status”可以看到kdump服务是否配置成功。

输入如下命令可以测试:

# echo 1 > /proc/sys/kernel/sysrq ; echo c > /proc/sysrq-trigger

如果没有问题,系统会自动重启,重启后可以看到在/var/crash/目录下生成了coredump文件。

5. Crash工具有哪些常用的命令。

crash工具一共有50个命令,常用的命令也就那么几个,大家可以跟着笨叔的视频一起来学习常用的几个命令。

6. 怎么在arm64环境下玩kdump+crash?

很多小伙伴可能会对ARM64更感兴趣,希望可以搭建一个免费的可以玩的平台。笨叔教大家怎么在Host主机里利用Qemu安装一个Debian for ARM64系统,然后在里面玩kdump+crash,即免费又好玩,省去买开发板的钱。

02 kdump+crash死机案例分析

笨叔在这一次挑战死机的专题视频中,设计了8个死机案例,分别有:

lab1:简单的空指针引发的panic

lab2:访问已经被删除的list head链表

lab3:复杂一点的空指针引发的panic

lab4:一个真实的驱动引发的死机

lab5:一个真实的驱动引发的死锁,导致系统死机

lab6:如何找到函数调用参数的在栈中地址然后获取具体的值

lab7:分析一个复杂的线上死锁导致的死机黑屏例子

lab8:  手工恢复函数调用栈backtrack (arm64)

lab1: 简单的空指针引发的panic

一个简单的例子,来让我们看看如何使用kdump+crash工具来定位问题。

运行crash工具之后。

crash工具简单明了的告诉你panic的原因。

用bt命令可以查看发生崩溃时的内核栈调用关系backtrace,通过backtrace来反推发生了神马事情导致内核崩溃了。RIP寄存器指示了发生错误的具体地址。

通过反汇编dis命令就可以看到具体出错是在那条指令了,是不是入门很easy?

如果你觉得上面三板斧就是crash的全部,那就大错特错了,crash工具迷人的地方,就像警察破案,需要一步一步进行推理和推导。

lab4:一个来源于真实驱动例子的死机

上面是来自项目上一个小朋友写的驱动。这个驱动,一上来就死机给你一个下马威,你能看出来是真名原因导致的死机吗?

如果一下子看不了,没关系,可以来看笨叔的[死磕死机专题]视频节目。

lab6:推导函数形参的存储位置和具体的值

我们常常在进行死机分析和推理的过程中,需要分析调用函数的形参具体存放在哪里?然后就可以知道在崩溃时刻,这些形参都是具体什么值,这些值是非常珍贵的破案现场,这个过程是非常有意思的。

这是非常高级而且有用的技巧,您需要了解x84_64或者arm64体系结构的参数调用规则,以及栈是如何布局的。另外还需要结合反汇编来进行推导。

在这个实验里,笨叔教大家如何通过反汇编+backtrace,来推导出在泪崩时刻,create_oops()函数的第二和第三个参数具体存放在哪里?他们具体的值又是多少?

lab7:一个复杂的死锁死机例子

一个来源真实线上云系统死锁导致的死机的案例。

通过这个例子的学习,我们有能力和有信心去解决线上服务器或者产品发生死机黑屏的问题,我们不再是只会安装Centos系统的小运维工程师了,我们开始会分析和定位复杂的死机问题了,给老板展示我们的硬实力!!!

lab8:手动恢复函数调用栈(arm64)

这是一个非常高的技巧,在死机实战过程中是非常有用的神技。重要是要明白和理解ARM64的函数调用的协议(procedure call standard)以及栈帧是怎么布局 和组织的。

说了这么多,小伙伴会问,怎么参加笨叔的死机专题视频学习?

死机专题视频课程分成上下两集,全程5小时高清视频,140多页ppt,8大死机案例:

上集:x86_64专场,讲述Centos 7.x系统的死机案例分析 (3个多小时)

下集:ARM64专场 (约1.5小时)

全球唯一和独一无二的手把手解决死机问题的视频,只在奔跑吧Linux社区!

笨叔的微店(长按识别二维码进店):

或者淘宝店:搜索 “奔跑吧Linux内核”

[往期精彩]

《奔跑吧Linux内核》第二版意见收集

[代码导读4]物理页面分配

[代码导读3] 页表映射过程

第二季旗舰篇终于来了,进程管理、中断管理和锁机制三合一

[旗舰篇] 第一季旗舰篇资料汇总

不能不会的VIM+GIT

《奔跑吧Linux內核》繁體版預覽

[笨叔点滴15]ARMv8里异常处理哪些蛇神牛鬼 2

[笨叔点滴14] ARMv8里异常处理哪些蛇神牛鬼 1

[笨叔点滴13]哪些异常处理的事儿

[笨叔点滴12]面试必考:如果在中断处理函数里发生了缺页中断会怎样?为什么?

[笨叔点滴11] malloc惹的祸

[笨叔点滴10] 中断到“底”来了吗?

[笨叔点滴9] GNU GCC扩展2

[笨叔点滴8] GNU C语言的扩展

[笨叔点滴7] 再也回不去的C语言

[笨叔点滴6] 叔,这个git咋玩啊?

[笨叔点滴5] git rebase和git merge究竟有啥区别?

[笨叔点滴4]“栈”谁便宜了2

[笨叔点滴3] “栈”谁便宜了?

[笨叔点滴2] 为啥子ARM32体系结构中每个处理模式都有一个单独的栈?

[笨叔点滴1] 为什么do_page_fault函数里代码需要判断用户态还是内核态?

LinuxCon 2018北京游记(1)

LinuxCon2018北京笨叔笨游记 2

《奔跑吧linux内核》配套资源迁移到码云上

考点来了:4月18号视频更新

代码导读之如何使用qemu来单步调试head.S

代码导读之内存管理初始化 - 启动汇编

视频更新:内存管理代码框架导读

DMA那些事儿

私密VIP群答疑

高级运维必杀技:如何图形化单步调试RHEL/Centos 7里的内核?

首发:Meltdown漏洞分析与实践

[奔跑吧Linux内核] 故乡

致敬Beyond

ubantu 黑屏_死机黑屏专题上线啦,早鸟只要299,看完薪水翻一番相关推荐

  1. android x86 笔记本卡屏,笔记本死机卡屏怎么办

    笔记本死机卡屏的解决方法:首先按住键盘上ctrl+alt+del,弹出任务管理器:然后在弹出任务管理器中选择explorer.exe:接着右键点击explorer.exe,在弹出菜单中选择" ...

  2. 黑苹果睡眠重启后死机_iPhone卡屏、死机、黑屏?| 学会这招,秒解!

    对于喜欢折腾手机的用户来说,最害怕遇到的就是手机卡屏.死机.黑屏了,当然,遇到这样的情况也不必担心,因为这些问题大都有一些万能的解决办法:刷机重启.卸载重装.清除数据.这些办法可能对于Android用 ...

  3. iphone无线服务器未响应,iphone8无限转圈黑屏强制关机没反应(解决死机黑屏无法开机的3种方式)...

    原标题:iphone8无限转圈黑屏强制关机没反应(解决死机黑屏无法开机的3种方式) 在苹果手机的使用者之间,苹果手机死机.黑屏无法开机的情况常有发生. 苹果黑屏.白屏 比如像这样黑屏.白屏.还有那种苹 ...

  4. 计算机考试是电脑卡住了怎么办,CPA机考时,电脑黑屏、死机了怎么办-之了课堂...

    距离2020年注册会计师考试还有10天左右的时间,大家都准备的怎么样呢?众所周知,注册会计师考试是机考,就是电脑作答,那么电脑作答最怕的就是突然死机或者黑屏,近期就有考生来咨询之了君:CPA机考时,电 ...

  5. Z97-A 触发掉电-自动上电-掉电循环或者亮机后死机黑屏

    Z97-A 触发掉电-自动上电-掉电循环或者亮机后死机黑屏 经检测发现1.05V_ME这个电压低0.3V左右,此时是循环上电掉电.要么就是过高1.8V左右,此时是死机黑屏. 更换此供电IC即可.

  6. 计算机死机黑屏怎么办,电脑显示屏突然死机黑屏怎么办

    电脑显示屏突然死机黑屏怎么办 电脑显示屏突然死机黑屏怎么办?会是什么原因呢?应该怎么办呢?下面就一起来了解看看吧! 电脑突然莫名的死机,很有可能是以下的几点原因导致的: CPU风扇不工作或散热不好,检 ...

  7. win10+ubuntu系统最稳妥的安装方式(登录黑屏、死机、自动关机、屏幕跟摔碎了一样,没有无线驱动请点进来。)

    这是博主经过无数次的错误得到的最稳的一种安装方式了,因此记录整理记录下来 先说一下,目前绝大多数(百分之90的安装出问题都跟显卡和win10的安全启动有关) 第一步:前期电脑设置的准备(biso问题看 ...

  8. code01 v2黑屏、花屏、死机、断电重启、休眠死机的进来

    症状解决 长话简说,症状如下: 使用浏览器.播放视频等,遇到突然死机或花屏死机的情况 关闭硬件加速,如:浏览器中设置关闭硬件加速,出现这种症状的软件都需要设置 开机电流音.播放与暂停时喇叭吱吱想.打开 ...

  9. 苹果手机突然黑屏_手机突然黑屏该怎么办?别慌张,你可以这样解决!

    随着网络信息化时代的高速发展,手机支付和各种app产品进入我们的实现,人们越来越依赖手机,但长期的使用手机难免会让机器出现这样那样的问题,比如卡顿.发烫.黑屏等情况的发生,尤其在我们进行通话或娱乐游戏 ...

最新文章

  1. php扩展xdebug基本使用
  2. hdu4763 KMP
  3. php socket主动推送消息,PHP使用WebSocket主动推送【微信小程序接收】
  4. 基于JAVA+Servlet+JSP+MYSQL的在线汽车订票系统
  5. C++ 为什么要引入异常处理机制
  6. c# asp.net 修改webconfig文件 配置
  7. 从“富客户端”(RIA)说到 Flex AIR
  8. linux非yum安装svn,linux安装svn(yum安装)
  9. 几种国内芯片测序格式和 Illumina Omni 位点集格式的对比
  10. 电脑重装系统按哪个键进入u盘启动项
  11. 谷歌的AI布局:机器学习是重心 继续在中国招人
  12. 【已解决】python pymysql报错DataError (1265, Data truncated for column ‘num‘ at row 1)
  13. 安装ale_python_interface报错
  14. 全球十大外盘外汇交易平台排行榜
  15. 【计算机网络】(一)走进网络
  16. 《数据结构》实验报告五:二叉树
  17. 今天不谈电商,只聊搜狐的大数据实践!
  18. 冬天买什么绒的四件套好用
  19. 发个真正高效清理垃圾的脚本(请慎用,效果很强)
  20. [操作系统] 分页存储管理中的页表项、逻辑地址、物理地址的计算

热门文章

  1. 第一个Vert.x程序
  2. Linux技术在桌面领域的应用,Linux桌面领域7大趋势介绍
  3. 「爬虫入门」拒绝跟热点搞python,直接在浏览器里体验『第一次』,理解原理=>如鱼得水
  4. 【数据结构笔记15】优先队列、堆、最大堆、堆的操作(插入、删除、建立)与C实现
  5. 【数据结构笔记13】C实现:判别是否是同一颗二叉搜索树(BST)
  6. ios9上传到app store报错
  7. http请求pom 客户端_RPC之HttpClient与OkHttp3的实现,服务端知识点
  8. ISE_FIFO_IP核接口测试(二)
  9. Verilog 语法点使用————(持续更新)
  10. Stanford Parser的学习之开篇(一)