分析Crash Dump
通常crash dump 是由响应中心进行分析的,因为深入地分析需要对操作系
统的内部有深入地了解。然面有时crash dump 的原因很简单,如果能够很快找到
原因,就会缩短解决故障的周期。
下面只介绍一种最简单的方法,需要用到Q4 工具(默认安装都有)。
#cd /var/adm/crash/crash.0 #enter the dump dir you want to analysis
#q4pxdb vmunix #may not be neccessary
#echo "run WhatHappened" | q4 -m –Np . > wh.txt
以上命令通过调用名为WhatHappened 脚本将系统发生crash 时的状况大致列出来,保存到wh.txt 文件中。如果Crash 是因为MC/SG 发出的TOC 命令,或是因为HPMC 等原因,在这里就已经可以清楚地看到了。

Core dump的几种类型总结:
Core dump的几种类型总结:
Panic ----这种类型主要是kernel问题,是可以通过修补系统解决的,一般是系统造成。
HPMC --- High Priority Machine Check.。这通常是硬件出了问题。比如CPU,memory或者I/O总线等等。
Hang --- 一般是在系统运行大量进程,导致系统资源不足引起的,系统本身并没有问题。或许资源过一段时间会释放。不过有时也有可能是硬件或者系统bug引起。
下面简单介绍一下HPMC
High Priority Machine Check,是服务器确保可靠性的措施之一。
当系统发现了某些可能会影响数据完整性的错误时,例如CPU data cache检验错,就会发出一个HPMC,记录相关信息以供分析,并使主机重起要求对错误进行纠正。与之相对应的是LPMC,Low Priority Machine Check,这样的错误通常比较轻微,例如内存发生single-bit parity error, 内存的校错机制可以在single-bit error时自动纠错,所以通常LPMC只是在syslog中与mstm log中加一行日志。
HPMC一般说来与OS无关,是硬件层面上的。在极个别的情况下,软件也会引发HPMC。 收集HPMC 在发生HPMC时,故障发生时CPU的状态等信息会被保存下来。
分析HPMC的第一步就是取得这些信息。
收集HPMC信息的途径有多种,在PDC菜单中SER->PIM,或是在mstm中对CPU设备get information,/var/tombstones下的tsXY文件等都可以找到HPMC的记录,可以根据当时的情况选择合适的方法。
通常比较方便的办法是看/var/tombstones/下与系统重起日期吻合的文件,ts99是最新的文件,每次系统重起都会产生一个新的ts99。如果发现这些文件中没有相关的信息,检查/etc/rc.config.d/pdcinfo中PDCINFO是否设为1。
分析HPMC
分析HPMC同样是一种艺术,需要丰富的知识和经验,上过相关课程的应该记得那些框图有多复杂。通常工程师在现场收集相关的信息交由响应中心进行处理。但是基于与处理crash dump相同的理由,自已处理一些简单的case并非不可能。

HPUX分析Crash Dump_q4pxdb vmunix相关推荐

  1. IOS反汇编工具Hopper分析Crash Log

    2019独角兽企业重金招聘Python工程师标准>>> 在Mac OS下分析Crash Log有很多种方法,这里不是要说明如何分析的Crash Log, 主要是展示下Hopper的使 ...

  2. C++ 利用 windbg + dump + map + cod 文件分析 crash 原因

    目录 如何生成 dump 文件 如何生成 map 文件 VS生成 cmake 命令 如何生成 cod 文件 VS 生成 cmake 命令 找 crash 地址 step 1 step2 step3 附 ...

  3. iOS通过dSYM文件分析crash

    http://blog.csdn.net/hjy_x/article/details/20929095 重点是dwarfdump --uuid命令 我们在ios开发中会碰到的很多crash问题,如果D ...

  4. 分析Crash report

    分析Crash report Apple的官方文档:Understanding and Analyzing iOS Application Crash Reports iOS设备上,当app崩溃时会创 ...

  5. 分析 crash 报告的方法

    最近上传的一个app,被苹果打回来了,原因是在下载完成之前会挂掉. 还带有4个crash报告. Incident Identifier: 926328CE-927A-4D1B-940C-B17A0CD ...

  6. 分析Crash 日志一

    分析Crash 日志 1.Header Incident Identifier: B6FD1E8E-B39F-430B-ADDE-FC3A45ED368C CrashReporter Key: f04 ...

  7. 使用addr2line分析crash问题

    addr2line分析crash问题 addr2line功能 addr2line使用 addr2line功能 addr2line可以通过解析地址来定位异常发生在哪个文件,哪个函数,哪一行:不过只对编译 ...

  8. Android studio中NDK开发(四)——使用addr2line分析Crash日志 backtrace

    文章目录 一.前言 二.分析 1.先提取backtrace部分 2.提取对应so库的信息 3.提取错误地址 三.使用addr2line对地址进行转换 1.addr2line工具的路径放在 2.Term ...

  9. 怎样分析crash dump(内存错误)

    Memory错误 在内核中,内存是以cache的形式组织的,每个对象类型对应一个cache,如(inod_cache,dentry_cache, buffer_head,vm_area_strutct ...

最新文章

  1. Nacos 1.1.4 发布,业界率先支持 Istio MCP 协议
  2. Intel汇编语言程序设计学习-第二章 IA-32处理器体系结构-下
  3. nbu无法运行java控制台_Netbackup:nbu常见错误及故障解决
  4. junit 循环测试_重复运行JUnit测试而没有循环
  5. 面向对象的相关面试题
  6. 【AI视野·今日CV 计算机视觉论文速览 第217期】Thu, 10 Jun 2021
  7. CVPR2021 | 用Transformers无监督预训练进行目标检测
  8. 风变Python3---if条件相关的学习
  9. 洛谷-神奇的幻方-NOIP2015提高组复赛
  10. Mysql批量添加数据
  11. fiddler ctrl+r 打开scripteditor提示报错提示fse2.exe不存在
  12. python去重drop_duplicates后一定要reset_index()
  13. carry函数在C语言中用法,动词carry用法小归纳
  14. TEMPO ESTIMATION近几年文章总结
  15. 服务器 无线键鼠,几台电脑一套键鼠 不光省钱还方便
  16. 电子设计教程4:稳压管稳压电路
  17. Nginx负载均衡探活max_fails和fail_timeout的设置、根据参数转发upstream
  18. windy定义了一种windy数,不含前导零且前两个数字只差至少为2的正整数被称为windy数,求A和B之间windy数的个数
  19. 移动端和PC端的pdf预览与下载
  20. 5-27 冒泡法排序 (20分)

热门文章

  1. centos解压分卷rar_centos解压和压缩rar格式文件
  2. html5执行shell,利用nginx执行Shell 脚本
  3. Hadoop(七)Hive基础
  4. linux 编辑文件vim,linux下通过vim编辑文件的方法
  5. OpenShift 4 - 用 Quay Operator 安装 Quay 环境(4.10 修正)
  6. Odoo10教程---模块化三:模型约束,高级视图,工作流,安全性,向导,国际化和报表等
  7. python新闻联播分类_如何利用人脸识别自动切分视频
  8. iphone7防水_iPhone11系列防水测试,其结果令人意外
  9. python vbscript_将VBScript转换为Python
  10. python消息队列celery_python异步任务神器celery