[转]如何定位Release程序崩溃原因

Posted on 2011-08-19 10:44 单鱼游弋 阅读(2162) 评论(1) 编辑 收藏

1       案例描述

作为Windows程序员,平时最担心见到的事情可能就是程序发生了崩溃(异常),这时Windows会提示该程序执行了非法操作,即将关闭。请与您的供应商联系。呵呵,这句微软的“名言”,恐怕是程序员最怕见也最常见的东西了。

在一个大型软件的测试过程中,初期出现程序崩溃似乎成了不可避免的事。其实测试中出现程序崩溃并不可怕,反而是测试的成功。作为开发的我们更需要关心的是程序中的哪个函数或哪一行导致了系统崩溃,这样才能有针对性的进行改正。

本文描述了自己总结的几种定位崩溃的办法。

2       案例分析

以下是几种常见的崩溃现象及对应的处理办法:

1.        对于Release版本必现的崩溃且在Debug版本上也崩溃的程序。

解决思路:去掉所有断点,直接在Debug版本上运行程序,在程序崩溃时,VC会自动跳转定位到崩溃代码行, 这种方法最简单也最常用。

2.        对于在Debug版本上不崩溃但Release版本崩溃的程序,很有可能是Debug和Release版本的差异。例如Debug版本所有成员在构造时会被清0,而Release版本所有成员在构造时是内存里面的原始值,而且Debug有运行时库做保护,这些都会导致某些程序在Debug正常而Release崩溃。

解决思路:1)在程序中加打印,通过程序崩溃之前的打印定位出错位置; 2)逐段注释代码,直到程序不崩溃为止。这种方法耗时较长,对程序员要求较高,而且对于那种不是必现的bug或者很难搭建执行环境的情况就较难处理了。

3.        对于在客户现场崩溃的情况,显然不适合直接带一台电脑去调试。

解决思路:应该有文件记录下崩溃信息,客服人员可以将崩溃信息文件发送给程序员,以便程序员查询崩溃原因,然后利用编译时生成MAP文件(工程信息文件,存放在版本编译机中)的信息来定位问题函数或问题代码行。下面就这种方法展开讨论一下:

3       解决过程

对于上节第三种情况,也是最难解决的情况,解决过程如下:

1.      崩溃回调注册,拦截Windows程序崩溃;

2.      在回调处理中,输出崩溃原因,崩溃内存地址,崩溃堆栈;

3.      工程输出map文件;

4.      通过崩溃内存地址以及map文件找出崩溃的函数。

5.      使用COD文件精确定位崩溃行

3.1     崩溃回调注册

实际上,只靠Windows的错误消息对话框提供的信息量是很有限的。用SetUnhandledExceptionFilter注册自定义错误处理回调函数,可以替换Win32默认的异常处理过滤器(top-level exception filter),而且能打印出崩溃堆栈,这对定位崩溃原因非常有用。

SetUnhandledExceptionFilter的函数原型:

LPTOP_LEVEL_EXCEPTION_FILTER SetUnhandledExceptionFilter(

LPTOP_LEVEL_EXCEPTION_FILTER lpTopLevelExceptionFilter );

功  能:注册和注销异常处理回调;

用  法:第一次调用注册异常处理回调,第二次调用注销;

返回值:返回当前的exception filter。需要保存这个函数指针,在注销异常处理回调的时候,以此为参数再次调用SetUnhandledExceptionFilter。打印异常处理也需要此值。

参数: 异常处理的回调函数;

3.2     输出崩溃信息

崩溃信息在异常回调函数中打印,输出到程序执行目录下的文件:

异常处理回调的函数原形:

LONG WINAPI CallBackDebugInfo ( EXCEPTION_POINTERS *pException);

功  能:异常处理回调处理,打印崩溃信息;

用  法:注册自定义错误处理回调:SetUnhandledExceptionFilter (CallBackDebugInfo);

返回值:EXCEPTION_CONTINUE_EXECUTION –  错误已经被修复,从异常发生处继续执行

EXCEPTION_CONTINUE_SEARCH    –  继续查找异常过滤器

EXCEPTION_EXECUTE_HANDLER   –  正常返回

参数: 崩溃信息结构,包含崩溃原因、崩溃模块、崩溃地址、崩溃堆栈等;

常见崩溃原因有:

EXCEPTION_ACCESS_VIOLATION = C0000005h   读写内存错误

EXCEPTION_INT_DIVIDE_BY_ZERO = C0000094h  除0错误

EXCEPTION_STACK_OVERFLOW = C00000FDh  堆栈溢出或者越界

EXCEPTION_GUARD_PAGE = 80000001h 由Virtual Alloc建立起来的属性页冲突

EXCEPTION_NONCONTINUABLE_EXCEPTION = C0000025h不可持续异常,程序无法恢复执行,异常处理例程不应处理这个异常

EXCEPTION_INVALID_DISPOSITION = C0000026h在异常处理过程中系统使用的代码

EXCEPTION_BREAKPOINT = 80000003h  调试时中断(INT 3)

EXCEPTION_SINGLE_STEP = 80000004h  单步调试状态(INT 1)

3.3     输出map文件

map文件记录程序的全局符号、源文件和代码行号信息,是整个程序工程信息的静态文本。通过文本阅读工具如Ultra Edit或记事本就可以打开Map文件。

在 VC 中,打开“Project Settings”选项页,选择 C/C++ 选项卡,并在最下面的 Project Options 里面输入:/Zd ,然后选择 Link 选项卡,选中“Generate mapfile”复选框。并在最下面的 Project Options 里面输入:/mapinfo:lines,表示生成 map 文件时,加入行信息。

最后编译就可以生成 MAP 文件,可以在工程的Debug或Release目录下找到刚刚生成的MAP文件,文件名为“工程名.map”。

3.4     使用map文件找出崩溃函数

      通过上面的步骤,已经得到了 MAP 文件,那么我们该如何利用它呢?下面一步步演示使用MAP文件定位程序崩溃行的过程。

1.我们先在代码中加入非法内存操作(最常见的异常)的代码:

BOOL CMainFrameDlg::OnInitDialog()

{

::SetProp(m_hWnd,AfxGetApp()->m_pszExeName, (HANDLE)1);

s32 *p=NULL;

*p= 123;

2.执行程序,程序在开始就异常,在异常打印文件中打印了如下信息:

======================== 崩溃信息 ==========================

崩溃时间: 2009/06/02 16:58:22

崩溃原因:非法内存操作

异常代码 = c0000005

异常地址 = 0x0045a76f

异常模块: E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

Section name: .text - offset(rva) : 0x0005976f

---------------------- Trips of Stack ----------------------

E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\prj_win32\Release\pcmt2.exe

name : pcmtver - location: 2bef

3.确定崩溃地址是:0x0005976f,在Map文件中定位函数:

0001:00059420 ?OnCreate@CMainFrameDlg@@IAEHPAUtagCREATESTRUCTA@@@Z 0045a420 f   MainFrameDlg.obj

0001:00059460       ?SetTooltips@CMainFrameDlg@@AAEXXZ 0045a460 f   MainFrameDlg.obj

0001:00059700       ?OnTranslate@CMainFrameDlg@@IAEJIJ@Z 0045a700 f   MainFrameDlg.obj

0001:00059730       ?OnInitDialog@CMainFrameDlg@@MAEHXZ 0045a730 f   MainFrameDlg.obj

0001:00059a10  ?OnSysCommand@CMainFrameDlg@@IAEXIJ@Z 0045aa10 f   MainFrameDlg.obj

0001:00059c20       ?OnPaint@CMainFrameDlg@@IAEXXZ 0045ac20 f   MainFrameDlg.obj

根据00059730< 0005976f < 00059a10 ,确定是在CMainFrameDlg 的OnInitDialog函数中的某一行产生了异常。

3.5     使用map代码行定位崩溃行区间

Line numbers for .\Release\MainFrameDlg.obj(E:\ccroot\liuxiaojing_Enterprise\Enterprise_VOB\70-nms1\pcmt2\source\MainFrameDlg.cpp) segment .text

498 0001:00059647   499 0001:00059667   501 0001:0005966e   502 0001:000596af

503 0001:000596ed   506 0001:00059700   507 0001:00059703   508 0001:00059708

510 0001:0005970f   511 0001:00059720   512 0001:00059723   515 0001:00059730

516 0001:0005974e   521 0001:0005976d   524 0001:0005977e   526 0001:0005978b

我们在map文件的代码行信息里查找不超过计算结果0x0005976f,但可以找最接近的数。发现是 MainFrameDlg.cpp 文件中的:521 0001:0005976d,而程序实际崩溃行在519(注释行和空行也要计算在内),非常接近实际崩溃行了,考虑到程序实际执行的是汇编指令,我们可以在(516 ~524)行区间内寻找到实际崩溃行。

  

3.6     无法定位崩溃的情况

但是这种输出文件的方法也不能定位所有崩溃问题,俗话说得好:没有万能的救世主。

例如我们有时会碰到下层编解码器崩溃,崩溃打印如下表:

======================== 崩溃信息 ==========================

崩溃时间: 2009/05/07 09:48:17

崩溃原因:非法内存操作

异常代码 = c0000005

异常地址 = 0x02163b32

异常模块: C:\WINDOWS\system32\kdg7221.acm

Section name: .text - offset(rva) : 0x00002b32

---------------------- Trips of Stack ----------------------

C:\WINDOWS\system32\kdg7221.acm

这时可以看出是我们的音频解码器 kdg7221.acm崩溃了,此时就要考虑我们的音频编解码参数是否设置错了,如果没有设错,bug可以转到媒体处理层或者软件一部处理。

如何定位Release程序崩溃原因相关推荐

  1. 如何知道程序崩溃原因?

    在使用电脑过程中,偶尔会遇到个别程序停止工作(如下图),有的甚至直接闪退了. 如果程序问题打开就能重现的,用调试软件打开程序,调试运行,程序关闭后就可以定位到错误地址. 如果程序问题无法简单重现,那就 ...

  2. linux 进程崩溃log,linux调试:dmesg 查看程序崩溃原因分析方法之一

    在Linux下写C/C++程序的程序员,时常与Core Dump相见.在内存越界访问,收到不能处理的信号,除零等错误出现时,我们精心或不精心写就的程序就直接一命呜呼了,Core Dump是Linux仁 ...

  3. 使用MAP文件快速定位程序崩溃代码行

    作为程序员,平时最担心见到的事情就是程序发生了崩溃,无论是指针越界还是非法操作,都将给我们的应用系统 造成巨大的损失.但在一个大型系统的测试过程中,初期出现程序崩溃似乎成了不可避免的事.其实测试中出现 ...

  4. 使用MAP文件快速定位程序崩溃代码行(转)

    作为程序员,平时最担心见到的事情就是程序发生了崩溃,无论是指针越界还是非法操作,都将给我们的应用系统造成巨大的损失.但在一个大型系统的测试过程中,初期出现程序崩溃似乎成了不可避免的事.其实测试中出现程 ...

  5. 程序崩溃的原因及处理方法

    初学C语言/C++程序的编写时,可能经常会遇到程序崩溃的现象.一般来说,程序崩溃是由于内存操作不当引发的.但是具体来讲,由哪些原因可以导致程序崩溃呢?以及当程序崩溃时该如何找到错误的位置呢?本教程即是 ...

  6. 应用程序崩溃定位查找 (二)

    教程的第一部分介绍了 SIGABRT 和 EXC_BAD_ACCESS 的错误,并说明解决他们使用 Xcode 调试器和异常断点的一些策略. 但我们的应用程序仍然有一些问题!它不能完全按照它应该并且有 ...

  7. App崩溃原因定位分析

    当iOS设备上的App应用闪退时,操作系统会生成一个crash日志,保存在设备上.crash日志上有很多有用的信息,比如每个正在执行线程的完整堆栈跟踪信息和内存映像,这样就能够通过解析这些信息进而定位 ...

  8. assert 闪退 android,strcpy函数导致release版程序崩溃

    最近在写一个读取模型文件的小程序.很随意的使用了strcpy函数进行char字符数组的拷贝,这个数组是需要传递给PostMessage作为WPARAM的参数.代码部分如下: char pStrCurr ...

  9. [Windows]_[0基础]_[Release程序的崩溃报告minidump解决方式]

    场景: 1. Release的程序崩溃时,崩溃报告能够让开发者查明代码哪里出了问题,用处大大的. 2. 仅仅实用VS的编译器才支持,所以MinGW就无缘了. 3. 使用了未处理异常过滤处理函数. 4. ...

最新文章

  1. STM32F4 HAL库开发 -- 温度传感器(DS18B20)
  2. unity3d 随机生成地形之随机山脉
  3. 新汉诺塔(洛谷P1242)含第11个数据的解决办法
  4. python是什么牌子主机_python 收集主机信息
  5. 牛客19115 选择颜色
  6. python分类时特征选择_关于python:是否有可用于分类数据输入的特征选择算法?...
  7. 44 FI配置-财务会计-固定资产-一般评估-指定购置和生产成本值的转移
  8. 2018年前端星计划等你来报名!
  9. VC程序中实现控件的动态生成与响应
  10. 从零开始的网站搭建,服务器与域名管理
  11. 和平精英为什么服务器显示错误,和平精英为什么会出现错误代码5567?_和平精英错误代码5567解决步骤一览...
  12. 2021-2027全球与中国射频发生器市场现状及未来发展趋势
  13. think in java interview-高级开发人员面试宝典(十)
  14. python删除excel指定行_python实现Excel删除特定行、拷贝指定行操作
  15. ONF定义的SDN架构
  16. RabbitMQ手动确认模式(项目开发常用模式)
  17. 数据安全和隐私保护(新生研讨课小论文)
  18. 网络云存储技术Windows server 2012 (项目九 存储服务器文件的安全性配置与管理)
  19. 数字孪生 智慧工厂可视化决策系统
  20. Android 简易闹钟的实现

热门文章

  1. ES6新特性之函数优化-箭头函数
  2. 数据库-优化-通过慢查日志查询有问题的sql
  3. maven工程运行环境修改
  4. Direct交换器-编写生产者
  5. SpringBoot高级-任务-邮件任务
  6. SpringBoot 数据处理
  7. linux下设置定时任务,linux下定时任务设置
  8. php socket 效率,php socket 模型及效率问题
  9. cf体验服_CF手游体验服_穿越火线枪战王者体验服申请_12月版本
  10. Java官方相关资源文件的获取教程