极力推荐Android 开发大总结文章:欢迎收藏
程序员Android 力荐 ,Android 开发者需要的必备技能

本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容:

1.MTK 平台AEE 搜集重启问题介绍
2.SWT 导致手机重启问题分析
3.快速分析归类重启问题
4.部分手机重启问题解决方案

欢迎关注微信公众号:程序员Android
公众号ID:ProgramAndroid
获取更多信息

微信公众号:ProgramAndroid

我们不是牛逼的程序员,我们只是程序开发中的垫脚石。
我们不发送红包,我们只是红包的搬运工。

1. MTK 平台AEE 搜集重启问题介绍

MTK AEE 系统

AEE 系统 是 MTK 平台自研的异常重启的侦测和手机系统,当 AEE 侦测到异常后会生成db 文件,路径: /data/aee_exp 或 mtklog/aee_exp(Android O有时候db无法保存到MTK log中),user 版本 中AEE 仅仅侦测引起的重启故障,例如:KE/system server , NE/system server ,JE/SWT 。

AEE 异常侦测

AP层重启时候,AEE系统会在db生成后会发生am 广播(com.mediatek.log2server.EXCEPTION_HAPPEND),但是系统重启类异常(KE / HW reboot/ HWT)不会发送广播,因为AMS还无法使用。

另外,AEE 会开机后判断异常重启,当异常重启后会设置debug.mtk.aee.db的 property,由于不是persist的,关机就丢失,因此只有异常重启后才有这个property存在。

因此,我们可以通过检查debug.mtk.aee.db的方法来获取系统是否发生了异常重启。

重启异常 debug.mtk.aee.db 读取方法

  • 1.java 层:

android.os.SystemProperties.get("debug.mtk.aee.db", "")

    1. native层:

int property_get(const char* key, char* value, const char* def);

    1. 通过adb shell

adb shell getprop debug.mtk.aee.db

AEE 异常分类

  • 1.KE
  • 2.HWT
  • 3.HWT Reboot
  • 4.NE
  • 5.JE
  • 6.SWT

上面的类型可能会变化,具体请参考kernel代码:kernel-4.4/drivers/misc/mediatek/include/mt-plat/aee.h里的AE_EXP_CLASS

AEE 输出内容

AEE 输出内容

dbg文件

db.fatal.00.JE.dbg.DEC 这个文件夹使用aee_extract.exe抽取aee db压缩文件生成的,这个工具在gat-win32-3\prebuilt\spsstools\bin\aee_extract.exe可以找到。

db 文件解压后部分内容

ZZ_INTERNAL 简介

ZZ_INTERNAL 包含重启的简单信息,如需获取更多信息,需要解压dbg文件。

ZZ_INTERNAL

KE、JE、NE、SWT分类

这种类型最好分类,因为有调用栈,有进程名,分类可以做的很细致。

KE db如果存在SYSTRACKER_DUMP文件,表示存在bus hang,也可以单独列出来。

HWT分类

不能以当前CPU的调用栈分类。因为最后调用BUG的CPU是随机的。

同样的调用栈,可能是不同的root cause
应该按卡住的CPU的调用栈进行分类

从SYS_LAST_KMSG看Kick bit、check bit得出无喂狗CPU,可能存在多个或没有。
从SYS_LAST_KMSG提取无喂狗CPU的调用栈

HW reboot分类

可以通过__exp_main.txt里的Exception Type分类

  • HW reboot
  • Thermal reboot
  • SPM reboot
  • ATF crash

Type为HW reboot可以进一步细分( 按SYS_REBOOT_REASON里字段信息 )

  • last pc,看各个Core停止的位置

  • deepidle/sodi3/sodi/spm_suspend,如果非0表示当时处于low power场景

    1. Android Dropbox

2. SWT 导致手机重启问题分析

SWT 导致手机重启问题分析,之前已经有文章分析,点击下方链接既可查看。
SWT 导致手机重启问题分析

3. 快速分析归类重启问题

当手机重启时候,Kernel 重启异常信息会保存在手机/data/aee_exp中的db文件中。
Kernel Exception 重启分类

  • 1.Kernel Panic
  • 2.Watchdog Timeout
  • 3.Hardware Reboot

1.Kernel Panic

Linux kernel发生了无法修复的错误,从而导致panic。通过查看SYS_KERNEL_LOG的内容,kernel Panic进一步可以分为如下几类:

    1. 普通的data abort
    1. oom 主动触发的panic
  • 3.undefined instruction,未定义指令异常
  • 4.bad mode异常,即PC处于一个无效的virtual address

1. 普通的data abort

从SYS_KERNEL_LOG中,可以检索到如下的info:
Unable to handle kernel NULL pointer dereference at virtual address XXXXXXXX
如上的XXXXXXXX代表某个非法地址。这种类型是最多的。

2. oom 主动触发的panic

从SYS_KERNEL_LOG中,可以检索到如下的info:
Kernel panic - not syncing: Out of memory and no killable processes...

此种类型的panic一般是某个process或者APK耗尽了memory资源,从而kernel主动触发的panic重启。对于这种类型的重启,强烈建议工程师把如上的info填写到eService 的标题中,这样MTK可以对eService进行一次到位的分配。

3.undefined instruction,未定义指令异常

从SYS_KERNEL_LOG中,可以检索到如下的info:

Internal error: Oops - undefined instruction

此类异常较为少见,可能是CPU/DRAM 不稳定或者受干扰导致的问题。

4.bad mode异常,即PC处于一个无效的virtual address

从SYS_KERNEL_LOG中,可以检索到如下的info:
Bad mode in Synchronous Abort handler detected
...
[14820.652408]-(1)[682:VSyncThread_0][<ffffffc000088f90>] bad_mode+0x78/0xb0

此类异常较为少见,可能的原因是stack错乱,或者未注册回调函数引起。

2.Watchdog Timeout

看门狗超时有两种

  • 1.底层看门狗超时
    1. 上层hang_detect 触发看门狗超时

1.底层看门狗超时

从SYS_KERNEL_LOG中,可以检索到如下的info:

  • for arm64 platform

PC is at aee_wdt_atf_info+0x4c8/0x6dc
LR is at aee_wdt_atf_info+0x4c0/0x6dc
  • for arm32 platform

PC is at aee_wdt_irq_info+0x104/0x12c
LR is at aee_wdt_irq_info+0x104/0x12c

此类异常较为常见,多见于底层频繁irq/bus卡死,导致kicker无法被schedule,从而引起watch dog触发中断,引导系统进入FIQ处理流程,最终call到BUG触发重启。

2. 上层hang_detect 触发看门狗超时

从SYS_KERNEL_LOG中,可以检索(关键字 : hang_detect)到如下的info:


[ 2131.086562] (0)[77:hang_detect][Hang_Detect] we should triger HWT ...
...[ 2180.467416]-(0)[77:hang_detect]PC is at aee_wdt_irq_info+0x154/0x170[ 2180.467426]-(0)[77:hang_detect]LR is at aee_wdt_irq_info+0x154/0x170
...

此异常类型较为常见,多见于GPU/SD卡/eMMC 无法满足surfacelinger/system_server的通讯需求,从而导致上层卡死,进而主动触发看门狗超时重启。对于这种类型的重启,强烈建议工程师把如上的Hang_Detect关键字填写到eService 的标题中,这样MTK可以对eService进行一次到位的分配。

3.Hardware Reboot

hardware reboot是watch dog直接发出reset信号,导致整个系统重启;在重启之前,并没有触发任何异常处理流程。一般情况下,hardware reboot对应的db不会有SYS_KERNEL_LOG 可以排查,只能从SYS_LAST_KMSG获知异常之前kernel的动作,以及从SYS_REBOOT_REASON获知异常时的CPU寄存器值和其它参数。

ZZ_INTERNAL 档案,可以知道发生了hardware reboot
Hardware Reboot,0,0,99,/data/core/,0,,HW_REBOOT,Fri Jul 3 14:31:53 CST 2015,1

4.部分手机重启问题解决方案

以下修改方案仅适用于MTK平台芯片厂商

    1. Framework 层对象空指针导致手机重启。

Framework 层对象空指针导致手重启

    1. Framework 层数组越界导致手机重启

Framework 层数组越界导致手机重启

解决方案

修改WindowContainer 类,避免异常报错。文件路径如下:
alps/frameworks/base/services/core/java/com/android/server/wm/WindowContainer.java
修改方法如下:

避免空指针,捕获抛出的异常

    1. 第三方APK 引起的重启问题

奇酷 360 Telecom 空指针引起的重启问题举例。

360 qiku Telecom 空指针引起的重启

    1. 高温情况下,Kernel Exception引起的重启问题

手机 电池温度 60度以上高温会触发手机重启,部分异常Log 如下:

高温情况下,Kernel Exception引起的重启问题

解决方案

此问题 需要驱动同事修改底层battery.c 文件中的一个地址,不让其写为dead,就不会重启。具体解决方案还需驱动同事协助帮忙。

    1. TimeoutException 导致系统重启

TimeoutException 导致系统重启

从重启的JE trace看,由于在ART GC时,如果检查到某个对象其所属的类型override了finalize函数,会把这个对象添加到referenceQueue中。
referenceQueue被FinalizerDaemon线程监控,如果里面有内容,就会逐个取出并调用其finalize函数。
这样在下一次GC的时候才真正的把这个对象占用的memory给回收掉。

Java进程会等待10s钟,如果10s还没有执行完,进程会强制抛出TimeoutException。

一般是由于当时系统IO忙或者memory比较紧张,导致不能及时唤醒这个线程及时往下执行

解决方案
将等待时间10s 改为20s ,修改路径如下:
/libcore/libart/src/main/java/java/lang/Daemons.java


private static final long MAX_FINALIZE_NANOS = 10L * NANOS_PER_SECOND;
修改为:20L * NANOS_PER_SECOND;

至此,本篇已结束,如有不对的地方,欢迎您的建议与指正。同时期待您的关注,感谢您的阅读,谢谢!

如有侵权,请联系小编,小编对此深感抱歉,届时小编会删除文章,立即停止侵权行为,请您多多包涵。

既然都看到这里,领两个红包在走吧!
以下两个红包每天都可以领取

1.支付宝搜索 522398497,或扫码支付宝红包海报。

支付宝扫一扫,每天领取大红包

2.微信红包,微信扫一扫即可领取红包

微信扫一扫,每天领取微信红包

小礼物走一走,来简书关注我

Android 手机重启相关内容相关推荐

  1. Android 手机存储相关内容

    应用操作的文件存储位置分为三个部分: 1.应用内部存储私有文件目录 2.应用外部存储私有文件目录 3.公有目录 Android手机存储分为两个部分:内部存储和外部存储,内部存储一般是手机自带的存储空间 ...

  2. android Wifi开发相关内容

    今天,简单讲讲android里如何使用WifiManager. 之前,我看代码时,看到了wifi相关的代码,发现自己对于这个内容的使用还很不熟悉,所以在网上查找资料,最终解决了问题.这里记录一下. 移 ...

  3. JavaScript 通过plus读取android手机短信内容

    JavaScript 通过plus读取android手机短信内容. 1.获取android权限 在HBuilder工程中双击应用的"manifest.json"文件,切换到&quo ...

  4. Android 手机重启解决方案

    本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容: 1.MTK 平台AEE 搜集重启问题介绍 欢迎关注微信公众号:程序员Android 微信公众号:Progra ...

  5. Android 手机重启问题解决方案

    本篇文章主要介绍展讯平台手机开发中的部分重启问题知识点,通过阅读本篇文章,您将收获以下内容: 一. User 版本 默认开启 sysdump 方法 欢迎关注微信公众号:程序员Android 微信公众号 ...

  6. android 内核内存管理,Android内核相关内容总结

    要想充分掌握Android这一操作系统的应用,首先需要我们从Android内核的相关内容开始了解.在这里就为大家详细介绍一下相关的知识. Android操作系统是由谷歌推出的一款基于Linux平台开源 ...

  7. Android手机直播

    http://www.jianshu.com/p/7ebbcc0c5df7 一.说明 近两年来直播行业越来越火,各个直播平台加一起差不多300多家.有些直播平台做秀场.综娱类的直播(来疯直播),有的做 ...

  8. Android手机直播(一)总览

    一.说明 近两年来直播行业越来越火,各个直播平台加一起差不多300多家.有些直播平台做秀场.综娱类的直播(来疯直播),有的做游戏直播(熊猫直播),有的做体育赛事的直播(乐视直播),分类也各种各样.下面 ...

  9. android手机连接windows,四种方式将数据从Windows手机免费传输到Android设备

    解决方案3.使用OneDrive将内容从Windows Phone传输到Android 微软的智能手机操作系统可能不如Android或iOS那么受欢迎.但是,微软的一些应用确实令人印象深刻!微软的On ...

最新文章

  1. mysql的连接leftjion,mysql的表连接(left|right)join
  2. 计算二叉排序树的平均查找长度
  3. 程序员求职之道(《程序员面试笔试宝典》)之面试官箴言?
  4. 消息摘要算法HmacMD5的实现
  5. Bootstrap 弹出提示插件Popover 的选项
  6. 大数据之-Hadoop3.x_MapReduce_Combiner案例---大数据之hadoop3.x工作笔记0119
  7. 合并查找到的文件,至新的文件中
  8. windows本地script脚本恶意代码分析(带注释)
  9. oracle参数错误,解决oracle参数系统文件出错
  10. 潮流计算的matlab程序实现方法
  11. ADAS工程师的成长之路——ACC法规(ISO 15622-2018 — Adaptive cruise control systems)
  12. iCollections for Mac(桌面图标及文件整理工具)
  13. uni-app广告总结
  14. Segment Tree Beats(吉司机线段树)
  15. Retina屏图片适配
  16. 社交 APP 唔哩星球完成数百万元天使轮融资,投资方为启明创投
  17. 学python编程从入门到实践方法-python自学Day07(自学书籍python编程从入门到实践)...
  18. protel 二极管正负极怎么看
  19. 阿里达摩院开源DAMO-YOLO:兼顾速度与精度的新目标检测框架
  20. 本地搭建xxl-job服务及连接验证

热门文章

  1. SpringBoot 报错锦集
  2. 比较两条曲线的相似程度
  3. Java 循环语句折纸小游戏
  4. [介绍]关于我与我的未来
  5. 怎样正确的维护使用电脑
  6. 深度学习平台——常用图像标注工具
  7. 如何有效的避免图片侵权(100%避免网站图片侵权)
  8. 我转行程序员的那一年(一)
  9. 拿下Facebook黑客杯四冠王!与Jeff Dean相提并论...ACM竞赛之神的传奇前半生
  10. 贵金属软件MT4好不好用?MT4软件有什么优势特点?