当应用程序崩溃时,您可以学到什么?

我认为,“后见之明是20 /”是最喜欢的短语之一托马斯·罗梅尔 ,工程ZeroTurnaround的副总裁。 好吧,我实际上不确定在他的短语中占什么位置,但是我已经听过他几次说了。 鉴于这意味着回顾过去,您可以对事情进行推理比预测将来发生的事情要好得多,通常发生在我们未能正确预测事情并反映行动结果的情况下。 如果您经常听到此短语,则意味着您经常对事情进行反思,并且您知道每一次失败,每一次错误都会提供一个教训。

好吧,可能是您没有犯错误,或者您没有犯任何会传播到最终产品以及最终用户的重要错误。 我确实偶尔制作它们,不止一次,我对服务器进行了多次轰炸,并且无数次提交了损坏的代码。 有时它也会滑入最终产品。 每当我写的破损代码再次咬我时,我都会学到一些东西。 每次我必须调查造成错误的原因是什么,将其复制到我的机器上并进行修复。

在这篇文章中,我想看看可以帮助您获得有关错误的相关信息并帮助您重现和修复它们的工具和技术。

新帖:JVM崩溃时:如何调查最严重错误的根本原因http://t.co/bvHVYhT2m4 pic.twitter.com/dKhgiKMhT5

— Takipi(@takipid) 2015年4月27日

结构化日志

弄清楚某些代码中发生了什么的默认goto方法是阅读源代码。 当该来源实际上是您每天工作8-10个小时而仍然找不到罪魁祸首时,则您必须在错误发生时添加一些有关上下文的情境意识。 自然地,您可以从日志中获取该上下文。 我毫不怀疑您一直在使用日志,但这是您可以做的一个很好的技巧,可以使日志更加有用。

线程名称

如果配置线程名称以反映应用程序中发生的事情,则可以获得有关上下文的更多信息。 线程名称几乎总是包含在日志中,并且打印线程名称不会带来任何明显的性能开销。 例如,找出记录器的调用方类需要花费时间,因为您必须构造和遍历堆栈跟踪。 但是访问线程名称既快速又便宜。 另外,线程名很少用于其他任何事情,因此,在您认为合适的地方充填尽可能多的信息:系统组件名称,事务ID,发出请求的用户名等。稍后在调试问题时,您将感谢这些详细的日志,轻轻松松。

更多日志类型

另一个技巧是使JVM产生更多的日志,可以使JVM产生可以稍后分析的垃圾收集日志,JIT编译日志和堆转储。 由于性能开销,其中大多数可能不适合生产系统,但是您绝对可以在暂存阶段或在自己的开发站上对它们进行试验。

稍后,您可以调整垃圾回收的性能,并进行大量优化, 如本文所述 ,但首先,您可以使用以下JVM选项启用垃圾回收日志: -XX:+ PrintGC -XX:+ PrintGCDetails -XX:+ PrintGCTimeStamps和-XX:+ PrintGCDateStamps -Xloggc:file

手动调查JIT编译日志可能不会告诉您太多信息,但是您始终可以尝试使用JITWatch来查看JVM编译代码时发生了什么。

对于生产系统来说,打开它的一个好主意是: -XX:+ HeapDumpOnOutOfMemoryError ,这将使JVM在发生OutOfMemory错误时创建内存转储。

日志种类繁多,并非对崩溃管理都同样有用,但是它们都是必不可少的,也是您军械库中最容易使用的工具。

现代开发人员工具

等一下 您是否要告诉我,在21世纪,没有什么比找出日志并从早期石器时代采用取证技术更好的方法来弄清您的应用程序中发生了什么? 好吧,不是真的。 但是我不知道有什么通用工具可以为您提供最佳的见解,以了解代码中发生了什么以及为什么发生这种情况。

在开发环境中,情况变得更容易,您拥有大量的备用计算资源,并且可能会冒险附加不需要经过Ops批准流程的各种工具。

例如, 以Plumbr的IvoMägi的帖子为例 ,他讨论了他们的内存泄漏检测工具是否适合操作人员或开发人员。 理想情况下,该工具是有用且稳定的,因此您既可以在开发过程中享受其性能和功能,又不必担心将其附加到实时系统中。 但是这种情况很少发生,您不需要在生产环境中进行调试,也不想与JRebel即时交换类,等等。

但是,这并不意味着您根本不应该使用任何现代工具,而应该将自己限制在老式的,但已被证实的发现邪恶根源的方法上:日志。 毫无疑问,日志仍将是您将获得的最有用的取证信息来源,但是您可以做得更好。

通常,开发过程包括大量盯着代码,思考并有时在此处和此处更改功能位。 这是一项艰苦的工作,需要集中精力解决问题和系统逻辑。 如果您知道使事情变得更轻松的方法论或一些神奇的秘诀,请在Twitter上与我分享智慧: @shelajev 。 在此之前,我们将以软件工程需要集中精力为前提。 这意味着任何工具都有两个主要的非功能性要求:在功能上必须强大,并且必须具有非侵入性,因此您不必在如何实现所需的功能上费心。

重现某些条件的最有效方法是对其进行测试。 当它不可用时,下一个最好的事情就是使用一个录制调试器,例如Takipi进行生产调试或Chronon 。

使用Chronon,您可以记录代码中发生的操作,它们产生的结果,每给定时刻堆栈中的内容以及产生程序执行的事务日志的记录。 稍后,您可以将此日志提供给另一个程序运行,并来回逐步执行。

如果您要查明性能问题,则可以使用Java Mission Control的 Java Flight Recorder收集有关程序执行配置文件,垃圾收集统计数据,堆使用情况数据(例如对象分配,锁和IO详细信息)的信息。如果要运行附加到生产节点上的Java Mission Control,您必须支付许可证的费用,但是对于开发环境,则没有这样的问题。

再说一次,如果要监视生产环境,则可能需要一个错误管理解决方案,该解决方案专门为获取尽可能多的错误信息而创建。

Takipi的仪表板和本机代理使您无需使用日志文件即可调试生产中的代码。 您将获得错误分析,分布式系统中的统一堆栈跟踪以及其他可以大大减少理解和修复错误的时间的事物。

在这篇文章中,我们研究了几种工具和技术,可以使您在积极开发应用程序或将其部署到生产环境中时更加了解应用程序中正在发生的事情。 无论是通过熟练地将JMC与飞行记录器配合使用,还是通过优雅制作的日志,重现错误都是纠正任何错误的最重要步骤。

您要记住的是,尽管每次都会使用好的旧工具,但几乎每个领域都有新的发展,并且崩溃管理和错误监视也不例外。 了解其中有哪些工具,并了解如何正确使用它们。 它将使您成为更好的开发人员。

翻译自: https://www.javacodegeeks.com/2015/04/when-jvms-crash-how-to-investigate-the-root-cause-of-your-toughest-errors.html

JVM崩溃时:如何调查最严重错误的根本原因相关推荐

  1. jvm崩溃的原因_JVM崩溃时:如何调查最严重错误的根本原因

    jvm崩溃的原因 当应用程序崩溃时,您可以学到什么? 我认为,"后见之明是20 /"是最喜欢的短语之一托马斯·罗梅尔 ,工程ZeroTurnaround的副总裁. 好吧,我实际上不 ...

  2. jvm 崩溃日志设置_JVM崩溃日志信息分析

    前些天,搞JNI的时候,报了个JVM崩溃的错.错误信息如下: # # An unexpected error has been detected by HotSpot Virtual Machine: ...

  3. jvm 崩溃日志设置_JVM致命错误日志(hs_err_pid.log)分析(转载)

    当jvm出现致命错误时,会生成一个错误文件 hs_err_pid.log,其中包括了导致jvm crash的重要信息,可以通过分析该文件定位到导致crash的根源,从而改善以保证系统稳定.当出现cra ...

  4. linux线程引起jvm崩溃,JVM宕机分析

    1.可以引发JVM崩溃的常见缘由有:linux 线程阻塞数据库 CPU 使用率太高服务器 JVM Crash工具 堆内存不足google 类装载spa Java虚拟机自身的Bug操作系统 JDK与服务 ...

  5. 遇到长GC停顿、CPU满载、内存泄露、JVM崩溃等高频问题,看这里!

    2020/09/20 PerfMa成立三周年了,同时PerfMa技术社区上线也一周年了,做个小结,以慰时间之慨,也准备了一些礼物感谢大家.(记得看到最后哦~) PerfMa技术社区 社区成立之初期望达 ...

  6. 如何在系统崩溃时从C++中获取函数调用栈信息?

    这篇文章主要讲述在 Linux 和 Windows 这 2 个平台上,如何用C++ 来捕获函数调用栈里的信息. 一.前言 程序在执行过程中 crash 是非常严重的问题,一般都应该在测试阶段排除掉这些 ...

  7. JVM运行时数据区---堆(堆内存)

    运行时数据区-堆 JVM 堆的对象分配过程 堆中TLAB为对象分配内存 堆-逃逸分析与代码优化 堆的核心概念 <Java虚拟机规范>中对Java堆的描述是:所有的对象实例以及数组都应当在运 ...

  8. 浏览器崩溃时提示137错误

    浏览器崩溃时提示137错误: 解决方法: 开始--运行--cmd --netsh winsock reset

  9. JVM运行时数据区概览

    在学习JVM之前我们需要明确的是,我们所学习的是JVM的一个规范,在实际中有很多不同种类的虚拟机来实现这一种规范.其次JVM运行时数据区和JMM的区别我们要搞清楚,不能将JMM理解为JVM运行是数据区 ...

最新文章

  1. C++基本要点复习--------coursera程序设计实习(PKU)的lecture notes
  2. python post请求 上传图片_利用python模拟实现POST请求提交图片的方法
  3. 冲刺区块链第一股,也是AI芯片第一股,嘉楠在美提交IPO招股书
  4. 当装了两个tomcat后,如何修改tomcat端口
  5. 垃圾邮件过滤——学习笔记
  6. HAOI2018游记
  7. JetBrains正式发布GoLand
  8. win10开机出现两个系统
  9. Uploading File using Ajax and receiving binary data in Asp.net (C#)[转]
  10. 使用GDB跟踪redis源代码执行get命令的过程
  11. 使用kitti2bag和RVIZ播放KITTI数据集
  12. 2019每特教育蚂蚁课堂-Java互联网微服务架构面试宝典v1
  13. WebView 入坑
  14. 3d图形设计计算机配置,3d建模电脑配置要求高吗?这样配电脑不多花一分钱
  15. jadx动态调试安卓apk
  16. iOS 战斗机跑车效果
  17. Contest 20140914 Mushroom写情书 字符串雙hash 後綴數組
  18. PX4二次开发——PX4程序架构
  19. 推荐系统(三) —— 利用用户行为数据 —— 隐语义模型
  20. 《战争通论》详细分析世界十大兵书…

热门文章

  1. asp.net中条件查询+分页
  2. mybatis中,collection配置后查询只显示一条记录
  3. 在护卫神上部署javaWeb项目,已经测试通过
  4. javaWeb服务详解(含源代码,测试通过,注释) ——Emp的Dao层
  5. 请求和响应向更多内容
  6. 迷宫问题---递归解决
  7. #{} vs ${}
  8. mysql fpmmm_zabbix配fpmmm(mpm)数据传送不了问题解决
  9. 君威u0073故障码解决_顽疾修复过程,君威没倒挡的变速箱故障就是这样修好
  10. repo-关于URL编码