jvm崩溃的原因

当应用程序崩溃时,您可以学到什么?

我认为,“后见之明是20 /”是最喜欢的短语之一托马斯·罗梅尔 ,工程ZeroTurnaround的副总裁。 好吧,我实际上不确定在他的短语中占什么位置,但是我已经听过他多次说过这句话。 鉴于这意味着回顾过去,您对事情的推理比预测将来的事情要好得多,通常发生在我们未能正确预测某件事并无法反映出行动结果的情况下。 如果您经常听到此短语,则意味着您经常对事情进行反思,并且您知道每一次失败,每一次错误都会提供一个教训。

好吧,可能是您没有犯错误,或者您没有犯任何会传播到最终产品以及最终用户的重要错误。 我确实偶尔制作它们,不止一次地我炸毁了我们的服务器,并且无数次提交了损坏的代码。 有时它也会滑入最终产品。 每当我写的破损代码再次咬我时,我都会学到一些东西。 每次我必须调查造成错误的原因是什么,将其复制到我的机器上并进行修复。

在这篇文章中,我想看看可以帮助您获得有关错误的相关信息并帮助您重现和修复它们的工具和技术。

新帖:当JVM崩溃时:如何调查最严重错误的根本原因http://t.co/bvHVYhT2m4 pic.twitter.com/dKhgiKMhT5

— Takipi(@takipid) 2015年4月27日

结构化日志

弄清楚某些代码中发生了什么的默认goto方法是阅读源代码。 当该来源实际上是您每天工作8-10个小时而仍然找不到罪魁祸首时,则您必须在错误发生时添加一些有关上下文的情境意识。 自然地,您可以从日志中获取该上下文。 我毫不怀疑您一直在使用日志,但是您可以通过以下技巧来使日志更加有用。

线程名称

如果配置线程名称以反映应用程序中发生的事情,则可以获得有关上下文的更多信息。 线程名称几乎总是包含在日志中,并且打印线程名称不会带来任何显着的性能开销。 例如,找出记录器的调用方类需要花费时间,因为您必须构造和遍历堆栈跟踪。 但是访问线程名称既快速又便宜。 另外,线程名很少用于其他任何事情,因此,在您认为合适的地方充填尽可能多的信息:系统组件名称,事务ID,发出请求的用户名等。稍后在调试问题时,您将感谢这些详细的日志,轻轻松松。

更多日志类型

另一个技巧是使JVM产生更多的日志,可以使JVM产生可以稍后分析的垃圾收集日志,JIT编译日志和堆转储。 由于性能开销,其中大多数可能不适合生产系统,但是您绝对可以在登台或在您自己的开发站上对它们进行试验。

稍后,您可以调整垃圾回收的性能,并进行大量优化, 如本文所述 ,但首先,您可以使用以下JVM选项启用垃圾回收日志: -XX:+ PrintGC -XX:+ PrintGCDetails -XX:+ PrintGCTimeStamps和-XX:+ PrintGCDateStamps -Xloggc:file

手动研究JIT编译日志可能不会告诉您太多信息,但是您始终可以尝试使用JITWatch来查看JVM编译代码时发生了什么。

对于生产系统来说,打开它的一个好主意是: -XX:+ HeapDumpOnOutOfMemoryError ,这将使JVM在发生OutOfMemory错误时创建内存转储。

日志种类繁多,并非对崩溃管理都同样有用,但是它们都是必不可少的,也是您军械库中最容易使用的工具。

现代开发人员工具

等一下 您是否要告诉我,在21世纪,没有什么比找出日志并从早期石器时代采用取证技术更好的方法来弄清您的应用程序中发生了什么? 好吧,不是真的。 但是我不知道有什么通用工具可以为您提供最佳的见解,以了解代码中发生了什么以及为什么发生。

在开发环境中,情况更加容易,您拥有大量的备用计算资源,并且可能会冒险附上不需要经过Ops批准流程的各种工具。

以Plumbr的IvoMägi的这篇文章为例 ,他讨论了他们的内存泄漏检测工具是否适合操作人员或开发人员。 理想情况下,该工具是有用且稳定的,因此您既可以在开发过程中享受其性能和功能,又不必担心将其附加到实时系统中。 但是这种情况很少发生,您不需要在生产环境中进行调试,也不想与JRebel即时交换类,等等。

但是,这并不意味着您根本不应该使用任何现代工具,而只能将自己限制在老式但已被证实的发现邪恶根源的方法上:日志。 毫无疑问,日志仍将是您将获得的最有用的取证信息来源,但是您可以做得更好。

通常,开发过程包括大量盯着代码,思考并有时在此处和此处更改功能位。 这是一项艰苦的工作,需要集中精力解决问题和系统逻辑。 如果您知道使事情变得更轻松的方法论或一些神奇的秘诀,请在Twitter上与我分享智慧: @shelajev 。 在此之前,我们将以软件工程需要集中精力为前提。 这意味着任何工具都有两个主要的非功能性要求:在功能上必须强大,并且必须具有非侵入性,因此您不必为如何实现所需的功能而费心。

重现某些条件的最有效方法是对其进行测试。 当它不可用时,下一个最好的事情就是使用一个录制调试器,例如Takipi进行生产调试或Chronon 。

使用Chronon,您可以记录代码中发生的操作,它们产生的结果,每给定时刻堆栈中的内容以及产生程序执行的事务日志的记录。 稍后,您可以将此日志提供给另一个程序运行,并来回逐步执行。

如果您想查明性能问题,则可以使用Java Mission Control的 Java Flight Recorder收集有关程序执行配置文件,垃圾收集统计数据,堆使用情况数据(例如对象分配,锁和IO详细信息)的信息。如果要运行附加到生产节点上的Java Mission Control,您必须支付许可证的费用,但是对于开发环境,则没有这样的问题。

再说一次,如果您要监视生产环境,则可能需要一个错误管理解决方案,该解决方案专门为获取尽可能多的错误信息而创建。

Takipi的仪表板和本机代理使您无需使用日志文件即可调试生产中的代码。 您将获得错误分析,分布式系统中的统一堆栈跟踪以及其他可以大大减少理解和修复错误的时间的事物。

在这篇文章中,我们研究了几种工具和技术,可以使您在积极开发应用程序或将其部署到生产环境中时更加了解应用程序中正在发生的事情。 无论是通过熟练地将JMC与飞行记录器配合使用还是通过精心制作的日志,再现错误都是纠正任何错误的最重要步骤。

您要记住的是,尽管每次都有好的旧工具在起作用,但几乎每个领域都有新的发展,并且崩溃管理和错误监视也不例外。 了解其中有哪些工具,并了解如何正确使用它们。 它将使您成为更好的开发人员。

翻译自: https://www.javacodegeeks.com/2015/04/when-jvms-crash-how-to-investigate-the-root-cause-of-your-toughest-errors.html

jvm崩溃的原因

jvm崩溃的原因_JVM崩溃时:如何调查最严重错误的根本原因相关推荐

  1. JVM崩溃时:如何调查最严重错误的根本原因

    当应用程序崩溃时,您可以学到什么? 我认为,"后见之明是20 /"是最喜欢的短语之一托马斯·罗梅尔 ,工程ZeroTurnaround的副总裁. 好吧,我实际上不确定在他的短语中占 ...

  2. jvm 崩溃日志设置_JVM崩溃的原因及解决过程

    前段时间有个项目,用到了JAVA和C++的JNI技术的结合,使用JAVA代码调用C++的组件的方法去获得该组件从其它接口得到的数据.在项目部署时,报错误如下: # # An unexpected er ...

  3. jvm 崩溃日志设置_JVM崩溃日志信息分析

    前些天,搞JNI的时候,报了个JVM崩溃的错.错误信息如下: # # An unexpected error has been detected by HotSpot Virtual Machine: ...

  4. 服务器托管过程中服务器崩溃的原因有哪些

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 服务器托管过程中服务器崩溃的主要原因 1.程序出错 2.磁盘满载 3.数据库临时表不够用 4.访问量超出服务器承载范围 ...

  5. 服务器系统杀毒系统崩溃怎么恢复,系统崩溃是什么原因导致的

    大家在使用电脑的时候,经常都是需要安装一些软件和其他东西的.但是在安装软件的时候,很容易让一些病毒侵入电脑.一旦病毒侵入了电脑,就很容易让电脑系统崩溃.那么系统崩溃是什么原因导致的呢?下面就来告诉大家 ...

  6. 关于谷歌浏览器全线崩溃的原因及几种解决办法(疑难杂症篇)

    关于谷歌浏览器全线崩溃的原因及解决办法 写在前面 导致的可能原因 几种解决的方法 方法一 方法二 方法三 方法四 方法五 方法六 总结 写在前面 关于正在正常使用着的谷歌浏览器,突然有一回,再打开之后 ...

  7. activex html 崩溃_网站导致浏览器崩溃的原因总结(多款浏览器)

    面试某公司的时候,面试官问到,导致浏览器崩溃的原因有哪些?愚辈不才,仅回答出了内存泄漏.其实在网页在装载的过程中,常常由于种种原因使浏览器的反映变的很慢,或造成浏览器失去响应,甚至会导致机器无法进行其 ...

  8. 网站让浏览器崩溃的原因有哪些

    一. 内存泄漏 网站由于内存泄漏的而照成崩溃有两种情况,服务器的崩溃和浏览器的崩溃.内存泄漏所造成的问题是显而易见的,它使得已分配的内存的引用就会丢失,只要系统还在运行中,则进程就会一直使用该内存.这 ...

  9. 程序崩溃的原因及处理方法

    初学C语言/C++程序的编写时,可能经常会遇到程序崩溃的现象.一般来说,程序崩溃是由于内存操作不当引发的.但是具体来讲,由哪些原因可以导致程序崩溃呢?以及当程序崩溃时该如何找到错误的位置呢?本教程即是 ...

最新文章

  1. 基于vue-cli,做个nuxt脚手架~
  2. Spring Boot 2.x基础教程:实现文件上传
  3. Android中三种超实用的滑屏方式汇总(ViewPager、ViewFlipper、ViewFlow)
  4. key可以重复的map集合:IdentityHashMap
  5. python request下载文件_Python3.4.3使用urllib.request下载文件带进度显示
  6. javascirpt历史澄清误解基本概念特点编程语言web2.0网页javascript - javascirpt知识大全...
  7. Currency Exchange(判断有无正环)
  8. tensorboard使用_Keras在TensorBoard的可视化
  9. 一个算例 介绍 libmesh 的类
  10. python爬取新浪博客_Python爬虫爬取一篇韩寒新浪博客
  11. 什么是蒙特卡罗仿真?
  12. JS+CSS实现幻灯片
  13. 大数据具体是干什么的
  14. 《Mini-Me: An Adaptive Avatar for Mixed Reality Remote Collaboration》论文笔记
  15. matlab窄带水平集,窄带水平集方法
  16. PQ 8.05中文版硬盘物理分区与删除分区(图文详解)
  17. WLC license管理
  18. [iOS开发]@autoreleasepool原理探究
  19. 用过滤器防sql注入
  20. 什么是 “好的“ 逻辑清楚

热门文章

  1. AT1983-[AGC001E]BBQ Hard【dp,组合数学】
  2. jzoj3338-[NOI2013模拟]法法塔的奖励【权值线段树,线段树合并】
  3. nssl1230-序列【位运算】
  4. Codeforces Round #653 (Div. 3)
  5. 【dfs】树(jzoj 2753)
  6. Spark入门(四)Idea远程提交项目到spark集群
  7. Oracle的分页实现
  8. 10道腾讯的Java面试题
  9. H5的Websocket基本使用
  10. 《四世同堂》金句摘抄(二)