上篇文章中我们说到java自带的JVM调优工具,但是自带的工具用户体验不是很好,而且工具间来回切换比较繁琐。这篇我们来说一个阿里提供的体验更好,功能更强大的Java 诊断工具Arthas。

arthas是什么

Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。

Arthas(阿尔萨斯)能做什么

Arthas 是 Alibaba 开源的 Java 诊断工具,深受开发者喜爱。

当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决:

  • 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
  • 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  • 遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
  • 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
  • 是否有一个全局视角来查看系统的运行状况?
  • 有什么办法可以监控到 JVM 的实时运行状态?
  • 怎么快速定位应用的热点,生成火焰图?
  • 怎样直接从 JVM 内查找某个类的实例?

Arthas 支持 JDK 6+,支持 Linux/Mac/Windows,采用命令行交互模式,同时提供丰富的 Tab 自动补全功能,进一步方便进行问题的定位和诊断。

下载

arthas最新版本为arthas-all-3.6.6,下载地址:https://github.com/alibaba/arthas/releases

下载arthas-bin.zip

解压后文件夹如图所示:

快速入门

入门准备

  1. 新建一个JvmLearingApplication项目用于测试,添加一个controller并启动项目
@RestController
@RequestMapping("arthas")
public class ArthasTestController {@GetMapping("/hello/{name}")public String hello(@PathVariable("name") String name){random();return "hello,"+name;}private void random(){Random random = new Random();}
}
  1. 启动arthas-boot.jar

cmd进入解压后的文件夹,使用java -jar arthas-boot.jar命令,进入下面界面

上图界面的意思是让我们选择一个java进程,然后回车。我们这里选择1,然后回车,看到如下界面表示启动arthas-boot成功,接着就可以尽情使用arthas的命令了。

入门实践

这里只简单介绍几个命令来体验一下arthas。

dashboard

dashboard:当前系统的实时数据面板,每隔5秒钟刷新一次。使用q键或者Ctrl+c可以退出刷新

数据说明

  • ID: Java 级别的线程 ID,注意这个 ID 不能跟 jstack 中的 nativeID 一一对应。
  • NAME: 线程名
  • GROUP: 线程组名
  • PRIORITY: 线程优先级, 1~10 之间的数字,越大表示优先级越高
  • STATE: 线程的状态
  • CPU%: 线程的 cpu 使用率。比如采样间隔 1000ms,某个线程的增量 cpu 时间为 100ms,则 cpu 使用率=100/1000=10%
  • DELTA_TIME: 上次采样之后线程运行增量 CPU 时间,数据格式为
  • TIME: 线程运行总 CPU 时间,数据格式为分:秒
  • INTERRUPTED: 线程当前的中断位状态
  • DAEMON: 是否是 daemon 线程

JVM 内部线程

Java 8 之后支持获取 JVM 内部线程 CPU 时间,这些线程只有名称和 CPU 时间,没有 ID 及状态等信息(显示 ID 为-1)。
通过内部线程可以观测到 JVM 活动,如 GC、JIT 编译等占用 CPU 情况,方便了解 JVM 整体运行状况。

  • 当 JVM 堆(heap)/元数据(metaspace)空间不足或 OOM 时,可以看到 GC 线程的 CPU 占用率明显高于其他的线程。
  • 当执行trace/watch/tt/redefine等命令后,可以看到 JIT 线程活动变得更频繁。因为 JVM 热更新 class 字节码时清除了此 class 相关的 JIT 编译结果,需要重新编译。

JVM 内部线程包括下面几种:

  • JIT 编译线程: 如 C1 CompilerThread0, C2 CompilerThread0
  • GC 线程: 如GC Thread0, G1 Young RemSet Sampling
  • 其它内部线程: 如VM Periodic Task Thread, VM Thread, Service Thread

jvm

如果想查看当前JVM信息可以使用jvm命令

THREAD 相关

  • COUNT: JVM 当前活跃的线程数
  • DAEMON-COUNT: JVM 当前活跃的守护线程数
  • PEAK-COUNT: 从 JVM 启动开始曾经活着的最大线程数
  • STARTED-COUNT: 从 JVM 启动开始总共启动过的线程次数
  • DEADLOCK-COUNT: JVM 当前死锁的线程数

文件描述符相关

  • MAX-FILE-DESCRIPTOR-COUNT:JVM 进程最大可以打开的文件描述符数
  • OPEN-FILE-DESCRIPTOR-COUNT:JVM 当前打开的文件描述符数

arthas除了能对jvm进行监控以外,同时也能进行反编译、对方法进行监控、计算方法的运行时长等。

Jad

jad 命令将 JVM 中实际运行的 class 的 byte code 反编译成 java 代码,便于你理解业务逻辑。
上面我们自定义了一个ArthasTestController 类,现在来反编译一下ArthasTestController 。

如果是忘记了要编译的类在哪个包下面,输入jad命令之后再按tab键,arthas会自动项目都有哪些包给一层层展示出来。


使用命令 jad com.example.jvmlearing.controller.ArthasTestController就可以反编译出来对应的类了。通过反编译也能确定写的方法或者类是否生效。

在 Arthas Console 上,反编译出来的源码是带语法高亮的,阅读更方便。
当然,反编译出来的 java 代码可能会存在语法错误,但不影响你进行阅读理解

monitor

monitor可以对方法执行监控。比如下面一段命令 monitor -c 5 com.example.jvmlearing.controller.ArthasTestController hello,每隔5秒钟对ArthasTestController#hello方法进行一次监控。

监控结果参数说明:

监控项 说明
timestamp 时间戳
class Java 类
method 方法(构造方法、普通方法)
total 调用次数
success 成功次数
fail 失败次数
rt 平均 RT
fail-rate 失败率

注意: 输入monitor 命令之后一定要对方法进行一次调用,要不然就会像下面这样,一直在等待。

为什么会这样呢?因为monitor 命令是一个非实时返回命令。

实时返回命令是输入之后立即返回,而非实时返回的命令,则是不断的等待目标 Java 进程返回信息,直到用户输入 Ctrl+C 为止。

服务端是以任务的形式在后台跑任务,植入的代码随着任务的中止而不会被执行,所以任务关闭后,不会对原有性能产生太大影响,而且原则上,任何 Arthas 命令不会引起原有业务逻辑的改变

trace

使用 trace 命令可以跟踪统计方法耗时。比如使用命令trace com.example.jvmlearing.controller.ArthasTestController hello统计ArthasTestController#hello方法耗时。

#20 表示在hello方法中调用了random()方法。

从结果中我们可以看到,hello()方法总共耗时0.693ms,其中random()方法耗时0.0622ms。很明显0.693 > 0.0622,那么问题来了剩余的时间都去哪儿了?

trace 结果时间不准确问题

  1. 没有被 trace 到的函数。比如java.* 下的函数调用默认会忽略掉。通过增加–skipJDKMethod false参数可以打印出来。
  2. 非函数调用的指令消耗。比如 i++, getfield等指令。
  3. 在代码执行过程中,JVM 可能出现停顿,比如 GC,进入同步块等。

watch

watch命令让你能方便的观察到指定函数的调用情况。能观察到的范围为:返回值、抛出异常、入参。这就跟aop一样,只不过watch是在字节码的基础上进行监控的。通过watch命令也可以在方法调用之前、返回之后、异常之后、结束之后(正常返回和异常返回)进行观察。

其中hello是方法名,arthas是参数。

问题来了,我们知道AOP是通过动态代理实现的,那arthas是怎么实现对方法进行监控的呢?arthas其实使用的是动态追踪技术,关于动态追踪下篇文章会进行介绍。

总结

arthas是一个很好的java线上诊断工具,在JVM监控部分命令是整合了JVM自带的内存调优工具,在方法进行监控部分使用了动态追踪技术,其他部分也集成了java方面的工具。感兴趣的可以去官网多了解一下,在我们进行线上诊断时用处挺大的。

参考资料:

https://arthas.aliyun.com/doc/

线上诊断之arthas相关推荐

  1. java线上诊断工具,Java线上诊断神器Arthas-1

    Arthas 是Alibaba 开源的一款线上诊断工具,相比Java 自带的jinfo, jmap,jstat 等工具更方便(起码不用记那么多参数),而且利用字节码增强技术,可以很好的对线上的问题进行 ...

  2. Java线上诊断工具:Arthas简单快速学习

    1.概述 1.1.Arthas(阿尔萨斯)可以做什么 Arthas 是Alibaba开源的Java诊断工具.当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决: 这个类从哪个 jar 包加载 ...

  3. 阿里Arthas(阿尔萨斯)线上诊断工具

    Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱. 官方文档:https://alibaba.github.io/arthas/index.html 当你遇到以下类似问题而束手无策 ...

  4. Arthas使用教程 阿里巴巴开源项目、史上最强java线上诊断工具

    什么是 Arthas 摘录一段官方 Github 上的简介 Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱. 当你遇到以下类似问题而束手无策时,Arthas 可以帮助你解决: 这 ...

  5. 【Arthas】使用 watch命令 线上诊断

    如果debug线上环境但是又没有加日志,怎么办?可以使用arthas的watch命令来诊断. 测试程序: /*** Hello world!**/public class App {private L ...

  6. 线上Debug神器--Arthas(阿尔萨斯)

    目录 一.Arthas环境准备 1.概述 2.运行环境要求 3.安装&卸载 二.Arthas命令学习 一.Arthas环境准备 1.概述 Arthas是Alibaba开源的Java诊断工具,深 ...

  7. 线上调试神器arthas

    一.Arthas入门    Arthas 是阿里巴巴开发出的一款线上调试工具,他的厉害之处就是我们不需要停止线上的服务就可以排查问题,监控方法.Arthas使用简单,上手快等优点让我觉得十分方便, 强 ...

  8. 没有打印日志,如何排查线上问题?——arthas(阿尔萨斯)

    背景 实际工作中,有时候漏打了日志或者线上环境才会出现问题,不得不到线上去复现,导致问题无法及时处理或者线上的包版本与本地的包版本不一样,导致各种种样的问题缺少实际一手的数据进行分析排查问题. Art ...

  9. java线上排查利器arthas

    当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决: 这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception? 我改的代码为什么没有执行到?难道是我没 commit?分支 ...

最新文章

  1. iOS SDWebImage加载webp
  2. isodate php 时间转换,为ACF自定义字段查询将ISOdate转换为phpdate
  3. 使用svn控制系统的优缺点和注意事项
  4. ERP顾问的三层境界
  5. matlab 开 闭 代码,C++中的MATLAB函数〔闭锁〕
  6. malloc和free实现的原理
  7. Apache本地环境部署
  8. idea 和 maven学习
  9. UML系列——OO Unit4分析和学期总结
  10. String StringBuffer StringBuilder的异同
  11. jquery radio/checkbox change 事件不能触发的问题
  12. Ceres-Solver库入门
  13. tcs标准编写软件_标准编写软件TCS应用.ppt
  14. Windows XP图片查看器打不开图片的解决办法
  15. 「Head First」编程系列丛书
  16. nodejs中使用nodemon加载文件报错
  17. 不属于计算机完成科学特点的是,2019年网络教育统考《计算机应用基础》试卷版练习题2...
  18. NDN全栈: 一、命名数据网络(Named Data Networking)背景介绍
  19. Apollo学习笔记
  20. 技术探讨之请教方舟编译器的十个问题

热门文章

  1. 在Matlab图片里输入数学公式、符号和希腊字母的方法
  2. Intel新i9憋足了吃奶的劲狂拉功耗,总算吊打苹果M1max
  3. 解决转换flash的SWF到视频文件没有声音的问题
  4. Jenkins从svn获取代码报”E170001“异常问题解决
  5. chinaunix 内核源码分析精贴
  6. bzoj1455罗马游戏*
  7. antdesign——layout
  8. 求a和b的最大公约数
  9. 【实验5】——波束形成技术
  10. 推荐1个java快速开发项目,让你接私活不用愁