32 Arthas问题排查工具
1 简介
概述
Arthas 是Alibaba开源的Java诊断工具。可实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信息等,大大提升线上问题排查效率。
解决的问题
1.这个类从哪个 jar 包加载的?为什么会报各种类相关的 Exception?
2.我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
3.遇到问题无法在线上 debug,难道只能通过加日志再重新发布吗?
4.线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现!
5.是否有一个全局视角来查看系统的运行状况?
6.有什么办法可以监控到JVM的实时运行状态?
参考文档
https://blog.csdn.net/ls18802694089/article/details/134678902
https://arthas.gitee.io/doc/quick-start.html
2 使用
1.下载启动demo java程序
是一个简单的程序,每隔一秒生成一个随机数,再执行质因数分解,并打印出分解结果
1 | curl -O https://arthas.aliyun.com/math-game.jar |
2.下载启动 arthas
在命令行下面执行(使用和目标进程一致的用户启动,否则可能 attach 失败):
1 | curl -O https://arthas.aliyun.com/arthas-boot.jar |
执行该程序的用户需要和目标进程具有相同的权限。比如以admin用户来执行:
1 | sudo su admin && java -jar arthas-boot.jar |
如果 attach 不上目标进程,可以查看~/logs/arthas/ 目录下的日志。
如果下载速度比较慢,可以使用 aliyun 的镜像:
1 | java -jar arthas-boot.jar --repo-mirror aliyun --use-http |
打印更多参数信息。java -jar arthas-boot.jar -h
启动后会让我们选择java进程,如下
1 | $ $ java -jar arthas-boot.jar |
如我们的demo 程序是2,则进程是第 2 个,则输入 2,再输入回车/enter。Arthas 会 attach 到目标进程上。
依赖JDK
Install OpenJDK-8
1 | RUN apt-get update && apt-get install -y openjdk-8-jdk && apt-get install -y ant && apt-get clean; |
Fix certificate issues
1 | RUN apt-get update && apt-get install ca-certificates-java && apt-get clean && update-ca-certificates -f; |
Setup JAVA_HOME – useful for docker commandline
1 | ENV JAVA_HOME /usr/lib/jvm/java-8-openjdk-amd64/ |
3 操作
jvm相关
1 | dashboard - 当前系统的实时数据面板 |
class/classloader 相关
1 | classloader - 查看 classloader 的继承树,urls,类加载信息,使用 classloader 去 getResource |
monitor/watch/trace 相关
ps:请注意,这些命令,都通过字节码增强技术来实现的,会在指定类的方法中插入一些切面来实现数据统计和观测,因此在线上、预发使用时,请尽量明确需要观测的类、方法以及条件,诊断结束要执行 stop 或将增强过的类执行 reset 命令。
1 | monitor - 方法执行监控 |
profiler/火焰图
1 | profiler - 使用async-profiler对应用采样,生成火焰图 |
options/查看或设置 Arthas 全局开关
1 | options - 查看或设置 Arthas 全局开关 |
管道
1 | Arthas 支持使用管道对上述命令的结果进行进一步的处理,如sm java.lang.String * | grep 'index' |
基础命令
1 | base64 - base64 编码转换,和 linux 里的 base64 命令类似 |
4 常用命令说明
dashboard
输入dashboard,按回车/enter,会展示类似如下的进程信息,按ctrl+c可以中断执行

thread

1 | thread -n 5:打印前5个最忙的线程并打印堆栈 |

jad
这里的反编译用起来比较简单,只需要输入全类名即可反编译源码:jad com.test.Test,执行jad命令后还会打印出类加载器和class文件的所在目录;
除此之外jad还可以反编译类中的某个方法,下面的代码只编译main方法,并且不显示行号,lineNumber默认的值是true,现在我们把它设为false就不显示行号了;
1 | jad com.test.Test main --lineNumber false |
watch
watch命令可以让用户能方便的观察到指定方法的调用情况。能观察到的范围为:返回值、抛出异常、入参,通过编写 OGNL 表达式进行对应变量的查看。
1、以下命令用于观察方法出参和返回值,
1 | watch com.test.Test show "{params,returnObj}" -x 2 -b -e -s -f |
trace
trace 命令能主动搜索方法调用路径,,并输出方法路径上的每个节点上耗时,渲染和统计整个调用链路上的所有性能开销和追踪调用链路。
监听Test类下show方法的调用链:trace com.test.Test show
1 | [arthas@4805]$ trace com.test.Test show |
通过结果可以看到,在main线程中show()方法调用了showChild()方法,前面的ms数是调用方法所花费的时间,
调用链属性说明
thread_name :线程名称
id:内部线程id
is_daemon : 是否为守护线程
priority:线程优先级
TCCL:类加载器




