前言
如果有一天,你的java程序长时间停顿,也许是它病了,需要用jstack拍个片子分析分析,才能诊断具体什么病症,是死锁综合征,还是死循环等其他病症,本文我们一起来学习jstack命令~
- jstack 的功能
- jstack用法
- 线程状态等基础回顾
- 实战案例1:jstack 分析死锁
- 实战案例2:jstack 分析cpu 过高
jstack 的功能
jstack是jvm自带的java堆栈跟踪工具,它用于打印出给定的java进程id、core file、远程调试服务的java堆栈信息.
jstack prints java stack traces of java threads for a given java process or
core file or a remote debug server.
复制代码
- jstack命令用于生成虚拟机当前时刻的线程快照。
- 线程快照是当前虚拟机内每一条线程正在执行的方法堆栈的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因, 如线程间死锁、死循环、请求外部资源导致的长时间等待等问题。
- 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做什么事情,或者等待什么资源。
- 如果java程序崩溃生成core文件,jstack工具可以用来获得core文件的java stack和native stack的信息,从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。
- 另外,jstack工具还可以附属到正在运行的java程序中,看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态,jstack是非常有用的。
jstack用法
jstack 命令格式如下
jstack [ option ] pid
jstack [ option ] executable core
jstack [ option ] [server-id@]remote-hostname-or-ip
复制代码
- executable java executable from which the core dump was produced.(可能是产生core dump的java可执行程序)
- core 将被打印信息的core dump文件
- remote-hostname-or-ip 远程debug服务的主机名或ip
- server-id 唯一id,假如一台主机上多个远程debug服务
最常用的是
jstack [option] // 打印某个进程的堆栈信息
复制代码
option参数说明如下:
选项 | 作用 |
---|---|
-f | 当正常输出的请求不被响应时,强制输出线程堆栈 |
-m | 如果调用到本地方法的话,可以显示c/c 的堆栈 |
-l | 除堆栈外,显示关于锁的附加信息,在发生死锁时可以用jstack -l pid来观察锁持有情况 |
线程状态等基础回顾
线程状态简介
jstack用于生成线程快照的,我们分析线程的情况,需要复习一下线程状态吧,拿小凳子坐好,复习一下啦~
java语言定义了6种线程池状态:
- new:创建后尚未启动的线程处于这种状态,不会出现在dump中。
- runnable:包括running和ready。线程开启start()方法,会进入该状态,在虚拟机内执行的。
- waiting:无限的等待另一个线程的特定操作。
- timed waiting:有时限的等待另一个线程的特定操作。
- 阻塞(blocked):在程序等待进入同步区域的时候,线程将进入这种状态,在等待监视器锁。
- 结束(terminated):已终止线程的线程状态,线程已经结束执行。
dump文件的线程状态一般其实就以下3种:
- runnable,线程处于执行中
- blocked,线程被阻塞
- waiting,线程正在等待
monitor 监视锁
因为java程序一般都是多线程运行的,java多线程跟监视锁环环相扣,所以我们分析线程状态时,也需要回顾一下monitor监视锁知识。
有关于线程同步关键字synchronized与监视锁的爱恨情仇,有兴趣的伙伴可以看一下我这篇文章 synchronized解析——如果你愿意一层一层剥开我的心
monitor的工作原理图如下:
- 线程想要获取monitor,首先会进入entry set队列,它是waiting thread,线程状态是waiting for monitor entry。
- 当某个线程成功获取对象的monitor后,进入owner区域,它就是active thread。
- 如果线程调用了wait()方法,则会进入wait set队列,它会释放monitor锁,它也是waiting thread,线程状态in object.wait()
- 如果其他线程调用 notify() / notifyall() ,会唤醒wait set中的某个线程,该线程再次尝试获取monitor锁,成功即进入owner区域。
dump 文件分析关注重点
- runnable,线程处于执行中
- deadlock,死锁(重点关注)
- blocked,线程被阻塞 (重点关注)
- parked,停止
- locked,对象加锁
- waiting,线程正在等待
- waiting to lock 等待上锁
- object.wait(),对象等待中
- waiting for monitor entry 等待获取监视器(重点关注)
- waiting on condition,等待资源(重点关注),最常见的情况是线程在等待网络的读写
实战案例1:jstack 分析死锁问题
- 什么是死锁?
- 如何用jstack排查死锁?
什么是死锁?
死锁是指两个或两个以上的线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法进行下去。
如何用如何用jstack排查死锁问题
先来看一段会产生死锁的java程序,源码如下:
/**
* java 死锁demo
*/
public class deathlocktest {
private static lock lock1 = new reentrantlock();
private static lock lock2 = new reentrantlock();
public static void deathlock() {
thread t1 = new thread() {
@override
public void run() {
try {
lock1.lock();
system.out.println(thread.currentthread().getname() " get the lock1");
thread.sleep(1000);
lock2.lock();
system.out.println(thread.currentthread().getname() " get the lock2");
} catch (interruptedexception e) {
e.printstacktrace();
}
}
};
thread t2 = new thread() {
@override
public void run() {
try {
lock2.lock();
system.out.println(thread.currentthread().getname() " get the lock2");
thread.sleep(1000);
lock1.lock();
system.out.println(thread.currentthread().getname() " get the lock1");
} catch (interruptedexception e) {
e.printstacktrace();
}
}
};
//设置线程名字,方便分析堆栈信息
t1.setname("mythread-jay");
t2.setname("mythread-tianluo");
t1.start();
t2.start();
}
public static void main(string[] args) {
deathlock();
}
}
复制代码
运行结果:
显然,线程jay和线程tianluo都是只执行到一半,就陷入了阻塞等待状态~
jstack排查java死锁步骤
- 在终端中输入jsp查看当前运行的java程序
- 使用 jstack -l pid 查看线程堆栈信息
- 分析堆栈信息
在终端中输入jsp查看当前运行的java程序
通过使用 jps 命令获取需要监控的进程的pid,我们找到了23780 deathlocktest
使用 jstack -l pid 查看线程堆栈信息
由上图,可以清晰看到死锁信息:
- mythread-tianluo 等待这个锁 “0x00000000d61ae3a0”,这个锁是由于mythread-jay线程持有。
- mythread-jay线程等待这个锁“0x00000000d61ae3d0”,这个锁是由mythread-tianluo 线程持有。
还原死锁真相
“mythread-tianluo"线程堆栈信息分析如下:
- mythread-tianluo的线程处于等待(waiting)状态,持有“0x00000000d61ae3d0”锁,等待“0x00000000d61ae3a0”的锁
“mythread-jay"线程堆栈信息分析如下:
- mythread-tianluo的线程处于等待(waiting)状态,持有“0x00000000d61ae3a0”锁,等待“0x00000000d61ae3d0”的锁
实战案例2:jstack 分析cpu过高问题
来个导致cpu过高的demo程序,一个死循环,哈哈~
/**
* 有个导致cpu过高程序的demo,死循环
*/
public class jstackcase {
private static executorservice executorservice = executors.newfixedthreadpool(5);
public static void main(string[] args) {
task task1 = new task();
task task2 = new task();
executorservice.execute(task1);
executorservice.execute(task2);
}
public static object lock = new object();
static class task implements runnable{
public void run() {
synchronized (lock){
long sum = 0l;
while (true){
sum = 1;
}
}
}
}
}
复制代码
jstack 分析cpu过高步骤
-
- top
-
- top -hp pid
-
- jstack pid
-
- jstack -l [pid] >/tmp/log.txt
-
- 分析堆栈信息
1.top
在服务器上,我们可以通过top命令查看各个进程的cpu使用情况,它默认是按cpu使用率由高到低排序的
由上图中,我们可以找出pid为21340的java进程,它占用了最高的cpu资源,凶手就是它,哈哈!
2. top -hp pid
通过top -hp 21340可以查看该进程下,各个线程的cpu使用情况,如下:
可以发现pid为21350的线程,cpu资源占用最高~,嘻嘻,小本本把它记下来,接下来拿jstack给它拍片子~
3. jstack pid
通过top命令定位到cpu占用率较高的线程之后,接着使用jstack pid命令来查看当前java进程的堆栈状态,jstack 21350
后,内容如下:
4. jstack -l [pid] >/tmp/log.txt
其实,前3个步骤,堆栈信息已经出来啦。但是一般在生成环境,我们可以把这些堆栈信息打到一个文件里,再回头仔细分析哦~
5. 分析堆栈信息
我们把占用cpu资源较高的线程pid(本例子是21350),将该pid转成16进制的值
在thread dump中,每个线程都有一个nid,我们找到对应的nid(5366),发现一直在跑(24行)
这个时候,可以去检查代码是否有问题啦~ 当然,也建议隔段时间再执行一次stack命令,再一份获取thread dump,毕竟两次拍片结果(jstack)对比,更准确嘛~