jstack命令解析-ag真人游戏

前言

如果有一天，你的java程序长时间停顿，也许是它病了，需要用jstack拍个片子分析分析，才能诊断具体什么病症，是死锁综合征，还是死循环等其他病症，本文我们一起来学习jstack命令~

jstack 的功能
jstack用法
线程状态等基础回顾
实战案例1：jstack 分析死锁
实战案例2：jstack 分析cpu 过高

jstack 的功能

jstack是jvm自带的java堆栈跟踪工具，它用于打印出给定的java进程id、core file、远程调试服务的java堆栈信息.

jstack prints java stack traces of java threads for a given java process or
core file or a remote debug server. 
复制代码

jstack命令用于生成虚拟机当前时刻的线程快照。

线程快照是当前虚拟机内每一条线程正在执行的方法堆栈的集合，生成线程快照的主要目的是定位线程出现长时间停顿的原因，如线程间死锁、死循环、请求外部资源导致的长时间等待等问题。

线程出现停顿的时候通过jstack来查看各个线程的调用堆栈，就可以知道没有响应的线程到底在后台做什么事情，或者等待什么资源。

如果java程序崩溃生成core文件，jstack工具可以用来获得core文件的java stack和native stack的信息，从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。

另外，jstack工具还可以附属到正在运行的java程序中，看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态，jstack是非常有用的。

jstack用法

jstack 命令格式如下

jstack [ option ] pid 
jstack [ option ] executable core 
jstack [ option ] [server-id@]remote-hostname-or-ip 
复制代码

executable java executable from which the core dump was produced.(可能是产生core dump的java可执行程序)
core 将被打印信息的core dump文件
remote-hostname-or-ip 远程debug服务的主机名或ip
server-id 唯一id,假如一台主机上多个远程debug服务

最常用的是

jstack [option]   // 打印某个进程的堆栈信息
复制代码

option参数说明如下：

选项	作用
-f	当正常输出的请求不被响应时，强制输出线程堆栈
-m	如果调用到本地方法的话，可以显示c/c 的堆栈
-l	除堆栈外，显示关于锁的附加信息，在发生死锁时可以用jstack -l pid来观察锁持有情况

线程状态等基础回顾

线程状态简介

jstack用于生成线程快照的，我们分析线程的情况，需要复习一下线程状态吧，拿小凳子坐好，复习一下啦~

java语言定义了6种线程池状态：

new：创建后尚未启动的线程处于这种状态，不会出现在dump中。
runnable：包括running和ready。线程开启start（）方法，会进入该状态，在虚拟机内执行的。
waiting：无限的等待另一个线程的特定操作。
timed waiting：有时限的等待另一个线程的特定操作。
阻塞（blocked）：在程序等待进入同步区域的时候，线程将进入这种状态，在等待监视器锁。
结束（terminated）：已终止线程的线程状态，线程已经结束执行。

dump文件的线程状态一般其实就以下3种：

runnable，线程处于执行中
blocked，线程被阻塞
waiting，线程正在等待

monitor 监视锁

因为java程序一般都是多线程运行的，java多线程跟监视锁环环相扣，所以我们分析线程状态时，也需要回顾一下monitor监视锁知识。

有关于线程同步关键字synchronized与监视锁的爱恨情仇，有兴趣的伙伴可以看一下我这篇文章 synchronized解析——如果你愿意一层一层剥开我的心

monitor的工作原理图如下：

线程想要获取monitor,首先会进入entry set队列，它是waiting thread，线程状态是waiting for monitor entry。
当某个线程成功获取对象的monitor后,进入owner区域，它就是active thread。
如果线程调用了wait()方法，则会进入wait set队列，它会释放monitor锁，它也是waiting thread，线程状态in object.wait()
如果其他线程调用 notify() / notifyall() ，会唤醒wait set中的某个线程，该线程再次尝试获取monitor锁，成功即进入owner区域。

dump 文件分析关注重点

runnable，线程处于执行中
deadlock，死锁（重点关注）
blocked，线程被阻塞（重点关注）
parked，停止
locked，对象加锁
waiting，线程正在等待
waiting to lock 等待上锁
object.wait()，对象等待中
waiting for monitor entry 等待获取监视器（重点关注）
waiting on condition，等待资源（重点关注），最常见的情况是线程在等待网络的读写

实战案例1：jstack 分析死锁问题

什么是死锁？
如何用jstack排查死锁？

什么是死锁？

死锁是指两个或两个以上的线程在执行过程中，因争夺资源而造成的一种互相等待的现象，若无外力作用，它们都将无法进行下去。

如何用如何用jstack排查死锁问题

先来看一段会产生死锁的java程序，源码如下：

/**
 * java 死锁demo
 */
public class deathlocktest {
    private static lock lock1 = new reentrantlock();
    private static lock lock2 = new reentrantlock();
    public static void deathlock() {
        thread t1 = new thread() {
            @override
            public void run() {
                try {
                    lock1.lock();
                    system.out.println(thread.currentthread().getname()   " get the lock1");
                    thread.sleep(1000);
                    lock2.lock();
                    system.out.println(thread.currentthread().getname()   " get the lock2");
                } catch (interruptedexception e) {
                    e.printstacktrace();
                }
            }
        };
        thread t2 = new thread() {
            @override
            public void run() {
                try {
                    lock2.lock();
                    system.out.println(thread.currentthread().getname()   " get the lock2");
                    thread.sleep(1000);
                    lock1.lock();
                    system.out.println(thread.currentthread().getname()   " get the lock1");
                } catch (interruptedexception e) {
                    e.printstacktrace();
                }
            }
        };
        //设置线程名字，方便分析堆栈信息
        t1.setname("mythread-jay");
        t2.setname("mythread-tianluo");
        t1.start();
        t2.start();
    }
    public static void main(string[] args) {
        deathlock();
    }
}
复制代码

运行结果：

显然，线程jay和线程tianluo都是只执行到一半，就陷入了阻塞等待状态~

jstack排查java死锁步骤

在终端中输入jsp查看当前运行的java程序
使用 jstack -l pid 查看线程堆栈信息
分析堆栈信息

在终端中输入jsp查看当前运行的java程序

通过使用 jps 命令获取需要监控的进程的pid，我们找到了23780 deathlocktest

使用 jstack -l pid 查看线程堆栈信息

由上图，可以清晰看到死锁信息：

mythread-tianluo 等待这个锁 “0x00000000d61ae3a0”，这个锁是由于mythread-jay线程持有。
mythread-jay线程等待这个锁“0x00000000d61ae3d0”,这个锁是由mythread-tianluo 线程持有。

还原死锁真相

“mythread-tianluo"线程堆栈信息分析如下：

mythread-tianluo的线程处于等待（waiting）状态，持有“0x00000000d61ae3d0”锁，等待“0x00000000d61ae3a0”的锁

“mythread-jay"线程堆栈信息分析如下：

mythread-tianluo的线程处于等待（waiting）状态，持有“0x00000000d61ae3a0”锁，等待“0x00000000d61ae3d0”的锁

实战案例2：jstack 分析cpu过高问题

来个导致cpu过高的demo程序，一个死循环，哈哈~

/**
 * 有个导致cpu过高程序的demo，死循环
 */
public class jstackcase {
     private static executorservice executorservice = executors.newfixedthreadpool(5);
    public static void main(string[] args) {
        task task1 = new task();
        task task2 = new task();
        executorservice.execute(task1);
        executorservice.execute(task2);
    }
    public static object lock = new object();
    static class task implements runnable{
        public void run() {
            synchronized (lock){
                long sum = 0l;
                while (true){
                    sum  = 1;
                }
            }
        }
    }
}
复制代码

jstack 分析cpu过高步骤

1. top
1. top -hp pid
1. jstack pid
1. jstack -l [pid] >/tmp/log.txt
1. 分析堆栈信息

1.top

在服务器上，我们可以通过top命令查看各个进程的cpu使用情况，它默认是按cpu使用率由高到低排序的

由上图中，我们可以找出pid为21340的java进程，它占用了最高的cpu资源，凶手就是它，哈哈！

2. top -hp pid

通过top -hp 21340可以查看该进程下，各个线程的cpu使用情况，如下：

可以发现pid为21350的线程，cpu资源占用最高~，嘻嘻，小本本把它记下来，接下来拿jstack给它拍片子~

3. jstack pid

通过top命令定位到cpu占用率较高的线程之后，接着使用jstack pid命令来查看当前java进程的堆栈状态，jstack 21350后，内容如下：

4. jstack -l [pid] >/tmp/log.txt

其实，前3个步骤，堆栈信息已经出来啦。但是一般在生成环境，我们可以把这些堆栈信息打到一个文件里，再回头仔细分析哦~

5. 分析堆栈信息

我们把占用cpu资源较高的线程pid（本例子是21350），将该pid转成16进制的值

在thread dump中，每个线程都有一个nid，我们找到对应的nid（5366），发现一直在跑（24行）

这个时候，可以去检查代码是否有问题啦~ 当然，也建议隔段时间再执行一次stack命令，再一份获取thread dump，毕竟两次拍片结果（jstack）对比，更准确嘛~