当前位置 : 主页 > 网络编程 > 其它编程 >

JVM监控及故障处理工具

来源:互联网 收集:自由互联 发布时间:2023-07-02
目录1JVM参数2SunJDK监控和故障处理工具jps:虚拟机进程状况工具jstat:虚拟机统计信息监视工具jmap:java内存映射工具jhat:jvm堆快照分析工具 目录 1 JVM参数 2  SunJDK监控和故障处理工具 jps: 虚拟
目录1JVM参数2SunJDK监控和故障处理工具jps:虚拟机进程状况工具jstat:虚拟机统计信息监视工具jmap:java内存映射工具jhat:jvm堆快照分析工具

目录

1 JVM参数

2  SunJDK监控和故障处理工具

jps: 虚拟机进程状况工具

jstat: 虚拟机统计信息监视工具

jmap: java 内存映射工具

jhat:jvm堆快照分析工具

jstack:java堆栈跟踪工具

jinfojava配置信息

3 JDK的可视化工具

4  应用

1、cpu飙升

2、线程死锁

3、OOM内存泄露


1 JVM参数

参数分类

  • 1.标准参数  功能和输出的参数都是很稳定的 在未来的JVM版本中不会改变 可以使用java -help检索出所有的标准参数
  • 2.X参数  非标准化参数 在未来的版本可能会改变 所有的参数都用-X开始 可以使用java -X检索 但是注意没有-Xcomp
  • 3.XX参数  非标准 很长一段时间不会列出来 用于JVM开发的debug和调优

2  SunJDK监控和故障处理工具

名称

主要作用jpsjvm process status tool,显示指定系统内所有的hotspot虚拟机进程jstatjvm statistics monitoring tool,用于收集hotspot虚拟机各方面的运行数据jinfoconfiguration info for java显示虚拟机配置信息jmapmemory map for java,生成虚拟机的内存转储快照heapdump文件jhatjvm heap dump browser用于分析heapmap文件它会建立一个http/html服务器让用户可以在浏览器上查看分析结果jstackstack trace for java ,显示虚拟机的线程快照

jps: 虚拟机进程状况工具

jps 绝对是使用频率最高的 JDK 命令行工具它的作用是可以列出正在运行的虚拟机进程并显示虚拟机执行主类 Main Class main() 函数所在的类名称以及这些进程的本地虚拟机唯一 ID LVMID LocalVirtual Machine Identifier 。

命令格式

jps [options ] [ hostid ]

执行样例

PS D:\> jps -l5200 org.jetbrains.jps.cmdline.Launcher16868 jdk.jcmd/sun.tools.jps.Jps19368 org.jetbrains.idea.maven.server.RemoteMavenServer36

可以看到我本机有三个 JVM 进程 5200 和 19368 是软件 IDEA 的进程从类名上是可以看出来的还有一个是 jps 本身的这个 JVM 进程。

列举一些常用参数

可选项作用-l输出完全的包名应用主类名jar的完全路径名。-q仅输出 VM 标识符不包括 classname , jar name , arguments in main method 。-m输出 main method 的参数。-v输出 JVM 参数。

jstat: 虚拟机统计信息监视工具

jstat(JVM statistics Monitoring)是用于监视虚拟机运行时状态信息的命令它可以显示出虚拟机进程中的类装载、内存、垃圾收集、JIT编译等运行数据。

命令格式

jstat [option] LVMID [interval] [count]

参数

  • [option] : 操作参数

  • LVMID : 本地虚拟机进程ID

  • [interval] : 连续输出的时间间隔

  • [count] : 连续输出的次数

option 参数总览

OptionDisplays…classclass loader的行为统计。Statistics on the behavior of the class loader.compilerHotSpt JIT编译器行为统计。Statistics of the behavior of the HotSpot Just-in-Time compiler.gc垃圾回收堆的行为统计。Statistics of the behavior of the garbage collected heap.gccapacity各个垃圾回收代容量(young,old,perm)和他们相应的空间统计。Statistics of the capacities of the generations and their corresponding spaces.gcutil垃圾回收统计概述。Summary of garbage collection statistics.gccause垃圾收集统计概述同-gcutil附加最近两次垃圾回收事件的原因。Summary of garbage collection statistics (same as -gcutil), with the cause of the last andgcnew新生代行为统计。Statistics of the behavior of the new generation.gcnewcapacity新生代与其相应的内存空间的统计。Statistics of the sizes of the new generations and its corresponding spaces.gcold年老代和永生代行为统计。Statistics of the behavior of the old and permanent generations.gcoldcapacity年老代行为统计。Statistics of the sizes of the old generation.gcpermcapacity永生代行为统计。Statistics of the sizes of the permanent generation.printcompilationHotSpot编译方法统计。HotSpot compilation method statistics.

option 参数详解

-class

监视类装载、卸载数量、总空间以及耗费的时间

$ jstat -class 11589Loaded Bytes Unloaded Bytes Time 7035 14506.3 0 0.0 3.67

  • Loaded : 加载class的数量

  • Bytes : class字节大小

  • Unloaded : 未加载class的数量

  • Bytes : 未加载class的字节大小

  • Time : 加载时间

-compiler

输出JIT编译过的方法数量耗时等

$ jstat -compiler 1262Compiled Failed Invalid Time FailedType FailedMethod2573 1 0 47.60 1 org/apache/catalina/loader/WebappClassLoader findResourceInternal

  • Compiled : 编译数量

  • Failed : 编译失败数量

  • Invalid : 无效数量

  • Time : 编译耗时

  • FailedType : 失败类型

  • FailedMethod : 失败方法的全限定名

-gc

垃圾回收堆的行为统计常用命令

$ jstat -gc 1262S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT 26112.0 24064.0 6562.5 0.0 564224.0 76274.5 434176.0 388518.3 524288.0 42724.7 320 6.417 1 0.398 6.815

C即Capacity 总容量U即Used 已使用的容量

  • S0C : survivor0区的总容量

  • S1C : survivor1区的总容量

  • S0U : survivor0区已使用的容量

  • S1U : survivor1区已使用的容量

  • EC : Eden区的总容量

  • EU : Eden区已使用的容量

  • OC : Old区的总容量

  • OU : Old区已使用的容量PC 当前perm的容量 (KB) PU perm的使用 (KB)

  • YGC : 新生代垃圾回收次数

  • YGCT : 新生代垃圾回收时间

  • FGC : 老年代垃圾回收次数

  • FGCT : 老年代垃圾回收时间

  • GCT : 垃圾回收总消耗时间

$ jstat -gc 1262 2000 20

这个命令意思就是每隔2000ms输出1262的gc情况一共输出20次

-gccapacity

同-gc不过还会输出Java堆各区域使用到的最大、最小空间

 

  • NGCMN : 新生代占用的最小空间

  • NGCMX : 新生代占用的最大空间

  • OGCMN : 老年代占用的最小空间

  • OGCMX : 老年代占用的最大空间

  • OGC当前年老代的容量 (KB)

  • OC当前年老代的空间 (KB)

  • PGCMN : perm占用的最小空间

  • PGCMX : perm占用的最大空间

-gcutil

同-gc不过输出的是已使用空间占总空间的百分比

$ jstat -gcutil 28920S0 S1 E O P YGC YGCT FGC FGCT GCT 12.45 0.00 33.85 0.00 4.44 4 0.242 0 0.000 0.242

-gccause

垃圾收集统计概述同-gcutil附加最近两次垃圾回收事件的原因

$ jstat -gccause 28920S0 S1 E O P YGC YGCT FGC FGCT GCT LGCC GCC 12.45 0.00 33.85 0.00 4.44 4 0.242 0 0.000 0.242 Allocation Failure No GC

 

  • LGCC最近垃圾回收的原因

  • GCC当前垃圾回收的原因

-gcnew

统计新生代的行为

$ jstat -gcnew 28920S0C S1C S0U S1U TT MTT DSS EC EU YGC YGCT 419392.0 419392.0 52231.8 0.0 6 6 209696.0 3355520.0 1172246.0 4 0.242

 

  • TTTenuring threshold(提升阈值)

  • MTT最大的tenuring threshold

  • DSSsurvivor区域大小 (KB)

-gcnewcapacity

新生代与其相应的内存空间的统计

$ jstat -gcnewcapacity 28920NGCMN NGCMX NGC S0CMX S0C S1CMX S1C ECMX EC YGC FGC 4194304.0 4194304.0 4194304.0 419392.0 419392.0 419392.0 419392.0 3355520.0 3355520.0 4 0

  • NGC:当前年轻代的容量 (KB)

  • S0CMX:最大的S0空间 (KB)

  • S0C:当前S0空间 (KB)

  • ECMX:最大eden空间 (KB)

  • EC:当前eden空间 (KB)

-gcold

统计旧生代的行为

$ jstat -gcold 28920PC PU OC OU YGC FGC FGCT GCT 1048576.0 46561.7 6291456.0 0.0 4 0 0.000 0.242

hotspot编译方法统计

$ jstat -printcompilation 28920Compiled Size Type Method1291 78 1 java/util/ArrayList indexOf

  • Compiled被执行的编译任务的数量

  • Size方法字节码的字节数

  • Type编译类型

  • Method编译方法的类名和方法名。类名使用”/” 代替 “.” 作为空间分隔符. 方法名是给出类的方法名. 格式是一致于HotSpot - XX:PrintComplation 选项

jmap: java 内存映射工具

jmap命令用于生产堆转存快照。打印出某个java进程使用pid内存内的所有‘对象’的情况如产生那些对象及其数量。

jmap(JVM Memory Map)命令用于生成heap dump文件如果不使用这个命令还阔以使用-XX:HeapDumpOnOutOfMemoryError参数来让虚拟机出现OOM的时候·自动生成dump文件。 jmap不仅能生成dump文件还阔以查询finalize执行队列、Java堆和永久代的详细信息如当前使用率、当前使用的是哪种收集器等。

命令格式

jmap [option] LVMID

option参数

  • dump : 生成堆转储快照

  • finalizerinfo : 显示在F-Queue队列等待Finalizer线程执行finalizer方法的对象

  • heap : 显示Java堆详细信息

  • histo : 显示堆中对象的统计信息

  • permstat : to print permanent generation statistics

  • F : 当-dump没有响应时强制生成dump快照

示例

-dump

常用格式

-dump::live,formatb,file pid

dump堆到文件,format指定输出格式live指明是活着的对象,file指定文件名

$ jmap -dump:live,formatb,filedump.hprof 28920Dumping heap to /home/xxx/dump.hprof ...Heap dump file created

dump.hprof这个后缀是为了后续可以直接用MAT(Memory Anlysis Tool)打开。

-finalizerinfo

打印等待回收对象的信息

$ jmap -finalizerinfo 28920Attaching to process ID 28920, please wait...Debugger attached successfully.Server compiler detected.JVM version is 24.71-b01Number of objects pending for finalization: 0

 

可以看到当前F-QUEUE队列中并没有等待Finalizer线程执行finalizer方法的对象。

-heap

打印heap的概要信息GC使用的算法heap的配置及wise heap的使用情况,可以用此来判断内存目前的使用情况以及垃圾回收情况

$ jmap -heap 28920Attaching to process ID 28920, please wait...Debugger attached successfully.Server compiler detected.JVM version is 24.71-b01 ​using thread-local object allocation.Parallel GC with 4 thread(s)//GC 方式 ​Heap Configuration: //堆内存初始化配置MinHeapFreeRatio 0 //对应jvm启动参数-XX:MinHeapFreeRatio设置JVM堆最小空闲比率(default 40)MaxHeapFreeRatio 100 //对应jvm启动参数 -XX:MaxHeapFreeRatio设置JVM堆最大空闲比率(default 70)MaxHeapSize 2082471936 (1986.0MB) //对应jvm启动参数-XX:MaxHeapSize设置JVM堆的最大大小NewSize 1310720 (1.25MB)//对应jvm启动参数-XX:NewSize设置JVM堆的‘新生代’的默认大小MaxNewSize 17592186044415 MB//对应jvm启动参数-XX:MaxNewSize设置JVM堆的‘新生代’的最大大小OldSize 5439488 (5.1875MB)//对应jvm启动参数-XX:OldSize:设置JVM堆的‘老生代’的大小NewRatio 2 //对应jvm启动参数-XX:NewRatio:‘新生代’和‘老生代’的大小比率SurvivorRatio 8 //对应jvm启动参数-XX:SurvivorRatio设置年轻代中Eden区与Survivor区的大小比值 PermSize 21757952 (20.75MB) //对应jvm启动参数-XX:PermSize:设置JVM堆的‘永生代’的初始大小MaxPermSize 85983232 (82.0MB)//对应jvm启动参数-XX:MaxPermSize:设置JVM堆的‘永生代’的最大大小G1HeapRegionSize 0 (0.0MB) ​Heap Usage://堆内存使用情况PS Young GenerationEden Space://Eden区内存分布capacity 33030144 (31.5MB)//Eden区总容量used 1524040 (1.4534378051757812MB) //Eden区已使用free 31506104 (30.04656219482422MB) //Eden区剩余容量4.614088270399305% used //Eden区使用比率From Space: //其中一个Survivor区的内存分布capacity 5242880 (5.0MB)used 0 (0.0MB)free 5242880 (5.0MB)0.0% usedTo Space: //另一个Survivor区的内存分布capacity 5242880 (5.0MB)used 0 (0.0MB)free 5242880 (5.0MB)0.0% usedPS Old Generation //当前的Old区内存分布capacity 86507520 (82.5MB)used 0 (0.0MB)free 86507520 (82.5MB)0.0% usedPS Perm Generation//当前的 “永生代” 内存分布capacity 22020096 (21.0MB)used 2496528 (2.3808746337890625MB)free 19523568 (18.619125366210938MB)11.337498256138392% used ​670 interned Strings occupying 43720 bytes.

 

可以很清楚的看到Java堆中各个区域目前的情况。

-histo

打印堆的对象统计包括对象数、内存大小等等 因为在dump:live前会进行full gc如果带上live则只统计活对象因此不加live的堆大小要大于加live堆的大小

$ jmap -histo:live 28920 | morenum #instances #bytes class name----------------------------------------------1: 83613 12012248 2: 23868 11450280 [B3: 83613 10716064 4: 76287 10412128 [C5: 8227 9021176 6: 8227 5830256 7: 7031 5156480 8: 73627 1767048 java.lang.String9: 2260 1348848 10: 8856 849296 java.lang.Class....

jhat:jvm堆快照分析工具

jhat(JVM Heap Analysis Tool)命令是与jmap搭配使用用来分析jmap生成的dumpjhat内置了一个微型的HTTP/HTML服务器生成dump的分析结果后可以在浏览器中查看。在此要注意一般不会直接在服务器上进行分析因为jhat是一个耗时并且耗费硬件资源的过程一般把服务器生成的dump文件复制到本地或其他机器上进行分析。

命令格式

jhat [dumpfile]

参数

  • -stack false|true 关闭对象分配调用栈跟踪(tracking object allocation call stack)。 如果分配位置信息在堆转储中不可用. 则必须将此标志设置为 false. 默认值为 true.>

  • -refs false|true 关闭对象引用跟踪(tracking of references to objects)。 默认值为 true. 默认情况下, 返回的指针是指向其他特定对象的对象,如反向链接或输入引用(referrers or incoming references), 会统计/计算堆中的所有对象。>

  • -port port-number 设置 jhat HTTP server 的端口号. 默认值 7000.>

  • -exclude exclude-file 指定对象查询时需要排除的数据成员列表文件(a file that lists data members that should be excluded from the reachable objects query)。 例如, 如果文件列列出了 java.lang.String.value , 那么当从某个特定对象 Object o 计算可达的对象列表时, 引用路径涉及 java.lang.String.value 的都会被排除。>

  • -baseline exclude-file 指定一个基准堆转储(baseline heap dump)。 在两个 heap dumps 中有相同 object ID 的对象会被标记为不是新的(marked as not being new). 其他对象被标记为新的(new). 在比较两个不同的堆转储时很有用.>

  • -debug int 设置 debug 级别. 0 表示不输出调试信息。 值越大则表示输出更详细的 debug 信息.>

  • -version 启动后只显示版本信息就退出>

  • -J 因为 jhat 命令实际上会启动一个JVM来执行, 通过 -J 可以在启动JVM时传入一些启动参数. 例如, -J-Xmx512m 则指定运行 jhat 的Java虚拟机使用的最大堆内存为 512 MB. 如果需要使用多个JVM启动参数,则传入多个 -Jxxxxxx.

示例

$ jhat -J-Xmx512m dump.hprofeading from dump.hprof...Dump file created Fri Mar 11 17:13:42 CST 2016Snapshot read, resolving...Resolving 271678 objects...Chasing references, expect 54 dots......................................................Eliminating duplicate references......................................................Snapshot resolved.Started HTTP server on port 7000Server is ready.

中间的-J-Xmx512m是在dump快照很大的情况下分配512M内存去启动HTTP服务器运行完之后就可在浏览器打开Http://localhost:7000进行快照分析 堆快照分析主要在最后面的Heap Histogram里里面根据class列出了dump的时候所有存活对象。

jstack:java堆栈跟踪工具

jstack用于生成java虚拟机当前时刻的线程快照。线程快照是当前java虚拟机内每一条线程正在执行的方法堆栈的集合生成线程快照的主要目的是定位线程出现长时间停顿的原因如线程间死锁、死循环、请求外部资源导致的长时间等待等。 线程出现停顿的时候通过jstack来查看各个线程的调用堆栈就可以知道没有响应的线程到底在后台做什么事情或者等待什么资源。 如果java程序崩溃生成core文件jstack工具可以用来获得core文件的java stack和native stack的信息从而可以轻松地知道java程序是如何崩溃和在程序何处发生问题。另外jstack工具还可以附属到正在运行的java程序中看到当时运行的java程序的java stack和native stack的信息, 如果现在运行的java程序呈现hung的状态jstack是非常有用的。

命令格式

jstack [option] LVMID

option参数

  • -F : 当正常输出请求不被响应时强制输出线程堆栈

  • -l : 除堆栈外显示关于锁的附加信息

  • -m : 如果调用到本地方法的话可以显示C/C的堆栈

示例

$ jstack -l 11494|more2016-07-28 13:40:04Full thread dump Java HotSpot(TM) 64-Bit Server VM (24.71-b01 mixed mode):​"Attach Listener" daemon prio10 tid0x00007febb0002000 nid0x6b6f waiting on condition [0x0000000000000000]java.lang.Thread.State: RUNNABLE​Locked ownable synchronizers:- None​"http-bio-8005-exec-2" daemon prio10 tid0x00007feb94028000 nid0x7b8c waiting on condition [0x00007fea8f56e000]java.lang.Thread.State: WAITING (parking)at sun.misc.Unsafe.park(Native Method)- parking to wait for (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)at java.util.concurrent.locks.LockSupport.park(LockSupport.java:186)at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2043)at java.util.concurrent.LinkedBlockingQueue.take(LinkedBlockingQueue.java:442)at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:104)at org.apache.tomcat.util.threads.TaskQueue.take(TaskQueue.java:32)at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1068)at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1130)at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)at org.apache.tomcat.util.threads.TaskThread$WrappingRunnable.run(TaskThread.java:61)at java.lang.Thread.run(Thread.java:745)​Locked ownable synchronizers:- None.....

 

jinfojava配置信息

jinfo(JVM Configuration info)这个命令作用是实时查看和调整虚拟机运行参数。 之前的jps -v口令只能查看到显示指定的参数如果想要查看未被显示指定的参数的值就要使用jinfo口令

命令格式

jinfo [option] [args] LVMID

option参数

  • -flag : 输出指定args参数的值

  • -flags : 不需要args参数输出所有JVM参数的值

  • -sysprops : 输出系统属性等同于System.getProperties()

示例

$ jinfo -flag 11494-XX:CMSInitiatingOccupancyFraction80

3 JDK的可视化工具

对jvm监控的常见可视化工具除了jdk本身提供的Jconsole和visualVm以外还有第三方提供的jprofilterperfino,YourkitPerf4jJProbeMAT等。这些工具都极大的丰富了我们定位以及优化jvm方式。

这些工具的使用网上有很多教程提供这里就不再过多介绍了。对于VisualVm来说比较推荐使用它除了对jvm的侵入性比较低以外还是jdk团队自己开发的相信以后功能会更加丰富和完善。jprofilter对于第三方监控工具提供的功能和可视化最为完善目前多数ide都支持其插件对于上线前的调试以及性能调优可以配合使用。

另外对于线上dump的heap信息应该尽量拉去到线下用于可视化工具来分析这样分析更详细。如果对于一些紧急的问题必须需要通过线上监控可以采用 VisualVm的远程功能来进行这需要使用tool.jar下的MAT功能。

4  应用

1、cpu飙升

在线上有时候某个时刻可能会出现应用某个时刻突然cpu飙升的问题。对此我们应该熟悉一些指令快速排查对应代码。

1.找到最耗CPU的进程

指令:top

2.找到该进程下最耗费cpu的线程

指令:top -Hp pid

3.转换进制

printf “%x\n” 15332 // 转换16进制转换后为0x3be4

4.过滤指定线程打印堆栈信息

指令:jstack pid |grep threadPid -C5 --color jstack 13525 |grep 0x3be4 -C5 --color // 打印进程堆栈 并通过线程id过滤得到线程堆栈信息。

可以看到是一个上报程序占用过多cpu了以上例子只为示例本身耗费cpu并不高

2、线程死锁

有时候部署场景会有线程死锁的问题发生但又不常见。此时我们采用jstack查看下一下。比如说我们现在已经有一个线程死锁的程序导致某些操作waiting中。

1.查找java进程id

指令:top 或者 jps

2.查看java进程的线程快照信息

指令jstack -l pid

从输出信息可以看到有一个线程死锁发生并且指出了那行代码出现的。如此可以快速排查问题。

3、OOM内存泄露

java堆内的OOM异常是实际应用中常见的内存溢出异常。一般我们都是先通过内存映射分析工具比如MAT对dump出来的堆转存快照进行分析确认内存中对象是否出现问题。

当然了出现OOM的原因有很多并非是堆中申请资源不足一种情况。还有可能是申请太多资源没有释放或者是频繁频繁申请系统资源耗尽。针对这三种情况我需要一一排查。

OOM的三种情况:

1.申请资源内存过小不够用。

2.申请资源太多没有释放。

3.申请资源过多资源耗尽。比如线程过多线程内存过大等。

1.排查申请申请资源问题。

指令:jmap -heap 11869

查看新生代老生代堆内存的分配大小以及使用情况看是否本身分配过小。

3.查找最费内存的对象

指令: jmap -histo:live 11869 | more

上述输出信息中最大内存对象才161kb,属于正常范围。如果某个对象占用空间很大比如超过了100Mb应该着重分析为何没有释放。

注意上述指令:

jmap -histo:live 11869 | more执行之后会造成jvm强制执行一次fgc在线上不推荐使用可以采取dump内存快照线下采用可视化工具进行分析更加详尽。jmap -dump:formatb,file/tmp/dump.dat 11869 或者采用线上运维工具自动化处理方便快速定位遗失出错时间。

4.确认资源是否耗尽

  • pstree 查看进程线程数量
  • netstat 查看网络连接数量

或者采用:

  • ll /proc/${PID}/fd | wc -l // 打开的句柄数
  • ll /proc/${PID}/task | wc -l 效果等同pstree -p | wc -l //打开的线程数

参考

JVM性能监控与故障处理工具

深入理解JVM虚拟机9JVM监控工具与诊断实践

理解jvm故障处理工具

上一篇:Windowsserver2008R2ADDS搭建
下一篇:没有了
网友评论