当前位置 : 主页 > 编程语言 > java >

Java 服务器cup占用率过高 以及 内存泄漏排查方法

来源:互联网 收集:自由互联 发布时间:2023-09-03
cup占用率过高 常见能够引起CPU100%异常的情况都有哪些? Java内存不够或者溢出导致GC overhead limit exceeded。 代码中互相竞争导致的死锁。 特别耗费计算资源的操作,比如正则匹配,Java中

cup占用率过高

常见能够引起CPU100%异常的情况都有哪些?

  1. Java 内存不够或者溢出导致GC overhead limit exceeded。
  2. 代码中互相竞争导致的死锁。
  3. 特别耗费计算资源的操作,比如正则匹配,Java中的正则匹配默认有回溯问题,复杂的正则匹配引起的CPU异常。
  4. 死循环引起的CPU高度密集计算。
    针对第1种,根据Oracle官方资料,GC overhead limit exceeded表示JVM一直在GC导致应用程序变慢,具体量化指标就是JVM执行垃圾回收花费超过98%的时间,但释放出的可用堆内存却少于2%,连续多次(一般5次)GC回收的内存都不足2%的情况下就会抛出此异常。

经过垃圾回收每次释放的内存都少于2%很容易又被新生对象填满,JVM快速进入下一次垃圾回收,无限循环,由此引起频繁的GC长期消耗我们服务器CPU资源,从而使CPU使用率达到100%

我们可以使用-XX:-UseGCOverheadLimit这个参数关闭GC overhead limit exceeded,但这样治标不治本,建议检查应用程序的内存使用是否合理以及是否需要增加堆内存。

测试代码

public class Test {
    public static void main(String[] args) {
        System.out.println("测试死循环对 CPU 影响");
        for (int i = 0; i < Integer.parseInt(args[0]); i++) {
            new Thread(()->{
                System.out.println(Thread.currentThread().getName());
                while (true){

                }
            },"线程:"+i).start();
        }
    }
}

Linux 编译运行 Test.java 程序

Java 服务器cup占用率过高 以及 内存泄漏排查方法_JVM

运行 Test 程序,启动 1 个死循环线程

Java 服务器cup占用率过高 以及 内存泄漏排查方法_java_02

top 命令查看 cpu 使用情况

Java 服务器cup占用率过高 以及 内存泄漏排查方法_内存泄漏_03

按大写 C 可以按 CPU 从大到小排序

可以看到 Test 的 CPU 使用率 100%,和 window 区别很大(window CPU 100% 就卡死了),我的 Linux 服务器是 2 核的,总 CPU 使用率 50 %,服务器也不会卡,简单理解就是把一个核跑满了

查看进程下的线程详情 top -H -p 18515

Java 服务器cup占用率过高 以及 内存泄漏排查方法_cup负载高_04

再按一下H ,可以查看的线程的id

Java 服务器cup占用率过高 以及 内存泄漏排查方法_cup负载高_05

线程 18515的 pid 转为 16 进制 printf "0x%x\n" 18515

Java 服务器cup占用率过高 以及 内存泄漏排查方法_JVM_06

根据16进制格式的线程ID查找线程堆栈信息

jstack pid |grep tid -A 50

可以看到第 7 行代码引起的,从源代码可以看到是 while(true) 引起的,简单说一下 grep 参数

  • grep -A n 显示匹配指定内容及之后的 n 行
  • grep -B n 显示匹配指定内容及之前的 n 行
  • grep -C n 显示匹配指定内容及其前后各 n 行

Java 服务器cup占用率过高 以及 内存泄漏排查方法_linux_07

输出整个进程的快照到文件 jstack 18515>> jstack.log

Java 服务器cup占用率过高 以及 内存泄漏排查方法_cup负载高_08

内存泄漏问题排查

1、查询gc情况(每1秒钟打印一次gc情况)

jstat -gcutil pid 1000

查询结果含义:
S0:幸存区1占用率
S1:幸存区2占用率
E:Eden区占用率
O:老年区占用率
M:元数据区(java8,相当于java7及之前的永久代的概念)使用大小
ccs:压缩后使用率
YGC:young gc 次数,
YGCT:young gc耗时
FGC:full gc次数
FGCT:full gc耗时
GCt:GC共耗时

2、查询进程信息

#查询占用内存的进程(shift+m排序)
top
#存活的对象占用内存前100排序
jmap -histo:live 41843 | head -n 100

3、查询进程里面详细信息

jmap -heap 41843

如果Jave类的内存异常则检查代码
如果发现频繁的gc是因为新生代、老年代、永久代分配的大小有问题,则可以通过修改设置解决

eg:

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:PermSize=64M  -XX:MaxPermSize=128M -XX:MaxTenuringThreshold=0

参数含义:

  • -Xmx3550m 堆最大容量(heap max size)
  • -Xms3550m 堆最小容量(heap min size)
  • -Xmn2g 年轻代大小
  • -Xss256k 每个线程栈容量大小(stack size)
  • -XX:NewRatio=4 年轻代(包括Eden和两个Survivor区)与年老代的比值(除去持久代),设置为4,则年轻代与年老代所占比值为1:4,年轻代占整个堆栈的1/5;
  • -XX:SurvivorRatio=4 年轻代中Eden区与Survivor区的大小比值,设置为4,则两个Survivor区与一个Eden区的比值为2:4,一个Survivor区占整个年轻代的1/6
  • -XX:PermSize=64M 初始分配的永生代容量
  • -XX:MaxPermSize=128M 永生代最大容量
  • -XX:MaxTenuringThreshold=0 设置垃圾最大年龄

-Xmn对系统性能影响较大,Sun官方推荐配置为整个堆的3/8;JVM内存大小=年轻代大小 + 年老代大小 + 持久代大小持久代一般固定大小为64m,所以增大年轻代后,将会减小年老代大小。

JDK5.0以后每个线程堆栈大小为1M,以前每个线程堆栈大小为256K。更具应用的线程所需内存大小进行调整。在相同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在3000~5000左右;

-XX:MaxTenuringThreshold如果设置为0的话,则年轻代对象不经过Survivor区,直接进入年老代。对于年老代比较多的应用,可以提高效率。如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象再年轻代的存活时间,增加在年轻代即被回收的概论。

使用jvisualvm进行排查

找到jdk的安装目录,再bin目录下有一个jvisualvm.exe,运行它即可

Java 服务器cup占用率过高 以及 内存泄漏排查方法_cup负载高_09

装入dump文件

Java 服务器cup占用率过高 以及 内存泄漏排查方法_内存泄漏_10

点击类,进行分析

Java 服务器cup占用率过高 以及 内存泄漏排查方法_JVM_11

可以查看各个类实例的个数,找到那个对象的实例比较多,占用内存较大

排查方法包括三步:

  1. 获取堆内存快照dump

1、通过jmap指定打印他的内存快照dump(Dump文件是进程的内存镜像。可以把程序的执行状态通过调试器保存到dump文件中)

Java 服务器cup占用率过高 以及 内存泄漏排查方法_内存泄漏_12


2、使用vm参数获取dump文件(可以指定生成dump文件的文件目录)

有的情况是内存溢出之后程序则会直接中断,而jmap只能打印在运行中的程序,所以建议通过参数的方式的生成dump文件

Java 服务器cup占用率过高 以及 内存泄漏排查方法_内存泄漏_13

  1. VisualVM去分析dump文件
  2. Java 服务器cup占用率过高 以及 内存泄漏排查方法_JVM_14

  3. 通过查看堆信息的情况,定位内存溢出问题
  4. Java 服务器cup占用率过高 以及 内存泄漏排查方法_cup负载高_15

网友评论