问题描述: 最近已经有两个项目因为日志打印问题而引发了故障,可以说是血的教训了。两次故障的原因也是非常的相似,都是由于其他业务系统调用了另外一个老系统的接口,但是由
问题描述:
最近已经有两个项目因为日志打印问题而引发了故障,可以说是血的教训了。两次故障的原因也是非常的相似,都是由于其他业务系统调用了另外一个老系统的接口,但是由于传递的参数不正确,而老系统会因为参数不正确而打印日志。当错误的请求量增大,打印日志会造成当前线程阻塞,容易使机器机器负载升高,产生性能问题
排查方法:
1. 直接查看机器上日志大小
2. 还可以通过Jstack查看 占用cpu最多的线程,多查看几次,如果每次都是打印日志的线程,那基本上也可以确定是打印日志的问题
解决方案:
1. 提前校验参数,如果参数有问题应该抛出异常
2. 在logback的AsyncAppender中配置<neverBlock>true</neverBlock> 避免业务线程的阻塞
<!-- 异步输出 --> <appender name ="STDOUT_ASYNC" class= "ch.qos.logback.classic.AsyncAppender"> <discardingThreshold >0</discardingThreshold> <queueSize>512</queueSize> <includeCallerData>false</includeCallerData> <neverBlock>true</neverBlock> <appender-ref ref ="stdout"/> </appender>
Logback的neverBlock原理:
由于logback相当于是生产者-消费者模式,当时我们在系统中ogger.info()或者ogger.error()时,是把日志信息加入到logback的队列中,默认是调用队列的put方法,而当队列满了之后,就会阻塞当前的线程。而设置了neverBlock后,则会调用offer方法,如果队列满了,则丢弃。可以查看源码: