2019独角兽企业重金招聘Python工程师标准>>>

基本环境

  • tomcat 7
  • JDK 8
  • Linux

问题定位

查看后台异常

通过查看系统的后台日志,发现各个请求都正常,没有异常抛出。于是考虑系统状况

查看系统状况

top 命令查看CPU、内存等使用情况

[root@DEV-L002323 ~]# top
top - 14:52:54 up 514 days,  7:00,  8 users,  load average: 2.85, 1.35, 1.62
Tasks: 147 total,   1 running, 146 sleeping,   0 stopped,   0 zombie
Cpu(s): 57.6%us,  6.3%sy,  0.0%ni,  9.2%id, 26.2%wa,  0.0%hi,  0.0%si,  0.7%st
Mem:   3922928k total,  3794232k used,   128696k free,   403112k buffers
Swap:  4194296k total,    65388k used,  4128908k free,  1492204k cachedPID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                     6764 root      20   0 2428m 1.1g  11m S 190.0 28.3  36:38.55 java                                                                       1161 root      20   0     0    0    0 D  0.3  0.0  32:43.06 flush-253:0                                                                 1512 root      20   0 14684 4188  488 S  0.3  0.1   0:16.12 sec_agent                                                                   1 root      20   0 19356  652  436 S  0.0  0.0   0:16.64 init                                                                        2 root      20   0     0    0    0 S  0.0  0.0   0:00.05 kthreadd                                                                    3 root      RT   0     0    0    0 S  0.0  0.0   1:49.34 migration/0                                                                 4 root      20   0     0    0    0 S  0.0  0.0  17:46.61 ksoftirqd/0                                                                 5 root      RT   0     0    0    0 S  0.0  0.0   0:00.00 migration/0                                                                 6 root      RT   0     0    0    0 S  0.0  0.0   2:02.78 watchdog/0                                                                  7 root      RT   0     0    0    0 S  0.0  0.0   1:46.79 migration/1

从top命令的结果发现。pid为6764的java进程CPU利用持续占用过高,达到了190%。内存占用率为28.3%。

定位问题线程

使用ps -mp pid -o THREAD,tid,time命令查看该进程的线程情况,发现该进程的两个线程占用率很高

[root@DEV-L002323 ~]# ps -mp 6764 -o THREAD,tid,time
USER     %CPU PRI SCNT WCHAN  USER SYSTEM   TID     TIME
root     71.7   -    - -         -      -     - 00:36:52
root      0.0  19    - futex_    -      -  6764 00:00:00
root      0.0  19    - poll_s    -      -  6765 00:00:01
root     44.6  19    - futex_    -      -  6766 00:23:32
root     44.6  19    - futex_    -      -  6767 00:23:32
root      1.2  19    - futex_    -      -  6768 00:00:38
root      0.0  19    - futex_    -      -  6769 00:00:00
root      0.0  19    - futex_    -      -  6770 00:00:01
root      0.0  19    - futex_    -      -  6771 00:00:00

从上面可以看出6766和6767两个线程占用CPU大约有半个小时,每个线程的CPU利用率约为45%。接下来需要查看对应线程的问题堆栈 
下面就看看6766这个问题线程的堆栈

查看问题线程堆栈

将线程id转换为16进制

[root@DEV-L002323 ~]#  printf "%x\n" 6766
1a6e

jstack查看线程堆栈信息

jstack命令打印线程堆栈信息,命令格式:jstack pid |grep tid

[root@DEV-L002323 ~]# jstack 6764 | grep 1a6e
"GC task thread#0 (ParallelGC)" prio=10 tid=0x00007ffeb8016800 nid=0x1a6e runnable
"GC task thread#0 (ParallelGC)" prio=10 tid=0x00007ffeb8016800 nid=0x1a6e runnable
"GC task thread#1 (ParallelGC)" prio=10 tid=0x00007ffeb8016800 nid=0x1a6e runnable
"VM Periodic Task Thread" prio=10 tid=0x00007ffeb8016800 nid=0x3700 waiting on condition JNI global references: 496

从上面可以看书,这些都是GC的线程。那么可以推断,很有可能就是内存不够导致GC不断执行。接下来我们就需要查看 
gc 内存的情况

jstat查看进程内存状况

命令: jstat -gcutil

[root@DEV-L002323 bin]# jstat -gcutil 6764 2000 10S0     S1     E      O      P     YGC     YGCT    FGC    FGCT     GCT   0.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.7260.00   0.00  100.00 100.00  97.74   1863   33.937   310  453.788  487.726

可以看出内存的年轻代和年老带的利用率都达到了惊人的100%。FGC的次数也特别多,并且在不断飙升。可以推断出 
程序肯定是在哪里的实现有问题,需要重点查看大对象或者异常多的对象信息。此时可以生成headdump文件拿到本地来分析

jstack 和 jmap 分析进程堆栈和内存状况

使用jmap命令导出heapdump文件,然后拿到本地使用jvisualvm.exe分析。

命令: jmap [option] vmid 
jmap -dump:format=b,file=dump.bin 6764

命令: jstack [option] vmid 
jstack -l 6764 >> jstack.out

从heapdump文件中定位到程序中的工作现场,和内存状况,如下: 
线程:

"Thread-21" daemon prio=5 tid=85 WAITINGat java.lang.Object.wait(Native Method)at java.lang.Object.wait(Object.java:503)at net.sf.jasperreports.engine.fill.AbstractThreadSubreportRunner.waitResult(AbstractThreadSubreportRunner.java:81)Local Variable: net.sf.jasperreports.engine.fill.ThreadExecutorSubreportRunner#2at net.sf.jasperreports.engine.fill.AbstractThreadSubreportRunner.start(AbstractThreadSubreportRunner.java:53)at net.sf.jasperreports.engine.fill.JRFillSubreport.prepare(JRFillSubreport.java:758)at net.sf.jasperreports.engine.fill.JRFillElementContainer.prepareElements(JRFillElementContainer.java:331)Local Variable: net.sf.jasperreports.engine.fill.JRFillSubreport#3at net.sf.jasperreports.engine.fill.JRFillBand.fill(JRFillBand.java:384)at net.sf.jasperreports.engine.fill.JRFillBand.fill(JRFillBand.java:358)at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillBandNoOverflow(JRVerticalFiller.java:458)Local Variable: net.sf.jasperreports.engine.fill.JRFillBand#3at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillPageHeader(JRVerticalFiller.java:421)at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillPageBreak(JRVerticalFiller.java:1954)at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillColumnBreak(JRVerticalFiller.java:1981)at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillDetail(JRVerticalFiller.java:754)Local Variable: net.sf.jasperreports.engine.fill.JRFillBand[]#1Local Variable: net.sf.jasperreports.engine.fill.JRFillBand#2at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillReportStart(JRVerticalFiller.java:288)at net.sf.jasperreports.engine.fill.JRVerticalFiller.fillReport(JRVerticalFiller.java:151)at net.sf.jasperreports.engine.fill.JRBaseFiller.fill(JRBaseFiller.java:939)at net.sf.jasperreports.engine.fill.JRFiller.fill(JRFiller.java:152)Local Variable: net.sf.jasperreports.engine.util.LocalJasperReportsContext#1Local Variable: net.sf.jasperreports.engine.fill.JRVerticalFiller#1at net.sf.jasperreports.engine.JasperFillManager.fill(JasperFillManager.java:464)at net.sf.jasperreports.engine.JasperFillManager.fill(JasperFillManager.java:300)Local Variable: java.io.File#135Local Variable: net.sf.jasperreports.engine.JasperFillManager#1Local Variable: net.sf.jasperreports.engine.JasperReport#1at net.sf.jasperreports.engine.JasperFillManager.fillReport(JasperFillManager.java:757)at com.pingan.icore.print.asyntask.jasper.AysnJasPdfConvertorThread.fill(AysnJasPdfConvertorThread.java:110)Local Variable: java.lang.String#57815Local Variable: java.lang.String#55498Local Variable: java.util.HashMap#1682Local Variable: java.lang.String#57807Local Variable: java.lang.String#57809at com.pingan.icore.print.asyntask.jasper.AysnJasPdfConvertorThread.run(AysnJasPdfConvertorThread.java:223)Local Variable: java.io.File#139Local Variable: java.io.File#138Local Variable: java.io.File#137Local Variable: java.io.File#136Local Variable: com.pingan.icore.print.asyntask.jasper.AysnJasPdfConvertorThread#1at java.lang.Thread.run(Thread.java:722)

内存: 
发现这个net.sf.jasperreports.engine.fill.JRTemplatePrintText类的实例特别多,实例占了33.2%,大小占了58.1%

结论

到这里可以判断出是JasperReport在转换时对对象的创建和使用不当造成的。然而解决该问题并没有什么特别好的方式,除非去改源码或者换一个报表工具 
根据上面的情况google了下别人是否遇到过类似的问题,然后定位到如下两个网址: 
- http://community.jaspersoft.com/jasperreports-library/issues/4151 
- http://community.jaspersoft.com/wiki/isprintwhendetailoverflowstrue-can-cause-report-render-indefinitely

可以看出新版的jasperreports依然会有该问题。只能通过取消勾选 ‘Print When Detail Overflows’的选项来避免该问题 
同时使jasperreport的virtualizer(Virtualizes data to the filesystem. When this object is finalized, it removes the swap files it makes. The virtualized objects have references to this object, so finalization does not occur until this object and the objects using it are only weakly referenced.) 
来优化jasperreport的内存使用,减轻症状。 
下面给出个使用demo: 
- http://www.massapi.com/source/sourceforge/17/71/1771543975/oreports-code/openreports/src/org/efs/openreports/util/ScheduledReportJob.java.html#158

问题解决并不算完美。

1、ps -mp xxxx -o THREAD在当前用户下,列出pid包含的所有线程。2、ps -mp xxxx -o THREAD  >> /tmp/thread.txt在当前用户下,列出pid包含的所有线程。并把结果增量 输出到文件/tmp/thread.txt。3、ps -mp xxxx -o THREAD,tid在当前用户下,列出pid包含的所有线程信息及本地线程ID (tid)。4、ps -mp xxxx -o THREAD |wc -l在当前用户下,列出pid包含的所有线程的个数 。“wc -l”是统计记录的行数。

转载于:https://my.oschina.net/LucasZhu/blog/1801796

CPU占用过高问题排查相关推荐

  1. 性能优化-CPU占用过高问题排查

    1. 性能优化是什么? 1.1 性能优化就是发挥机器本来的性能 1.2 性能瓶颈在哪里,木桶效应. CPU占用过高 1.现象重现 CPU占用过高一般情况是代码中出现了循环调用,最容易出现的情况有几种: ...

  2. jprofiler分析dump文件_内存溢出+CPU占用过高:问题排查+解决方案+复盘(超详细分析教程)...

    点击上方 "Java指南者"关注, 星标或置顶一起成长 免费送 1024GB 精品学习资源 来源:https://zhanghan.blog.csdn.net/article/de ...

  3. 内存溢出+CPU占用过高:问题排查+解决方案+复盘(超详细分析教程)

    前言 最近刚上线了一款社交项目,运行十多天后(运营持续每天推量),发现问题: 系统OOM(资源不能被释放)导致服务器频繁且长时间FGC导致服务器CPU持续飚高 日志中内存溢出:java.lang.Ou ...

  4. 线上java程序CPU占用过高问题排查

    简要 工作中负责的有一个项目是使用iReport+JasperReport实现的一个打印系统.最近这个线上程序经常无响应,重启后恢复正常,但是时不时还是会出现类似的问题. 最后发现是JasperRep ...

  5. linux poll cpu过高,CPU占用过高问题排查

    前几天发现测试环境的CPU一直很高,于是就去排查了一下原因,之前在程序管理里面介绍过,可以通过top命令查看linux系统进程的资源占用.于是运行top命令如下: top 从上图中可以看到其中有一个线 ...

  6. Java应用CPU占用过高问题排查

    文章目录 问题描述 问题分析 如果你的 Java 应用把 CPU 100% 打满,该怎么办呢? 下面就结合实际情况来说明,对于 Java 应用,CPU 消耗过高的时,该如何处理? CPU 消耗过高分析 ...

  7. CPU占用较高及CPU占用不高但无响应问题排查小记

    CPU占用不高但交易无响应排查 使用top -c 查看CPU使用情况 发现cpu占用不高,继续排查 使用jstack 应用进程号查看日志 发现ThreadA.ThreadB互相等待对方释放锁资源导致了 ...

  8. Java代码-CPU占用过高排查思路

    Java代码-CPU占用过高排查思路: 1.top 查看占用cpu过高的进程PID 2.top -Hbp 32048|awk '/java/ && $9>50'  查看进程中占用 ...

  9. java 一次CPU占用过高问题的排查及解决,java基础面试笔试题

    我总结出了很多互联网公司的面试题及答案,并整理成了文档,以及各种学习的进阶学习资料,免费分享给大家. 扫描二维码或搜索下图红色VX号,加VX好友,拉你进[程序员面试学习交流群]免费领取.也欢迎各位一起 ...

最新文章

  1. CocoaPods (第三方资源管理框架)
  2. C++中运算符重载需要遵循的规则
  3. centos6重启网络命令_虚拟机-linux系统中图形界面和命令行界面切换
  4. Ehcache配置参数详解
  5. SAP S4HANA MRP LIVE
  6. 如何用TensorFlow在安卓设备上实现深度学习推断
  7. win7配置远程连接oracle数据库吗,win7环境下配置oracle数据库的方法有哪些?
  8. 【Python】精选23个Pandas常用函数
  9. C语言在二进制搜索树中查找键的successor and predecessor后继和前任(附完整源码)
  10. python做前端可视化_Python数据可视化的四种简易方法
  11. java scanner类 构造器_java – 不能使用Scanner类,构造函数未定义,方法未定义
  12. 【codevs1068】乌龟棋noip10年TG----第二个A掉的钻石题
  13. 【数据结构算法】二:上三角、下三角中求数组地址--【下标的计算】
  14. SELinux系列(九)——SELinux auditd日志系统的安装与启动
  15. 活灵活现用 Git --技巧篇
  16. 产生式系统——动物识别系统
  17. 电驴搜索服务器正在连接,电驴 电驴连接不上服务器-完美教程资讯
  18. JavaScript逆向:金某xx网站登陆指纹算法分析
  19. 计算机用户帐号 MAC地址怎么查,mac地址怎么查
  20. 黎明回港避谈婚事 被曝宴请好友庆祝新婚(附图)

热门文章

  1. ps怎么清屏_刷屏了的黑洞照片,居然是3分钟PS出来的!
  2. mac自带计算器 进制转换
  3. 微信小程序、uni-app使用iconfont-tools将iconfont彩色字体图标组件化并使用
  4. web工程的读书笔记
  5. KeyError(‘metric mAP is not supported‘.format(metric))
  6. 什么是CRM、ERP、BPM?
  7. 【C++算法模板】日期类型题目:节假日
  8. 也谈智能手机游戏开发中的分辨率自适应问题
  9. 《设计模式的艺术》读书笔记
  10. PotPlayer视频播放器使用技巧