原文链接:http://www.jianshu.com/p/e96c74133be6

一大早刚来到公司工位上,电话响起来了,一看是运维老湿打过来到,紧张的接起电话,小心脏扑通扑通跳。“小路啊,你有个服务CPU飙到99%,现场给你保留了,赶紧看看吧!”挂了电话一看短信,果然有告警过来了!还好服务没有重启,现场保留了,赶紧上到服务器上看看。看到是一个用户评分的服务,六台机器的其中一台CPU飙升,下面介绍一下问题排查的过程和解决方法。

一、查看导致CPU飙升的线程
首先需要定位到是服务里的那些线程导致CPU飙升的。具体查找方法:
1、在服务器上通过jps -l可以查到服务的进程号。

2、查到对应的进程号,通过top -H -p $pid,可以看到具体是哪个线程占用了CPU,记下该线程的id。

二、查看对应线程的java堆栈信息
根据找到的线程,可以去查看对应的java堆栈信息,来进一步定位是哪一段代码出现了问题。
通过jstack -l $pid可以查看java进程的堆栈信息,这里的pid是进程号。
在堆栈信息中nid指的就是线程id,但是这里的线程id是16进制,我们之前获取的线程id是10进制的,需要转换一下,比如我查到线程id是14533,转换后是38c5,所以在jstack -l结果中查看38c5这个线程。

去代码里一看原因其实很简单,多线程环境下使用了非线程安全HashMap,导致了这个问题,但是使用HashMap怎么会跑满CPU呢?去查了一下才知道,HashMap在多线程环境下reHash时,可能会导致死循环,具体的分析这里就不再展开了,想了解的同学可以看下这个博客:HashMap 死循环分析。
解决的方法也很简单,将原来非线程安全的HashMap替换成线程安全的ConcurrentHashMap就行了。
解决后发布,并将错误原因和修复结果反馈给运维老湿,老湿夸奖了我的响应迅速~
这个错误告诉我,不要用主观的猜测去多线程环境下代码的工作方式,只要是多线程,一定要使用线程安全的类。

Java服务CPU飙到99%问题排查相关推荐

  1. 面试官:线上服务CPU飙高怎么排查?

    用jstack排查 先执行top,找到CPU占用比较高的进程 jstack 进程id > show.txt 找到进程中CPU占用比较高的线程,线程id转为16进制 到show.txt文件中根据线 ...

  2. java进程CPU飙高

    早上某段时间突然看到看到一台生产机器上的CPU飙高 top 然后就请出了大神工具JVM 具体JVM的介绍看:http://www.cnblogs.com/smail-bao/p/6027756.htm ...

  3. Java服务CPU高如何定位解决

    原生系统命令排查的方法 分别分享下Linux和Windows系统下的排查方法 首先是Linux系统下 如果不借助工具,使用Linux和jdk自带命令的话,步骤是这样的: top命令查出占用最高的进程: ...

  4. java应用cpu使用率过高问题排查

    ---------------------------------------linux下如何定位代码问题------------------------------- 1.先通过top命令找到消耗c ...

  5. Java应用CPU占用过高问题排查

    文章目录 问题描述 问题分析 如果你的 Java 应用把 CPU 100% 打满,该怎么办呢? 下面就结合实际情况来说明,对于 Java 应用,CPU 消耗过高的时,该如何处理? CPU 消耗过高分析 ...

  6. 线上java程序CPU占用过高问题排查

    简要 工作中负责的有一个项目是使用iReport+JasperReport实现的一个打印系统.最近这个线上程序经常无响应,重启后恢复正常,但是时不时还是会出现类似的问题. 最后发现是JasperRep ...

  7. 简单排查java应用CPU飙高的线程问题

    原文地址:https://www.cnblogs.com/zyhxhx/p/4564953.html 1. 获取要查看的进程的ID ps aux | grep xxx 2. 查看此进程下的线程信息 t ...

  8. java单核cpu飙高考死_java多线程在单核CPU上,还是需要volatile synchronized吗?

    本来不想回答的,可是看了这么多答案,有的不是特别靠谱.斗胆写个粗略的回答. 首先,JMM是不区分是否JVM到底是运行在单核处理器.单核超线程处理器.多核处理器,抑或是多核超线程处理器上的.就是说,Ja ...

  9. 你要偷偷学会排查线上 CPU 飙高的问题,然后惊艳所有人!

    作者 l Hollis 来源 l Hollis(ID:hollischuang) 前段时间我们新上了一个新的应用,因为流量一直不大,集群QPS大概只有5左右,写接口的rt在30ms左右. 因为最近接入 ...

最新文章

  1. Http权威指南学习研究
  2. Spark官方文档——本地编写并运行scala程序
  3. Spring MVC-08循序渐进之国际化(AcceptHeaderLocaleResolver)
  4. 二分算法php,PHP练习-二分查找算法
  5. JS -- Unexpected trailing comma
  6. Myeclipse 2014配置SVN详细图解
  7. LeetCode DD-2020006. 简单游戏(前缀和)
  8. 视觉、语音、NLP、ML、AI安全,一家金融科技公司等你来
  9. python设计模式5-原型模式
  10. Ubuntu更改右键菜单
  11. Illustrator 教程,如何在 Illustrator 中对矢量图进行变形、定形和塑形?
  12. 灯具类产品各国EMC认证标准大全
  13. 如何区分固态硬盘和机械硬盘
  14. 美团CAT客户端(windows版)接入指南
  15. css3 特效 加1加2,Bootstrap轮播加上css3动画,炫酷到底!
  16. JavaScript 25 岁了!
  17. vue项目你一定会用到的性能优化!
  18. jsp+ssm计算机毕业设计短视频文案创作平台系统【附源码】
  19. 前端学习记录005_canvas绘制钟表
  20. Launcher 的启动

热门文章

  1. java i o中文版_Java文件I/O的三种方法
  2. unity 模型渐变消失_Unity 雨水滴到屏幕效果
  3. python 特性和方法同名_Python类:方法与属性同名
  4. mac中打开nginx位置
  5. VTK读取序列化图像
  6. 11.14/11.15 Apache和PHP结合 11.16/11.17 Apache默认虚拟主机
  7. GlusterFS架构与维护
  8. 深度学习笔记之使用Faster-Rcnn进行目标检测 (原理篇)
  9. 【C++专题】static_cast, dynamic_cast, const_cast探讨
  10. UIView的生命周期