转载请注明出处:

http://www.javashuo.com/article/p-oepqcugy-dq.html

一、邮箱收到一堆监控,报警内空大致如下,很明显是CPU不够用了,IO也有点问题:主机: bwebser2__10.253.5.198 时间: 2015.11.15 15:25:17状态: PROBLEM 级别: Warning报警原因: Processor load is too high on bwebser2内容: Processor load (1 min average per core):value=52.53原始事件ID: 30605主机: bwebser2__10.253.5.198时间: 2015.11.18 15:42:23 状态: PROBLEM级别: Warning 报警原因: Disk I/O is overloaded on bwebser2 内容: CPU iowait time:value=68.7 %原始事件ID: 30812

二、用top查看进程,发现有近2000个进程

[root@bwebser2 ~]# top

top - 10:00:32 up 184 days, 19:55, 2 users, load average: 49.39, 52.06, 53.04

Tasks: 1826 total, 1 running, 1825 sleeping, 0 stopped, 0 zombie

Cpu(s): 22.5%us, 3.8%sy, 0.0%ni, 31.7%id, 41.3%wa, 0.7%hi, 0.0%si, 0.0%st

Mem: 8058056k total, 7631808k used, 426248k free, 718780k buffers

Swap: 0k total, 0k used, 0k free, 358720k cached

三、猜测可能和sendmail有关,查maillog日志,一直报警:No space left on device

[root@bwebser2 ~]# tail -f /var/log/maillog

Nov 19 10:12:15 bwebser2 postfix/postdrop[19470]: warning: mail_queue_enter: create file maildrop/878633.19470: No space left on device

Nov 19 10:12:15 bwebser2 postfix/postdrop[27287]: warning: mail_queue_enter: create file maildrop/900082.27287: No space left on device

Nov 19 10:12:15 bwebser2 postfix/postdrop[12347]: warning: mail_queue_enter: create file maildrop/919377.12347: No space left on device

Nov 19 10:12:15 bwebser2 postfix/postdrop[21222]: warning: mail_queue_enter: create file maildrop/937001.21222: No space left on device

Nov 19 10:12:16 bwebser2 postfix/postdrop[25028]: warning: mail_queue_enter: create file maildrop/956095.25028: No space left on device

Nov 19 10:12:16 bwebser2 postfix/postdrop[28123]: warning: mail_queue_enter: create file maildrop/980022.28123: No space left on device

Nov 19 10:12:16 bwebser2 postfix/postdrop[26680]: warning: mail_queue_enter: create file maildrop/999360.26680: No space left on device

四、用lsof确定sendmail、postdrop进程数量,进程数达到2000多个,为什么有这么多呢?

[root@bwebser2 ~]# lsof |grep sendmail |wc -l

24682

[root@bwebser2 ~]# lsof |grep postdrop |wc -l

24108

五、查看文件索引节点inode,发现空间满了:

[root@bwebser2 log]# df -i

Filesystem Inodes IUsed IFree IUse% Mounted on

/dev/xvda1 1310720 1310720 0 100% /

tmpfs 1007257 1 1007256 1% /dev/shm

/dev/xvdb1 13107200 6142 13101058 1% /u01

用df -Th命令:

root@cwebser3 statistics]# df -Th

Filesystem Type Size Used Avail Use% Mounted on

/dev/xvda1 ext4 20G 4.1G 15G 22% /

tmpfs tmpfs 3.9G 0 3.9G 0% /dev/shm

/dev/xvdb1 ext3 197G 18G 170G 10% /u01

六、通过清除zookeeper监控日志把腾出根的空间

cd /home/zookeeper/monitor

[root@bwebser2 monitor]# ll

total 8

drwxrwxr-x 163 zookeeper zookeeper 4096 Nov 12 00:16 charts

drwxrwxr-x 167 zookeeper zookeeper 4096 Nov 18 17:31 statistics

[root@bwebser2 monitor]# cd charts

rm -rf *

[root@bwebser2 monitor]# cd ../statistics/

[root@bwebser2 statistics]# rm -rf 201506*

[root@bwebser2 statistics]# rm -rf 201507*

[root@bwebser2 statistics]# rm -rf 201508*

[root@bwebser2 statistics]# rm -rf 201509*

[root@bwebser2 statistics]# rm -rf 201510*

七、杀死所有sendmail和postdrop进程后

[root@bwebser2 ~]#ps -ef|grep sendmail | grep -v grep | awk '{print "kill -9 " $2}' |sh

[root@bwebser2 ~]#ps -ef|grep postdrop | grep -v grep | awk '{print "kill -9 " $2}' |sh

八、lsof查看,进程数为0

[root@bwebser2 ~]# lsof |grep sendmail |wc -l

0

[root@bwebser2 ~]# lsof |grep postdrop |wc -l

0

九、被忽略的/etc/cron.d下的sysstat,修改sysstat,操作如下:

[root@bwebser2 cron.d]#cd /etc/cron.d/

[root@bwebser2 cron.d]# ll

total 12

-rw-r--r--. 1 root root 113 Nov 23 2013 0hourly

-rw-r--r--. 1 root root 108 Apr 7 2014 raid-check

-rw-r--r--. 1 root root 235 Nov 23 2013 sysstat

vi sysstat添加&>/dev/null

# run system activity accounting tool every 10 minutes

*/10 * * * * root /usr/lib/sa/sa1 1 1 &>/dev/null

# generate a daily summary of process accounting at 23:53

53 23 * * * root /usr/lib/sa/sa2 -A &>/dev/null

十、再次用top命令查看进程只有100多个,监控报警消失,问题搞定!

[root@bwebser2 cron.d]# service sendmail restart

sendmail: unrecognized service

[root@cwebser3 cron.d]# top

top - 10:43:12 up 184 days, 20:37, 2 users, load average: 1.03, 1.54, 14.15

Tasks: 105 total, 1 running, 104 sleeping, 0 stopped, 0 zombie

Cpu(s): 43.4%us, 1.3%sy, 0.0%ni, 47.9%id, 7.0%wa, 0.3%hi, 0.0%si, 0.0%st

Mem: 8058056k total, 6762996k used, 1295060k free, 1422060k buffers

Swap: 0k total, 0k used, 0k free, 381392k cached

cpu满了卡住 linux_Linux进程多导致CPU卡死的问题相关推荐

  1. cpu满了卡住 linux_Linux系统中CPU占用率较高问题排查思路与解决方法

    前言 作为 Linux 运维工程师,在日常工作中我们会遇到 Linux服务器上出现CPU负载达到100%居高不下的情况,如果CPU 持续跑高,则会影响业务系统的正常运行,带来企业损失. 很多运维的同学 ...

  2. java程序cpu突然飚高_Java 定位导致CPU飙升的代码过程

    线上的一个日志实时输出的程序曾经出过这样一个问题,刚开始上线java程序占用的CPU的资源很少,但是到了整点的时候,CPU直线飙高,直接到达100%根本没有要下降的趋势,唯一的方法只能杀掉它了,后面在 ...

  3. linux 运行选择哪个cpu核,判断Linux进程在哪个CPU核运行的方法

    问题:有一个Linux进程运行在多核处理器系统上,如何查看该进程运行在哪个CPU上? 方法一: ps 命令可以告诉你每个进程/线程目前分配到的(在"PSR"列)CPU ID. ps ...

  4. 设置iis网页服务器cpu占比,asp.net-如何防止由于iis中的工作进程而导致CPU使用率100%...

    诊断中 在诊断导致应用程序池出现问题的方面,您可以: 选择服务器 转到IIS>工作进程 这应该弹出一个这样的菜单,以便您可以确定哪个App Pool正在运行. 您可以从那里简单地重新启动应用程序 ...

  5. Linux进程多导致CPU卡死的问题

    转载请注明出处:http://blog.csdn.net/guoyjoe/article/details/49924557 一.邮箱收到一堆监控,报警内空大致如下,很明显是CPU不够用了,IO也有点问 ...

  6. 操作系统系列笔记(四) - 进程,线程及CPU调度

    进程和线程 进程 进程是指一个具有一定独立功能的程序在一个数据集合上的一次动态执行过程 进程包含了正在运行的一个程序的所有状态信息, 代码, 数据, 状态寄存器, 通用寄存器, 进程占用系统资源等 进 ...

  7. json.tojsonstring 导致cpu飙高_阿里调试神器立功了!进程导致Kubernetes节点CPU飙高的排查与解决...

    来源:https://www.cnblogs.com/maxzhang1985/p/12673160.html 一.发现问题 在一次系统上线后,我们发现某几个节点在长时间运行后会出现CPU持续飙升的问 ...

  8. java进程cpu使用率高_什么会导致Java应用程序的CPU使用率飙升?

    问题 无限循环的while会导致CPU使用率飙升吗? 经常使用Young GC会导致CPU占用率飙升吗? 具有大量线程的应用程序的CPU使用率是否较高? CPU使用率高的应用程序的线程数是多少? 处于 ...

  9. 阿里云被挖矿使用,导致cpu长期处于100%,ddgs进程,xWx3T进程,关于redis密码

    1.使用top命令,查看到一个叫xWx3T的进程cpu占用99.8%,由于我的阿里云是单核的,所以最高只能100%. 把它用kill命令杀死后,过一会儿又启动了,又占用100%. 使用ps -ef可以 ...

最新文章

  1. PL/SQL中查询Oracle大数(17位以上)时显示科学计数法的解决方法
  2. 百度数据可视化图表套件echart实战
  3. NIFI工作流备份和恢复
  4. Linux编译dhcpd,linux中搭建dhcpd服务器
  5. 第一次接触终极事务处理——Hekaton
  6. 解读I2C协议和读写流程
  7. chemdraw怎么画拐弯的箭头_教你画系列,像金属一样有复杂反光的漆皮材质
  8. android平板电脑 刷机工具,安卓平板电脑刷机教程之一键刷机.pdf
  9. luarocks - 介绍
  10. 液晶取字模工具linux,晓奇液晶汉字取模软件下载
  11. Jmeter压力测试实验 (软件测试实验报告)
  12. 微信小程序 数据库获取字符串 在view中显示换行
  13. CAML: FAST CONTEXT ADAPTATION VIA META-LEARNING
  14. 计算机电源故障维修方法,atx电源维修方法 atx电源常见故障【详细介绍】
  15. 所有域名都需要实名认证吗?域名实名认证有什么好处?
  16. 华为路由器 上网慢 延迟高 解决方法
  17. JS获取特殊字符前面的字符串
  18. JSP动态网页技术基本知识点总结
  19. 嵌入式Linux--Lichee Pi Zero原理图分析
  20. ctfshow 摆烂杯web wp

热门文章

  1. 如何在网上个人办理数码照片回执
  2. HIT-SC 正则表达式(JAVA)
  3. 军事领域即将进入自主化时代——对美军《自主性》研究报告的分析与解读
  4. oracle取最小值怎么写,【Oracle】oracle取最大值和最小值的几个方法汇总
  5. vue 下拉框加图标
  6. TransactionScope
  7. mysql-MGR集群
  8. 万能程序员时代来临!
  9. PDF文件怎么编辑,如何删除PDF页眉页脚
  10. 费洪荒之力解决部署Java项目遇到的Hibernate奇葩状