在测试基于 DirectFB+Gstreamer 的视频联播系统的一个 Demo 的时候,其中大量使用 system 调用的语句,例如在 menu 代码中的 system("./play") ,而且多次执行,这种情况下,在 ps -ef 列表中出现了大量的 defunct 进程,对程序的运行时有害的。按说system的源码中应该已经包含了wait,但也不能排除开发板上这个版本的system中可能没有wait,总之,开发板上在调用system后添加wait之后,defunct进程不复存在了。

下面谈谈 defunct 进程,中文翻译叫僵尸进程。下文整理于网络以及APUE一书。

一、什么是僵尸进程

在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,那么他将变成一个僵尸进程。当用ps命令观察进程的执行状态时,看到这些进程的状态栏为defunct。僵尸进程是一个早已死亡的进程,但在进程表(processs table)中仍占了一个位置(slot)。

但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程。因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,看看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由Init进程来接管他,成为他的父进程,从而保证每个进程都会有一个父进程。而Init进程会自动wait其子进程,因此被Init接管的所有进程都不会变成僵尸进程。

二、UNIX下进程的运作方式

每个Unix进程在进程表里都有一个进入点(entry),核心进程执行该进程时使用到的一切信息都存储在进入点。当用 ps 命令察看系统中的进程信息时,看到的就是进程表中的相关数据。当以fork()系统调用建立一个新的进程后,核心进程就会在进程表中给这个新进程分配一个进入点,然后将相关信息存储在该进入点所对应的进程表内。这些信息中有一项是其父进程的识别码。

子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程到底什么时候结束。那么会不会因为父进程太忙来不及 wait 子进程,或者说不知道子进程什么时候结束,而丢失子进程结束时的状态信息呢?

不会。因为UNIX提供了一种机制可以保证,只要父进程想知道子进程结束时的状态信息,就可以得到。这种机制就是:当子进程走完了自己的生命周期后,它会执行exit()系统调用,内核释放该进程所有的资源,包括打开的文件,占用的内存等。但是仍然为其保留一定的信息(包括进程号the process ID,退出码exit code,退出状态the terminationstatus of the process,运行时间the amount of CPU time taken by the process等),这些数据会一直保留到系统将它传递给它的父进程为止,直到父进程通过wait / waitpid来取时才释放。

也就是说,当一个进程死亡时,它并不是完全的消失了。进程终止,它不再运行,但是还有一些残留的数据等待父进程收回。当父进程 fork() 一个子进程后,它必须用 wait() (或者 waitpid())等待子进程退出。正是这个 wait() 动作来让子进程的残留数据消失。

三、僵尸进程的危害

如果父进程不调用wait / waitpid的话,那么保留的那段信息就不会释放,其进程号就会一直被占用,但是系统的进程表容量是有限的,所能使用的进程号也是有限的,如果大量的产生僵尸进程,将因为没有可用的进程号而导致系统不能产生新的进程。

所以,defunct进程不仅占用系统的内存资源,影响系统的性能,而且如果其数目太多,还会导致系统瘫痪。而且,由于调度程序无法选中Defunct 进程,所以不能用kill命令删除Defunct 进程,惟一的方法只有重启系统。

四、僵尸进程的产生

如果子进程死亡时父进程没有 wait(),通常用 ps 可以看到它被显示为“<defunct>”,这样就产生了僵尸进程。它将永远保持这样直到父进程 wait()。

由此可见,defunct进程的出现时间是在子进程终止后,但是父进程尚未读取这些数据之前。利用这一点我们可以用下面的程序建立一个defunct 进程:

C代码  

  1. #include <stdio.h>
  2. #include<sys/types.h>
  3. main()
  4. {
  5. if(!fork())
  6. {
  7. printf(“child pid=%d\n”, getpid());
  8. exit(0);
  9. }
  10. sleep(20);
  11. printf(“parent pid=%d \n”, getpid());
  12. exit(0);
  13. }

当上述程序以后台的方式执行时,第17行强迫程序睡眠20秒,让用户有时间输入ps -e指令,观察进程的状态,我们看到进程表中出现了defunct进程。当父进程执行终止后,再用ps -e命令观察时,我们会发现defunct进程也随之消失。这是因为父进程终止后,init 进程会接管父进程留下的这些“孤儿进程”(orphan process),而这些“孤儿进程”执行完后,它在进程表中的进入点将被删除。如果一个程序设计上有缺陷,就可能导致某个进程的父进程一直处于睡眠状态或是陷入死循环,父进程没有wait子进程,也没有终止以使Init接管,该子进程执行结束后就变成了defunct进程,这个defunct 进程可能会一直留在系统中直到系统重新启动。

在看一个产生僵尸进程的例子。

子进程要执行的程序test_prog

C代码  

  1. //test.c
  2. #include <stdio.h>
  3. int main()
  4. {
  5. int i = 0;
  6. for (i = 0 ; i < 10; i++)
  7. {
  8. printf ("child time %d\n", i+1);
  9. sleep (1);
  10. }
  11. return 0;
  12. }

父进程father的代码father.c

C代码  

  1. #include <stdio.h>
  2. #include <unistd.h>
  3. #include <sys/types.h>
  4. #include <sys/wait.h>
  5. int main()
  6. {
  7. int pid = fork ();
  8. if (pid == 0)
  9. {
  10. system ("./test_prog");
  11. _exit (0);
  12. }else
  13. {
  14. int i = 0;
  15. /*
  16. int status = 0;
  17. while (!waitpid(pid, &status, WNOHANG))
  18. {
  19. printf ("father waiting%d\n", ++i);
  20. sleep (1);
  21. }*/
  22. while (1)
  23. {
  24. printf ("father waiting over%d\n", ++i);
  25. sleep (1);
  26. }
  27. return 0;
  28. }
  29. }

执行./father,当子进程退出后,由于父进程没有对它的退出进行关注,会出现僵尸进程

C代码  

  1. 20786 pts/0    00:00:00 father
  2. 20787 pts/0    00:00:00 father <defunct>

总结:子进程成为 defunct 直到父进程 wait(),除非父进程忽略了 SIGCLD 。更进一步,父进程没有 wait() 就消亡(仍假设父进程没有忽略 SIGCLD )的子进程(活动的或者 defunct)成为 init 的子进程,init 着手处理它们。

五、如何避免僵尸进程

1、父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。

在上个例子中,如果我们略作修改,在第8行sleep()系统调用前执行wait()或waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

2. 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler。在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。

3. 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,并不再给父进程发送信号

4. fork两次,父进程fork一个子进程,然后继续工作,子进程fork一个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收还要自己做。 下面就是Stevens给的采用两次folk避免僵尸进程的示例:

C代码  

  1. #include "apue.h"
  2. #include <sys/wait.h>
  3. int
  4. main(void)
  5. ...{
  6. pid_t    pid;
  7. if ((pid = fork()) < 0) ...{
  8. err_sys("fork error");
  9. } else if (pid == 0) ...{     /**//* first child */
  10. if ((pid = fork()) < 0)
  11. err_sys("fork error");
  12. else if (pid > 0)
  13. exit(0);    /**//* parent from second fork == first child */
  14. /**//*
  15. * We're the second child; our parent becomes init as soon
  16. * as our real parent calls exit() in the statement above.
  17. * Here's where we'd continue executing, knowing that when
  18. * we're done, init will reap our status.
  19. */
  20. sleep(2);
  21. printf("second child, parent pid = %d ", getppid());
  22. exit(0);
  23. }
  24. if (waitpid(pid, NULL, 0) != pid)  /**//* wait for first child */
  25. err_sys("waitpid error");
  26. /**//*
  27. * We're the parent (the original process); we continue executing,
  28. * knowing that we're not the parent of the second child.
  29. */
  30. exit(0);
  31. }

linux下僵尸进程(Defunct进程)的产生与避免相关推荐

  1. linux下僵尸进程(<defunct>进程)的产生与避免

    一.什么是僵尸进程 在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,那么他将变成一个僵尸进程.当用ps命令观察进程的执行状态时,看到这些进程的状态栏为 ...

  2. 【Linux】如何杀掉defunct进程-僵尸进程

    如何杀掉defunct进程-僵尸进程 defunct进程(僵尸进程) 什么是僵尸进程 杀死僵尸进程 1.重启服务器 2.杀死父进程 defunct进程(僵尸进程) 什么是僵尸进程 僵尸进程是一个早已死 ...

  3. Linux下C语言编程-进程的创建

    Linux下C语言编程-进程的创建 作者:hoyt 1.进程的概念 Linux操作系统是面向多用户的.在同一时间可以有许多用户向操作系统发出各种命令.那么操作系统是怎么实现多用户的环境呢?在现代的操作 ...

  4. Linux下查看某一进程占用的内存

    一. ps -ef|grep flink 和 top -p pid 组合 Linux下查看某一个进程所占用的内存,首先可以通过ps命令找到进程id,比如:ps -ef|grep flink,可以看到f ...

  5. Linux下查看某一进程所占用内存的方法 -- from cnblogser 小得盈满

    Linux下查看某一个进程所占用的内存,首先可以通过ps命令找到进程id,比如 ps -ef | grep kafka 可以看到kafka这个程序的进程id 可以看到是2913,现在可以使用如下命令查 ...

  6. 查看linux每个进程占用内存多少,Linux下如何查看哪个进程占用内存多?

    1.top top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器 可以直接使用top命令后,查看%MEM的内容.可以选择按进程查看或者 ...

  7. 【linux】僵尸进程(Defunct进程)的产生与避免

    一.什么是僵尸进程 在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,那么他将变成一个僵尸进程.当用ps命令观察进程的执行状态时,看到这些进程的状态栏为 ...

  8. linux defunct 进程,Defunct进程(死进程)

    Defunct进程(死进程) IBM网站有关Defunct进程(死进程)的问题确定 内容提要: 本文介绍了为什么会产生defunct进程,如何确定引起defunct进程的原因,以及当需要进一步确定问题 ...

  9. linux下彻底杀死ngnix进程方法

    我们经常会在linux下启动web项目的时候,发现地址总是被占用,后来发现有个鬼玩意在搞事情--nginx 如果ps -ef | grep ngnix 后,在kill -QUIT process_id ...

最新文章

  1. OpenCV(十九)直方图(直方图计算、掩膜、均衡化、自适应均衡化)
  2. performance metrics
  3. linux 使cpu使用率升高_Linux程序性能优化:CPU的上下文切换
  4. weka: exhaustive search
  5. 连破四次吉尼斯世界纪录!厨师界再出神人,用一公斤拉面缔造了一代传奇,背后却是简单的原理……
  6. linux操作系统2试题,RedHat Linux 9.0 操作系统测试题2
  7. 锤子/诺基亚/努比亚手机不合格!上海市场监管局公布抽检不合格手机名单......
  8. Java EE 6 最终草案暗示了平台的未来发展方向
  9. 学习矩阵分析与应用过程中的点滴记录(一)
  10. android打开xlsx文件,如何在Android中打开.xlsx文件?
  11. php图片加密管理系统,8tupian图片加密平台 v3.0
  12. 自我鉴定200字大专生计算机专业,大专毕业生自我鉴定200字
  13. mysql count判断_【MySQL】COUNT
  14. win10状态栏卡死,屏幕正常
  15. Ubuntu 系列学习(五)ubuntu22.04安装flameshot火焰截图(图文)
  16. 镭速(Raysync)文件传输高可用安装部署介绍!
  17. 瑞萨RH850/F1L-片上资源分配(Flash,RAM,外设资源)
  18. 弗朗西斯培根的四大假象
  19. 极客云上使用anaconda配置python2.7+tensorflow1.8
  20. 你想要的Window、Office办公快捷键都在这

热门文章

  1. django第二个项目--使用模板做一个站点访问计数器
  2. JavaMail中解决中文附件名乱码的问题
  3. java创建方法并引用_java – 创建非捕获方法引用,它将调用超类方法
  4. 图的长宽_华为P50 Pro渲染图曝光:单挖孔屏+超高屏占比
  5. php date当天,php5中date()获得的时间不是当前时间的解决方法
  6. 巡回沙龙_美浮特全国巡回沙龙第一期结束撒花!
  7. php 批量更新死锁,php – 在尝试获取锁定时,哪个查询导致死锁;尝试重新启动事务...
  8. 8086加法指令ADD
  9. 按钮图片拉伸_图片墙有多香?高手都在用的PPT封面制作技巧!
  10. 【C++grammar】动态类型转换、typeid与RTTI