Linux 多线程应用中编写安全的信号处理函数

在开发多线程应用时,开发人员一般都会考虑线程安全,会使用 pthread_mutex 去保护全局变量。如果应用中使用了信号,而且信号的产生不是因为程序运行出错,而是程序逻辑需要,譬如 SIGUSR1、SIGRTMIN 等,信号在被处理后应用程序还将正常运行。在编写这类信号处理函数时,应用层面的开发人员却往往忽略了信号处理函数执行的上下文背景,没有考虑编写安全的信号处理函数的一些规则。本文首先介绍编写信号处理函数时需要考虑的一些规则;然后举例说明在多线程应用中如何构建模型让因为程序逻辑需要而产生的异步信号在指定的线程中以同步的方式处理。

回页首

线程和信号

Linux 多线程应用中,每个线程可以通过调用 pthread_sigmask() 设置本线程的信号掩码。一般情况下,被阻塞的信号将不能中断此线程的执行,除非此信号的产生是因为程序运行出错如 SIGSEGV;另外不能被忽略处理的信号 SIGKILL 和 SIGSTOP 也无法被阻塞。

当一个线程调用 pthread_create() 创建新的线程时,此线程的信号掩码会被新创建的线程继承。

POSIX.1 标准定义了一系列线程函数的接口,即 POSIX threads(Pthreads)。Linux C 库提供了两种关于线程的实现:LinuxThreads 和 NPTL(Native POSIX Threads Library)。LinuxThreads 已经过时,一些函数的实现不遵循POSIX.1 规范。NPTL 依赖 Linux 2.6 内核,更加遵循 POSIX..1 规范,但也不是完全遵循。

基于 NPTL 的线程库,多线程应用中的每个线程有自己独特的线程 ID,并共享同一个进程ID。应用程序可以通过调用kill(getpid(),signo) 将信号发送到进程,如果进程中当前正在执行的线程没有阻碍此信号,则会被中断,线号处理函数会在此线程的上下文背景中执行。应用程序也可以通过调用 pthread_kill(pthread_t thread, int sig) 将信号发送给指定的线程,则线号处理函数会在此指定线程的上下文背景中执行。

基于 LinuxThreads 的线程库,多线程应用中的每个线程拥有自己独特的进程 ID,getpid() 在不同的线程中调用会返回不同的值,所以无法通过调用 kill(getpid(),signo) 将信号发送到整个进程。

下文介绍的在指定的线程中以同步的方式处理异步信号是基于使用了 NPTL 的 Linux C 库。请参考“Linux 线程模型的比较:LinuxThreads 和 NPTL”和“pthreads(7) - Linux man page”进一步了解 Linux 的线程模型,以及不同版本的 Linux C 库对 NPTL 的支持。

回页首

编写安全的异步信号处理函数

信号的产生可以是:

  • 用户从控制终端终止程序运行,如 Ctrk + C 产生 SIGINT;
  • 程序运行出错时由硬件产生信号,如访问非法地址产生 SIGSEGV;
  • 程序运行逻辑需要,如调用 killraise 产生信号。

因为信号是异步事件,即信号处理函数执行的上下文背景是不确定的,譬如一个线程在调用某个库函数时可能会被信号中断,库函数提前出错返回,转而去执行信号处理函数。对于上述第三种信号的产生,信号在产生、处理后,应用程序不会终止,还是会继续正常运行,在编写此类信号处理函数时尤其需要小心,以免破坏应用程序的正常运行。关于编写安全的信号处理函数主要有以下一些规则:

  • 信号处理函数尽量只执行简单的操作,譬如只是设置一个外部变量,其它复杂的操作留在信号处理函数之外执行;
  • errno 是线程安全,即每个线程有自己的 errno,但不是异步信号安全。如果信号处理函数比较复杂,且调用了可能会改变errno 值的库函数,必须考虑在信号处理函数开始时保存、结束的时候恢复被中断线程的 errno 值;
  • 信号处理函数只能调用可以重入的 C 库函数;譬如不能调用 malloc(),free()以及标准 I/O 库函数等;
  • 信号处理函数如果需要访问全局变量,在定义此全局变量时须将其声明为 volatile,以避免编译器不恰当的优化。

从整个 Linux 应用的角度出发,因为应用中使用了异步信号,程序中一些库函数在调用时可能被异步信号中断,此时必须根据errno的值考虑这些库函数调用被信号中断后的出错恢复处理,譬如socket 编程中的读操作:

     rlen = recv(sock_fd, buf, len, MSG_WAITALL); if ((rlen == -1) && (errno == EINTR)){// this kind of error is recoverable, we can set the offset change //‘rlen’ as 0 and continue to recv}

回页首

在指定的线程中以同步的方式处理异步信号

如上文所述,不仅编写安全的异步信号处理函数本身有很多的规则束缚;应用中其它地方在调用可被信号中断的库函数时还需考虑被中断后的出错恢复处理。这让程序的编写变得复杂,幸运的是,POSIX.1 规范定义了sigwait()、 sigwaitinfo() pthread_sigmask() 等接口,可以实现:

  • 以同步的方式处理异步信号;
  • 在指定的线程中处理信号。

这种在指定的线程中以同步方式处理信号的模型可以避免因为处理异步信号而给程序运行带来的不确定性和潜在危险。

sigwait

sigwait() 提供了一种等待信号的到来,以串行的方式从信号队列中取出信号进行处理的机制。sigwait()只等待函数参数中指定的信号集,即如果新产生的信号不在指定的信号集内,则 sigwait()继续等待。对于一个稳定可靠的程序,我们一般会有一些疑问:

  • 多个相同的信号可不可以在信号队列中排队?
  • 如果信号队列中有多个信号在等待,在信号处理时有没有优先级规则?
  • 实时信号和非实时信号在处理时有没有什么区别?

笔者写了一小段测试程序来测试 sigwait 在信号处理时的一些规则。

清单 1. sigwait_test.c

#include <signal.h>
#include <errno.h>
#include <pthread.h>
#include <unistd.h>
#include <sys/types.h>void sig_handler(int signum)
{printf("Receive signal. %d\n", signum);
}void* sigmgr_thread()
{sigset_t   waitset, oset;int        sig;int        rc;pthread_t  ppid = pthread_self();pthread_detach(ppid);sigemptyset(&waitset);sigaddset(&waitset, SIGRTMIN);sigaddset(&waitset, SIGRTMIN+2);sigaddset(&waitset, SIGRTMAX);sigaddset(&waitset, SIGUSR1);sigaddset(&waitset, SIGUSR2);while (1)  {rc = sigwait(&waitset, &sig);if (rc != -1) {sig_handler(sig);} else {printf("sigwaitinfo() returned err: %d; %s\n", errno, strerror(errno));}}
}int main()
{sigset_t bset, oset;int             i;pid_t           pid = getpid();pthread_t       ppid;sigemptyset(&bset);sigaddset(&bset, SIGRTMIN);sigaddset(&bset, SIGRTMIN+2);sigaddset(&bset, SIGRTMAX);sigaddset(&bset, SIGUSR1);sigaddset(&bset, SIGUSR2);if (pthread_sigmask(SIG_BLOCK, &bset, &oset) != 0)printf("!! Set pthread mask failed\n");kill(pid, SIGRTMAX);kill(pid, SIGRTMAX);kill(pid, SIGRTMIN+2);kill(pid, SIGRTMIN);kill(pid, SIGRTMIN+2);kill(pid, SIGRTMIN);kill(pid, SIGUSR2);kill(pid, SIGUSR2);kill(pid, SIGUSR1);
kill(pid, SIGUSR1);// Create the dedicated thread sigmgr_thread() which will handle signals synchronouslypthread_create(&ppid, NULL, sigmgr_thread, NULL);sleep(10);exit (0);
}

程序编译运行在 RHEL4 的结果如下:

图 1. sigwait 测试程序执行结果

从以上测试程序发现以下规则:

  • 对于非实时信号,相同信号不能在信号队列中排队;对于实时信号,相同信号可以在信号队列中排队。
  • 如果信号队列中有多个实时以及非实时信号排队,实时信号并不会先于非实时信号被取出,信号数字小的会先被取出:如 SIGUSR1(10)会先于 SIGUSR2 (12),SIGRTMIN(34)会先于 SIGRTMAX (64), 非实时信号因为其信号数字小而先于实时信号被取出。

sigwaitinfo() 以及 sigtimedwait() 也提供了与 sigwait() 函数相似的功能。

Linux 多线程应用中的信号处理模型

在基于 Linux 的多线程应用中,对于因为程序逻辑需要而产生的信号,可考虑调用 sigwait()使用同步模型进行处理。其程序流程如下:

  1. 主线程设置信号掩码,阻碍希望同步处理的信号;主线程的信号掩码会被其创建的线程继承;
  2. 主线程创建信号处理线程;信号处理线程将希望同步处理的信号集设为 sigwait()的第一个参数。
  3. 主线程创建工作线程。

图 2. 在指定的线程中以同步方式处理异步信号的模型

代码示例

以下为一个完整的在指定的线程中以同步的方式处理异步信号的程序。

主线程设置信号掩码阻碍 SIGUSR1 和 SIGRTMIN 两个信号,然后创建信号处理线程sigmgr_thread()和五个工作线程worker_thread()。主线程每隔10秒调用 kill() 对本进程发送 SIGUSR1 和 SIGTRMIN 信号。信号处理线程 sigmgr_thread()在接收到信号时会调用信号处理函数 sig_handler()

程序编译:gcc -o signal_sync signal_sync.c -lpthread

程序执行:./signal_sync

从程序执行输出结果可以看到主线程发出的所有信号都被指定的信号处理线程接收到,并以同步的方式处理。

清单 2. signal_sync.c

#include <signal.h>
#include <errno.h>
#include <pthread.h>
#include <unistd.h>
#include <sys/types.h>void sig_handler(int signum)
{static int j = 0;static int k = 0;pthread_t  sig_ppid = pthread_self(); // used to show which thread the signal is handled in.if (signum == SIGUSR1) {printf("thread %d, receive SIGUSR1 No. %d\n", sig_ppid, j);j++;//SIGRTMIN should not be considered constants from userland, //there is compile error when use switch case} else if (signum == SIGRTMIN) {printf("thread %d, receive SIGRTMIN No. %d\n", sig_ppid, k);k++;}
}void* worker_thread()
{pthread_t  ppid = pthread_self();pthread_detach(ppid);while (1) {printf("I'm thread %d, I'm alive\n", ppid);sleep(10);}
}void* sigmgr_thread()
{sigset_t   waitset, oset;siginfo_t  info;int        rc;pthread_t  ppid = pthread_self();pthread_detach(ppid);sigemptyset(&waitset);sigaddset(&waitset, SIGRTMIN);sigaddset(&waitset, SIGUSR1);while (1)  {rc = sigwaitinfo(&waitset, &info);if (rc != -1) {printf("sigwaitinfo() fetch the signal - %d\n", rc);sig_handler(info.si_signo);} else {printf("sigwaitinfo() returned err: %d; %s\n", errno, strerror(errno));}}
}int main()
{sigset_t bset, oset;int             i;pid_t           pid = getpid();pthread_t       ppid;// Block SIGRTMIN and SIGUSR1 which will be handled in //dedicated thread sigmgr_thread()// Newly created threads will inherit the pthread mask from its creator sigemptyset(&bset);sigaddset(&bset, SIGRTMIN);sigaddset(&bset, SIGUSR1);if (pthread_sigmask(SIG_BLOCK, &bset, &oset) != 0)printf("!! Set pthread mask failed\n");// Create the dedicated thread sigmgr_thread() which will handle // SIGUSR1 and SIGRTMIN synchronouslypthread_create(&ppid, NULL, sigmgr_thread, NULL);// Create 5 worker threads, which will inherit the thread mask of// the creator main threadfor (i = 0; i < 5; i++) {pthread_create(&ppid, NULL, worker_thread, NULL);}// send out 50 SIGUSR1 and SIGRTMIN signalsfor (i = 0; i < 50; i++) {kill(pid, SIGUSR1);printf("main thread, send SIGUSR1 No. %d\n", i);kill(pid, SIGRTMIN);printf("main thread, send SIGRTMIN No. %d\n", i);sleep(10);}exit (0);
}

注意事项

在基于 Linux 的多线程应用中,对于因为程序逻辑需要而产生的信号,可考虑使用同步模型进行处理;而对会导致程序运行终止的信号如 SIGSEGV 等,必须按照传统的异步方式使用 signal()、 sigaction()注册信号处理函数进行处理。这两种信号处理模型可根据所处理的信号的不同同时存在一个 Linux 应用中:

  • 不要在线程的信号掩码中阻塞不能被忽略处理的两个信号 SIGSTOP 和 SIGKILL。
  • 不要在线程的信号掩码中阻塞 SIGFPE、SIGILL、SIGSEGV、SIGBUS。
  • 确保 sigwait() 等待的信号集已经被进程中所有的线程阻塞。
  • 在主线程或其它工作线程产生信号时,必须调用 kill() 将信号发给整个进程,而不能使用 pthread_kill() 发送某个特定的工作线程,否则信号处理线程无法接收到此信号。
  • 因为 sigwait()使用了串行的方式处理信号的到来,为避免信号的处理存在滞后,或是非实时信号被丢失的情况,处理每个信号的代码应尽量简洁、快速,避免调用会产生阻塞的库函数。

回页首

小结

在开发 Linux 多线程应用中, 如果因为程序逻辑需要引入信号, 在信号处理后程序仍将继续正常运行。在这种背景下,如果以异步方式处理信号,在编写信号处理函数一定要考虑异步信号处理函数的安全; 同时, 程序中一些库函数可能会被信号中断,错误返回,这时需要考虑对 EINTR 的处理。另一方面,也可考虑使用上文介绍的同步模型处理信号,简化信号处理函数的编写,避免因为信号处理函数执行上下文的不确定性而带来的风险。

Linux 多线程应用中如何编写安全的信号处理函数相关推荐

  1. c++ sleep函数_Linux 多线程应用中如何编写安全的信号处理函数

    关于代码的可重入性,设计开发人员一般只考虑到线程安全,异步信号处理函数的安全却往往被忽略.本文首先介绍如何编写安全的异步信号处理函数:然后举例说明在多线程应用中如何构建模型让异步信号在指定的线程中以同 ...

  2. Linux 多线程应用中编写安全的信号处理函数

    2019独角兽企业重金招聘Python工程师标准>>> Linux 多线程应用中编写安全的信号处理函数 在 开发多线程应用时,开发人员一般都会考虑线程安全,会使用 pthread_m ...

  3. linux 内核信号量与用户态信号量(system v,信号量在Linux多线程机制中的应用

    [摘 要]本文以信号量原理为基础,重点阐述信号量在Linux多线程同步机制中的实现特色. [关键词]信号量:Linux:多线程:同步 1 信号量 1965年E. W. Dijkstra首次提出信号量的 ...

  4. linux 汇编 cmp,使用汇编语言编写C程序的函数

    我必须实现应该是原子操作的set_bit函数.我在linux源代码中发现了这个汇编代码. (我正在使用sparc),并希望将其更改为可在C程序中使用的函数.使用汇编语言编写C程序的函数 static ...

  5. Linux编程——入门级Makefile文件编写

    前言 1.在Linux开发环境中,编写Makefile文件是一个必须的技能,虽然现在有好多IDE可以自动生成所需要的Makefile文件,但有时能看懂Makefile文件也是更好的了解项目的编译过程. ...

  6. linux多线程求和_linux 多线程信号处理总结

    linux 多线程信号总结(一) 1. 在多线程环境下,产生的信号是传递给整个进程的,一般而言,所有线程都有机会收到这个信号,进程在收到信号的的线程上下文执行信号处理函数,具体是哪个线程执行的难以获知 ...

  7. 怎样设置一个函数C语言,C语言中怎样编写一个函数 如何在C语言中定义一个函数?...

    如何在C语言中定义一个函数?小编很想在你面前流泪最后却还是选择装作打个哈欠 为什么小编怎么定义函数都不正确呢? 总是说小编 表达语法错误在main函数中 小编们可以在头文件与main函数之间定义,并编 ...

  8. linux signal函数用法,linux信号机制之sigaction构造体浅析,signal 函数,信号捕捉.

    来自:http://hi.baidu.com/phenix_yw/blog/item/6eb4ca391d1479f23a87ce19.html 信号安装函数sigaction(int signum, ...

  9. Linux下多线程编程中信号量介绍及简单使用

    在Linux中有两种方法用于处理线程同步:信号量和互斥量. 线程的信号量是一种特殊的变量,它可以被增加或减少,但对其的关键访问被保证是原子操作.如果一个程序中有多个线程试图改变一个信号量的值,系统将保 ...

最新文章

  1. VMware vSphere简介
  2. “睡服”面试官系列第八篇之iterator(建议收藏学习)
  3. MYSQL避免全表扫描__如何查看sql查询是否用到索引(mysql)
  4. linux根目录cat退出,Linux展示cat帮助信息并退出
  5. Arrays类及其方法分析
  6. cnpm能用npm install吗_指纹锁一般能用几年? 指纹锁没电了怎么办
  7. UiAutomator控件获取
  8. 车站分级 (2013noip普及组T4)(树形DP)
  9. [20160325]bbed是否有4G的限制.txt
  10. 小乌龟Git回滚重置及合并指定提交
  11. 如何找出当前活动桌面背景图像的位置/路径(Ubuntu 18.04,GNOME)?
  12. Winform:自定义滚动条——可自定义皮肤
  13. 深度学习模型知识产权保护怎么做?看看IJCAI 2021这场Workshop说了什么
  14. mysql dbms是什么_数据库管理系统(DBMS)是用来做什么的?
  15. Xshell4连接Linux后 win快捷键锁屏
  16. Xshell vim使用右侧数字键盘时数字变成英文字母的解决办法
  17. 使用U盘启动盘安装Imperva MX13.0
  18. java手机教程_Java手机基础教程 (普通高等教育“十二五”规划教材(动漫游戏类))...
  19. 实现一个简单的神经网络
  20. 计算机与网络应用word解析,计算机二级word真题:《计算机与网络应用》教材的编排...

热门文章

  1. Graft货币(GRFT)结点搭建
  2. Linux查询用户创建的后台程序
  3. oracle视图无法使用rowid,请问:无法从没有键值保存表的连接视图中选择 ROWID 这个是什么原因啊?...
  4. 【SpringMVC】返回视图中包含数据(ModelAndView)
  5. 题解-bzoj3901 棋盘游戏
  6. 算法47----大数
  7. [转]将微信和支付宝支付的个二维码合二为一
  8. 洛谷P2879 [USACO07JAN]区间统计Tallest Cow
  9. 2014-10-22 NOIP模拟赛
  10. LNMP1.4环境中安装fileinfo插件