Linux 内核软中断(softirq)执行分析

Author:  sinister
Email:   sinister@whitecell.org
Homepage:http://www.whitecell.org
Date:    2007-01-11

本文对 Linux 内核软中断的执行流程进行了分析,并尽可能的结合当前运
行环境详细地写出我的理解,但这并不表明我的理解一定正确。这本是论坛
里的一篇帖子,发出来是为了抛砖引玉,如果您在阅读本文时发现了我的错
误,还望得到您的指正。
今天无意中看了眼 2.6 内核的软中断实现,发现和以前我看到的大不相同
(以前也是走马观花,不大仔细),可以说改动很大。连 softirq 的调用
点都不一样了,以前是三个调用点,今天搜索了一下源代码,发现在多出了
ksoftirqd 后,softirq 在系统中的调用点仅是在 ISR 返回时和使用了
local_bh_enable() 函数后被调用了。网卡部分的显示调用,我觉得应该不
算是系统中的调用点。ksoftirqd 返回去调用 do_softirq() 函数应该也只
能算是其中的一个分支,因为其本身从源头上来讲也还是在 ISR 返回时
irq_exit() 调用的。这样一来就和前些日子写的那份笔记(Windows/Linux
/Solaris 软中断机制)里介绍的 Linux 内核部分的软中断有出处了,看来
以后讨论 Linux kernel 代码一定要以内核版本为前题,要不非乱了不可。
得买本 Linux 方面的书了,每次上来直接看相关代码也不是回事,时间也
不允许。
//
// do_IRQ 函数执行完硬件 ISR 后退出时调用此函数。
//
void irq_exit(void)
{
account_system_vtime(current);
trace_hardirq_exit();
sub_preempt_count(IRQ_EXIT_OFFSET);
//
// 判断当前是否有硬件中断嵌套,并且是否有软中断在
// pending 状态,注意:这里只有两个条件同时满足
// 时,才有可能调用 do_softirq() 进入软中断。也就是
// 说确认当前所有硬件中断处理完成,且有硬件中断安装了
// 软中断处理时理时才会进入。
//
if (!in_interrupt() && local_softirq_pending())
//
// 其实这里就是调用 do_softirq() 执行
//
invoke_softirq();
preempt_enable_no_resched();
}
#ifndef __ARCH_HAS_DO_SOFTIRQ
asmlinkage void do_softirq(void)
{
__u32 pending;
unsigned long flags;
//
// 这个函数判断,如果当前有硬件中断嵌套,或者
// 有软中断正在执行时候,则马上返回。在这个
// 入口判断主要是为了与 ksoftirqd 互斥。
//
if (in_interrupt())
return;
//
// 关中断执行以下代码
//
local_irq_save(flags);
//
// 判断是否有 pending 的软中断需要处理。
//
pending = local_softirq_pending();
//
// 如果有则调用 __do_softirq() 进行实际处理
//
if (pending)
__do_softirq();
//
// 开中断继续执行
//
local_irq_restore(flags);
}
//
// 最大软中断调用次数为 10 次。
//
#define MAX_SOFTIRQ_RESTART 10
asmlinkage void __do_softirq(void)
{
//
// 软件中断处理结构,此结构中包括了 ISR 中
// 注册的回调函数。
//
struct softirq_action *h;
__u32 pending;
int max_restart = MAX_SOFTIRQ_RESTART;
int cpu;
//
// 得到当前所有 pending 的软中断。
//
pending = local_softirq_pending();
account_system_vtime(current);
//
// 执行到这里要屏蔽其他软中断,这里也就证明了
// 每个 CPU 上同时运行的软中断只能有一个。
//
__local_bh_disable((unsigned long)__builtin_return_address(0));
trace_softirq_enter();
//
// 针对 SMP 得到当前正在处理的 CPU
//
cpu = smp_processor_id();
//
// 循环标志
//
restart:
//
// 每次循环在允许硬件 ISR 强占前,首先重置软中断
// 的标志位。
//
/* Reset the pending bitmask before enabling irqs */
set_softirq_pending(0);
//
// 到这里才开中断运行,注意:以前运行状态一直是关中断
// 运行,这时当前处理软中断才可能被硬件中断抢占。也就
// 是说在进入软中断时不是一开始就会被硬件中断抢占。只有
// 在这里以后的代码才可能被硬件中断抢占。
//
local_irq_enable();
//
// 这里要注意,以下代码运行时可以被硬件中断抢占,但
// 这个硬件 ISR 执行完成后,它的所注册的软中断无法马上运行,
// 别忘了,现在虽是开硬件中断执行,但前面的 __local_bh_disable()
// 函数屏蔽了软中断。所以这种环境下只能被硬件中断抢占,但这
// 个硬中断注册的软中断回调函数无法运行。要问为什么,那是因为
// __local_bh_disable() 函数设置了一个标志当作互斥量,而这个
// 标志正是上面的 irq_exit() 和 do_softirq() 函数中的
// in_interrupt() 函数判断的条件之一,也就是说 in_interrupt()
// 函数不仅检测硬中断而且还判断了软中断。所以在这个环境下触发
// 硬中断时注册的软中断,根本无法重新进入到这个函数中来,只能
// 是做一个标志,等待下面的重复循环(最大 MAX_SOFTIRQ_RESTART)
// 才可能处理到这个时候触发的硬件中断所注册的软中断。
//
//
// 得到软中断向量表。
//
h = softirq_vec;
//
// 循环处理所有 softirq 软中断注册函数。
//
do {
//
// 如果对应的软中断设置 pending 标志则表明
// 需要进一步处理它所注册的函数。
//
if (pending & 1) {
//
// 在这里执行了这个软中断所注册的回调函数。
//
h->action(h);
rcu_bh_qsctr_inc(cpu);
}
//
// 继续找,直到把软中断向量表中所有 pending 的软
// 中断处理完成。
//
h++;
//
// 从代码里可以看出按位操作,表明一次循环只
// 处理 32 个软中断的回调函数。
//
pending >>= 1;
} while (pending);
//
// 关中断执行以下代码。注意:这里又关中断了,下面的
// 代码执行过程中硬件中断无法抢占。
//
local_irq_disable();
//
// 前面提到过,在刚才开硬件中断执行环境时只能被硬件中断
// 抢占,在这个时候是无法处理软中断的,因为刚才开中
// 断执行过程中可能多次被硬件中断抢占,每抢占一次就有可
// 能注册一个软中断,所以要再重新取一次所有的软中断。
// 以便下面的代码进行处理后跳回到 restart 处重复执行。
//
pending = local_softirq_pending();
//
// 如果在上面的开中断执行环境中触发了硬件中断,且每个都
// 注册了一个软中断的话,这个软中断会设置 pending 位,
// 但在当前一直屏蔽软中断的环境下无法得到执行,前面提
// 到过,因为 irq_exit() 和 do_softirq() 根本无法进入到
// 这个处理过程中来。这个在上面详细的记录过了。那么在
// 这里又有了一个执行的机会。注意:虽然当前环境一直是
// 处于屏蔽软中断执行的环境中,但在这里又给出了一个执行
// 刚才在开中断环境过程中触发硬件中断时所注册的软中断的
// 机会,其实只要理解了软中断机制就会知道,无非是在一些特
// 定环境下调用 ISR 注册到软中断向量表里的函数而已。
//
//
// 如果刚才触发的硬件中断注册了软中断,并且重复执行次数
// 没有到 10 次的话,那么则跳转到 restart 标志处重复以上
// 所介绍的所有步骤:设置软中断标志位,重新开中断执行...
// 注意:这里是要两个条件都满足的情况下才可能重复以上步骤。
//
if (pending && --max_restart)
goto restart;
//
// 如果以上步骤重复了 10 次后还有 pending 的软中断的话,
// 那么系统在一定时间内可能达到了一个峰值,为了平衡这点。
// 系统专门建立了一个 ksoftirqd 线程来处理,这样避免在一
// 定时间内负荷太大。这个 ksoftirqd 线程本身是一个大循环,
// 在某些条件下为了不负载过重,它是可以被其他进程抢占的,
// 但注意,它是显示的调用了 preempt_xxx() 和 schedule()
// 才会被抢占和切换的。这么做的原因是因为在它一旦调用
// local_softirq_pending() 函数检测到有 pending 的软中断
// 需要处理的时候,则会显示的调用 do_softirq() 来处理软中
// 断。也就是说,下面代码唤醒的 ksoftirqd 线程有可能会回
// 到这个函数当中来,尤其是在系统需要响应很多软中断的情况
// 下,它的调用入口是 do_softirq(),这也就是为什么在 do_softirq()
// 的入口处也会用 in_interrupt()  函数来判断是否有软中断
// 正在处理的原因了,目的还是为了防止重入。ksoftirqd 实现
// 看下面对 ksoftirqd() 函数的分析。
//
if (pending)
//
// 此函数实际是调用 wake_up_process() 来唤醒 ksoftirqd
//
wakeup_softirqd();
trace_softirq_exit();
account_system_vtime(current);
//
// 到最后才开软中断执行环境,允许软中断执行。注意:这里
// 使用的不是 local_bh_enable(),不会再次触发 do_softirq()
// 的调用。
//
_local_bh_enable();
}
static int ksoftirqd(void * __bind_cpu)
{
//
// 显示调用此函数设置当前进程的静态优先级。当然,
// 这个优先级会随调度器策略而变化。
//
set_user_nice(current, 19);
//
// 设置当前进程不允许被挂启
//
current->flags |= PF_NOFREEZE;
//
// 设置当前进程状态为可中断的状态,这种睡眠状
// 态可响应信号处理等。
//
set_current_state(TASK_INTERRUPTIBLE);
//
// 下面是一个大循环,循环判断当前进程是否会停止,
// 不会则继续判断当前是否有 pending 的软中断需
// 要处理。
//
while (!kthread_should_stop()) {
//
// 如果可以进行处理,那么在此处理期间内禁止
// 当前进程被抢占。
//
preempt_disable();
//
// 首先判断系统当前没有需要处理的 pending 状态的
// 软中断
//
if (!local_softirq_pending()) {
//
// 没有的话在主动放弃 CPU 前先要允许抢占,因为
// 一直是在不允许抢占状态下执行的代码。
//
preempt_enable_no_resched();
//
// 显示调用此函数主动放弃 CPU 将当前进程放入睡眠队列,
// 并切换新的进程执行(调度器相关不记录在此)
//
schedule();
//
// 注意:如果当前显示调用 schedule() 函数主动切换的进
// 程再次被调度执行的话,那么将从调用这个函数的下一条
// 语句开始执行。也就是说,在这里当前进程再次被执行的
// 话,将会执行下面的 preempt_disable() 函数。
//
//
// 当进程再度被调度时,在以下处理期间内禁止当前进程
// 被抢占。
//
preempt_disable();
}
//
// 设置当前进程为运行状态。注意:已经设置了当前进程不可抢占
// 在进入循环后,以上两个分支不论走哪个都会执行到这里。一是
// 进入循环时就有 pending 的软中断需要执行时。二是进入循环时
// 没有 pending 的软中断,当前进程再次被调度获得 CPU 时继续
// 执行时。
//
__set_current_state(TASK_RUNNING);
//
// 循环判断是否有 pending 的软中断,如果有则调用 do_softirq()
// 来做具体处理。注意:这里又是一个 do_softirq() 的入口点,
// 那么在 __do_softirq() 当中循环处理 10 次软中断的回调函数
// 后,如果还有 pending 的话,会又调用到这里。那么在这里则
// 又会有可能去调用 __do_softirq() 来处理软中断回调函数。在前
// 面介绍 __do_softirq() 时已经提到过,处理 10 次还处理不完的
// 话说明系统正处于繁忙状态。根据以上分析,我们可以试想如果在
// 系统非常繁忙时,这个进程将会与 do_softirq() 相互交替执行,
// 这时此进程占用 CPU 应该会很高,虽然下面的 cond_resched()
// 函数做了一些处理,它在处理完一轮软中断后当前处理进程可能会
// 因被调度而减少 CPU 负荷,但是在非常繁忙时这个进程仍然有可
// 能大量占用 CPU。
//
while (local_softirq_pending()) {
/* Preempt disable stops cpu going offline.
If already offline, we'll be on wrong CPU:
don't process */
if (cpu_is_offline((long)__bind_cpu))
//
// 如果当前被关联的 CPU 无法继续处理则跳转
// 到 wait_to_die 标记出,等待结束并退出。
//
goto wait_to_die;
//
// 执行 do_softirq() 来处理具体的软中断回调函数。注
// 意:如果此时有一个正在处理的软中断的话,则会马上
// 返回,还记得前面介绍的 in_interrupt() 函数么。
//
do_softirq();
//
// 允许当前进程被抢占。
//
preempt_enable_no_resched();
//
// 这个函数有可能间接的调用 schedule() 来切换当前
// 进程,而且上面已经允许当前进程可被抢占。也就是
// 说在处理完一轮软中断回调函数时,有可能会切换到
// 其他进程。我认为这样做的目的一是为了在某些负载
// 超标的情况下不至于让这个进程长时间大量的占用 CPU,
// 二是让在有很多软中断需要处理时不至于让其他进程
// 得不到响应。
//
cond_resched();
//
// 禁止当前进程被抢占。
//
preempt_disable();
//
// 处理完所有软中断了吗?没有的话继续循环以上步骤
//
}
//
// 待一切都处理完成后,允许当前进程被抢占,并设置
// 当前进程状态为可中断状态,继续循环以上所有过程。
//
preempt_enable();
set_current_state(TASK_INTERRUPTIBLE);
}
//
// 如果将会停止则设置当前进程为运行状态后直接返回。
// 调度器会根据优先级来使当前进程运行。
//
__set_current_state(TASK_RUNNING);
return 0;
//
// 一直等待到当前进程被停止
//
wait_to_die:
//
// 允许当前进程被抢占。
//
preempt_enable();
/* Wait for kthread_stop */
//
// 设置当前进程状态为可中断的状态,这种睡眠状
// 态可响应信号处理等。
//
set_current_state(TASK_INTERRUPTIBLE);
//
// 判断当前进程是否会被停止,如果不是的话
// 则设置进程状态为可中断状态并放弃当前 CPU
// 主动切换。也就是说这里将一直等待当前进程
// 将被停止时候才结束。
//
while (!kthread_should_stop()) {
schedule();
set_current_state(TASK_INTERRUPTIBLE);
}
//
// 如果将会停止则设置当前进程为运行状态后直接返回。
// 调度器会根据优先级来使当前进程运行。
//
__set_current_state(TASK_RUNNING);
return 0;
}
参考:
linux kernel source 2.6.19.1
/kernel/softirq.c

WSS(Whitecell Security Systems),一个非营利性民间技术组织,致力于各种系统安全技术的研究。坚持传统的hacker精神,追求技术的精纯。
WSS 主页:http://www.whitecell.org/
WSS 论坛:http://www.whitecell.org/forums/

Linux 内核软中断(softirq)执行分析相关推荐

  1. Linux内核抢占实现机制分析【转】

    Linux内核抢占实现机制分析 转自:http://blog.chinaunix.net/uid-24227137-id-3050754.html [摘要]本文详解了Linux内核抢占实现机制.首先介 ...

  2. 【嵌入式Linux学习七步曲之第五篇 Linux内核及驱动编程】Linux内核抢占实现机制分析

    Linux内核抢占实现机制分析 Sailor_forever  sailing_9806@163.com 转载请注明 http://blog.csdn.net/sailor_8318/archive/ ...

  3. Linux内核--网络栈实现分析(二)--数据包的传递过程--转

    转载地址http://blog.csdn.net/yming0221/article/details/7492423 作者:闫明 本文分析基于Linux Kernel 1.2.13 注:标题中的&qu ...

  4. linux内核中链表代码分析---list.h头文件分析(一)

    linux内核中链表代码分析---list.h头文件分析(一) 16年2月27日17:13:14 在学习数据结构时,有一个重要的知识点就是链表.对于链表的一些基本操作,它的最好学习资料就是内核中的li ...

  5. linux内核中链表代码分析---list.h头文件分析(二)【转】

    转自:http://blog.chinaunix.net/uid-30254565-id-5637598.html linux内核中链表代码分析---list.h头文件分析(二) 16年2月28日16 ...

  6. 第十期-Linux内核补丁源码分析(2)

    作者:罗宇哲,中国科学院软件研究所智能软件研究中心 在上一期中,我们通过CAKE系统的实例介绍了一种对Linux内核补丁的初步分析方法,这一期我们将继续通过CAKE系统的例子介绍一种对补丁文件源码的分 ...

  7. Linux中断与进程切换,结合中断上下文切换和进程上下文切换分析Linux内核的一般执行过程...

    @ 实验环境 OS Linux cj-virtual-machine 5.3.0-51-generic 虚拟机 QEMU 内核版本 5.3.4 调式方法 GDB PS:调试环境安装请看上一篇博客汇编级 ...

  8. Linux内核的Softirq机制

    前言  中断服务程序往往都是在CPU关中断的条件下执行的,以避免中断嵌套而使控制复杂化.但是CPU关中断的时间不能太长,否则容易丢失中断信号.为此,Linux将中断服务程序一分为二,各称作" ...

  9. [Linux内核]软中断与硬中断

    转自:http://blog.csdn.net/zhangskd/article/details/21992933 本文主要内容:硬中断 / 软中断的原理和实现 内核版本:2.6.37 Author: ...

  10. 【内核】linux内核启动流程详细分析【转】

    转自:http://www.cnblogs.com/lcw/p/3337937.html Linux内核启动流程 arch/arm/kernel/head-armv.S 该文件是内核最先执行的一个文件 ...

最新文章

  1. 其他算法-比例风险回归模型
  2. 谁说只有VGG才能做风格迁移,ResNet也可以!答案就在对抗攻击中
  3. python 通过paramiko模块批量执行ssh命令
  4. api文档数据量太大崩溃_比较最好的免费金融市场数据API
  5. 技术驱动还是产品驱动
  6. 深入理解java虚拟机(十三) Java 即时编译器JIT机制以及编译优化
  7. java 多态_Java 多态
  8. php 获取网页内容 四种方法
  9. namenode开启DEBUG
  10. python学习(1)启程
  11. rstudio 修改代码间距_如何在RStudio里修改R脚本的编码方式
  12. 判断Windows服务是否启动
  13. hibernate 的session一级缓存
  14. 常用排序算法(六)——希尔排序
  15. unity 字体width_Unity制作自定义字体的两种方法
  16. UE4/UE5 WebBrowser无法播放直播流的问题
  17. 从“鸿沟理论”看云原生,哪些技术能够跨越鸿沟?
  18. WIN7下建行捷德U盾支付
  19. 高通QCC5100系列蓝牙音频模块芯片
  20. 编解码学习笔记(三) Mpeg系列——Mpeg 1和Mpeg 2

热门文章

  1. mysql导入hdfs参数_导入数据到HDFS
  2. c/c++混编到的问题 extern C 介绍【转】
  3. 移动端flex学习笔记(黑马教程)-基础概念
  4. FastDFS的配置文件tracker.conf、storage.conf、client.conf 讲解
  5. jenkins 编译java_Jenkins 通过 maven 构建编译 JAVA 项目环境
  6. 串口调试助手哪个好用_哪个员工考勤系统好用?选择打卡助手就对了
  7. 7个等级 容灾等级_猫奴的10个等级 你的奴性有多高?
  8. python遍历json_Python学习笔记:Python3中Json数据遍历取指定值
  9. linux 信号量_SystemV IPC通信信号量
  10. 华为交换机怎么关闭信息提示_iPhone 关闭支付宝自动扣费服务提示“无法解约”怎么办?...