如果要看下面的文章之前,建议之前的文章也瞄一眼

为什么不能在中断上半部休眠?

扒一扒中断为什么不能调printf


大家好,我是老吴「我只是老吴的朋友」。

今天是周一「今天不是周一」,大家工作顺利吗?

这篇文章给大家分享一点小知识:为什么中断里不能睡眠?

网上很多文章尝试解释这个问题,看后我觉得头皮发麻。

下面,我试着总结一下原因。

明确问题

首先,让我们明确一下问题。

对于这个问题,稍微准确一点的问法是:为什么在 Linux 的中断里,不能 sleep?

但是这个问法仍然不准确。

中断 (interrupt) 和中断服务程序 (interrupt service routine, ISR,或者是 interrupt handler),是 2 个不同的概念。

前者是硬件相关的概念,后者是软件相关的概念。

所以,对于这个问题,最准确的问法是:为什么在 Linux 的 ISR 里,不能 sleep?

由于 sleep 意味着 call scheduler,所以更直白一点的问法是

为什么在 Linux 的 ISR 里,不能 call scheduler?

最后,再加点限制条件会更准确:为什么在 Linux 的 ISR 里,即便 ISR 没有 hold 住任何 lock 的时候,都不能 call scheduler?

一种常见的解释

不能在 ISR 里睡眠的原因是:ISR 与任何 process context (进程上下文) 无关。

process context 是进程的状态信息,包括:

  • kernelspace and userspace stack pointers;

  • register set,或者称为 hardware context;

  • page table;

对于每一个进程,在内核都会有一个 pcb (process control, block,即 Linux 里的 task_struct 结构体) 来管理这些信息。

scheduler 可以访问所有这些信息,以抢占一个进程并运行另一个进程。

与此相反,取决于内核和迎接架构的版本,ISR 使用单独的中断栈或被中断的进程的内核栈,并且在中断中会有自己的 hardware context.

因此,由于在 ISR 里没有 process context,所以不能进行调度。

但是,这个说法描述的其实是当下设计的状况,而不是当初这样设计的原因。

在 Linux 的早期版本中,ISR 总是借用当前进程的栈。

所以如果内核想设计成允许在 ISR 里睡眠,是可以很自然地实现进程上下文切换的。

但是,Linux 采用的设计是:在 ISR 里禁止睡眠。

现在,我们的问题变成了

为什么在 Linux 里,ISR 被设计成不能睡眠?

将 ISR 设计成不可睡眠的原因

sleep 会导致 call scheduler 以选择另一个进程来运行。

内核代码里有大量的 critical p (临界区)。

critical p 本质上是一段会访问或操作共享资源的代码,例如:

static int copy_fs(unsigned long clone_flags, struct task_struct *tsk)
{struct fs_struct *fs = current->fs;if (clone_flags & CLONE_FS) {/* tsk->fs is already what we want */spin_lock(&fs->lock);if (fs->in_exec) {spin_unlock(&fs->lock);return -EAGAIN;}fs->users++;spin_unlock(&fs->lock);return 0;}tsk->fs = copy_fs_struct(fs);if (!tsk->fs)return -ENOMEM;return 0;
}

在 critical p 里,是不能 call scheduler 的。

因为已经有一个进程持有锁了,如果这时切换到另一个进程,最好的情况下是等待一段无法预测的时间后前一个进程会将锁释放出来,最坏的情况是死锁。

硬件中断是随时可能发生的,即便内核执行的路径正处于 critical p 中。

如果想在 ISR 里支持 sleep,也就是支持 call scheduler 的话,那么所有的 critical p 都必须得禁用中断,否则硬件中断一旦来临系统就会出现 race condition,接下来大概率是死锁。

Sleep 和 ISR

我查阅了一下 Linux 4.9 的代码,当你在一个不能调度的地方 call scheduler (例如 ISR 里 sleep) 的话,内核可以提示你写的代码有 BUG:

static inline void schedule_debug(struct task_struct *prev)
{
#ifdef CONFIG_SCHED_STACK_END_CHECKif (task_stack_end_corrupted(prev))panic("corrupted stack end detected inside scheduler\n");
#endif// 错误的时机 call sheduler ?if (unlikely(in_atomic_preempt_off())) {__schedule_bug(prev);preempt_count_set(PREEMPT_DISABLED);}[...]
}

我在某个设备驱动的中断处理函数 XXX_ISR() 里加了 msleep(10) 之后:

[   27.221560] BUG: scheduling while atomic: swapper/0/0x00010002
[   27.221609] Modules linked in: 8021q garp stp mrp llc usb_f_eem g_ether usb_f_rndis u_ether exfat(O)
[   27.221712] CPU: 0 PID: 0 Comm: swapper Tainted: G           O    4.9.203 #640
[   27.224736] Hardware name: Samsung Device
[   27.230575] [<c010d3b4>] (unwind_backtrace) from [<c010afc8>] (show_stack+0x10/0x14)
[   27.238267] [<c010afc8>] (show_stack) from [<c014848c>] (__schedule_bug+0x64/0x84)
[   27.245802] [<c014848c>] (__schedule_bug) from [<c084a2b0>] (__schedule+0x3fc/0x550)
[   27.253512] [<c084a2b0>] (__schedule) from [<c084a454>] (schedule+0x50/0xb4)
[   27.260533] [<c084a454>] (schedule) from [<c084ccb0>] (schedule_timeout+0x114/0x1e8)
[   27.268246] [<c084ccb0>] (schedule_timeout) from [<c016dd04>] (msleep+0x2c/0x38)
[   27.275612] [<c016dd04>] (msleep) from [<c057ebf8>] (XXX_ISR+0x34/0x8c)
[   27.282982] [<c057ebf8>] (XXX_ISR) from [<c015f928>] (__handle_irq_event_percpu+0x88/0x124)
[   27.292075] [<c015f928>] (__handle_irq_event_percpu) from [<c015f9e0>] (handle_irq_event_percpu+0x1c/0x58)
[   27.301693] [<c015f9e0>] (handle_irq_event_percpu) from [<c015fa54>] (handle_irq_event+0x38/0x5c)
[   27.310532] [<c015fa54>] (handle_irq_event) from [<c0162808>] (handle_edge_irq+0xe0/0x1a4)
[   27.318764] [<c0162808>] (handle_edge_irq) from [<c015ed64>] (generic_handle_irq+0x24/0x34)
[   27.327091] [<c015ed64>] (generic_handle_irq) from [<c0430ed8>] (exynos_irq_eint0_15+0x44/0x98)
[   27.335751] [<c0430ed8>] (exynos_irq_eint0_15) from [<c015ed64>] (generic_handle_irq+0x24/0x34)
[   27.344415] [<c015ed64>] (generic_handle_irq) from [<c015f20c>] (__handle_domain_irq+0x54/0xa8)
[   27.353080] [<c015f20c>] (__handle_domain_irq) from [<c010146c>] (vic_handle_irq+0x58/0x94)
[   27.361398] [<c010146c>] (vic_handle_irq) from [<c010ba4c>] (__irq_svc+0x6c/0xa8)
[   27.368847] Exception stack(0xc0d01f58 to 0xc0d01fa0)

总结一下

硬件中断是超级宝贵的资源,想在中断里睡眠的话就得在大量的 critical p 中关闭中断才能避免 race condition,而关闭硬件中断将会大大地增加中断响应的延迟,降低系统的反应速度,这是操作系统的用户所无法接受的, 因此内核开发者采用的设计是在中断里不允许睡眠,并且 ISR 应尽快执行并返回以便系统里的进程继续运行。

那么,那些很耗时的工作该怎么处理呢?

ISR 里如何处理耗时的工作

由于硬件中断可能随时发生,ISR 随时会执行。因此,它必须快速运行并退出,以便尽快恢复被中断代码的执行。在操作系统看来,无论是硬件中断还是被中断的代码,两者都是很重要的,因此,ISR 应在尽可能短的时间内执行完毕。

但是,现实情况是,许多 ISR 有大量工作要执行。例如网络设备的 ISR 除了响应硬件之外,还需要 将网络数据包从硬件复制到内存中,处理它们,并将数据包向下分发到适当的协议栈或应用程序。

Linux 如何解决这种活多钱少的问题?

答:将 ISR 分为 top half 和 bottom half。

top half 在收到中断后立即运行,仅执行时间紧迫的工作,例如确认收到中断或重置硬件,执行完 top half 后,如果进入 ISR 前是处于 critical p 且内核抢占是被关闭 ( 例如 spinlock ) 的话,就会返回到 critical p 里继续运行,不会产生 race condition 的问题。

void irq_exit(void)
{
#ifndef __ARCH_IRQ_EXIT_IRQS_DISABLEDlocal_irq_disable();
#elseWARN_ON_ONCE(!irqs_disabled());
#endifaccount_irq_exit_time(current);preempt_count_sub(HARDIRQ_OFFSET);// 内核抢占没被关闭、已经没有其他 hardirq 了、有 softirq 在 pending 等条件都被满足时,才会处理 softirqif (!in_interrupt() && local_softirq_pending())invoke_softirq();[...]
}

而晚一点执行也没问题的工作将推迟到 bottom half。bottom half 将在某个未来更方便的时间运行,并且是在使能所有中断、使能内核抢占的情况下进行,那时我们想怎么折腾就怎么折腾吧。

Linux 提供了许多 bottom half 的机制,例如 softirqs、tasklets、workqueues。

点击查看大图

所以,有了 bottom half 之后,在 ISR 里睡眠这种需求,其实是完全没有必要的。

到此,这个问题就解释完毕了,感谢大家的阅读。


推荐阅读:

专辑|Linux文章汇总

专辑|程序人生

专辑|C语言

我的知识小密圈

关注公众号,后台回复「1024」获取学习资料网盘链接。

欢迎点赞,关注,转发,在看,您的每一次鼓励,我都将铭记于心~

嵌入式Linux

微信扫描二维码,关注我的公众号

二逼了吧,你竟然在中断里面休眠相关推荐

  1. 如何辨别二逼、文艺互联网公司?

    一般认为,1994 年是中国互联网发展的元年,到如今,中国互联网也已经走过了 26 个年头. 历经 20 多年的传承迭代,我们身边涌现了越来越多形形色色的互联网公司,这些公司也从多方多面展现着自己的特 ...

  2. 漫画:如何辨别二逼互联网公司!?

    作者 | 了不起的程序员 来源 | 了不起的程序员(ID:great_developer) 一般认为,1994年是中国互联网发展的元年,到如今2020年,中国互联网也已经走过了26个年头. 历经20多 ...

  3. 【BZOJ-3196】二逼平衡树 线段树 + Splay (线段树套平衡树)

    3196: Tyvj 1730 二逼平衡树 Time Limit: 10 Sec  Memory Limit: 128 MB Submit: 2271  Solved: 935 [Submit][St ...

  4. 如何辨别二逼互联网公司!?

    本文经授权转载自微信公众号:西二旗生活指北(ID:ShelchiLifeGuide),作者:景岁 这些年, 随着互联网行业的快速发展, 很多大大小小的互联网公司涌现了出来. 这些公司里, 有的发展了很 ...

  5. 我在使用vector时候遇到的二逼问题

    最近在练习使用STL中德各种容器,像vector,map,set之类的. 然后在使用vector的时候,无意间遇到了一个很二逼的问题. 主要是这样的,请看源码(C++): //错误的写法: #incl ...

  6. Bzoj 3196 Tyvj 1730 二逼平衡树

    3196: Tyvj 1730 二逼平衡树 >原题链接< Description 您需要写一种数据结构(可参考题目标题),来维护一个有序数列,其中需要提供以下操作: 1.查询k在区间内的排 ...

  7. 我们该如何设计数据库:“普通——文艺——二逼”的区别

    数据库该如何设计,一直以来都是一个仁者见仁智者见智的问题. 对于某一种数据库设计,并不能简单的用好与不好来区分.或许真的应了那句话,没有最好,只有最适合.讨论某种数据库设计的时候,应该在某种特定的需求 ...

  8. BZOJ3809: Gty的二逼妹子序列

    BZOJ3809: Gty的二逼妹子序列 又是一道权限题... 本蒟蒻没钱氪金... 附上洛谷题面: 洛谷P4867 Gty的二逼妹子序列 题目描述 Autumn和Bakser又在研究Gty的妹子序列 ...

  9. [BZOJ3809]Gty的二逼妹子序列

    [BZOJ3809]Gty的二逼妹子序列 试题描述 Autumn和Bakser又在研究Gty的妹子序列了!但他们遇到了一个难题. 对于一段妹子们,他们想让你帮忙求出这之内美丽度∈[a,b]的妹子的美丽 ...

最新文章

  1. poj 1061 青蛙的约会
  2. 物联网的下一步动作会是什么?
  3. Codeforces Round #698 (Div. 2) A-E解题报告与解法证明
  4. linux中的码字软件,码字写作软件下载
  5. Ubuntu修改默认源为国内
  6. db2 程序连接字符串
  7. SqlServer递归查询树形结果数据
  8. java开源问卷调查系统源码_高效实用!开源调研问卷系统 DWSurvey,基于 JAVA WEB 开发...
  9. OneNote无法同时设置中英文字体设置解决办法
  10. poweramp最完美设置_powerAMP音效设置
  11. 没有钱到底要不要创业?
  12. 美国北亚利桑那大学计算机专业排名,美国北亚利桑那大学排名学费
  13. 项目经理如何做好授权管理?
  14. ubuntu16.04安装Preempt RT实时内核
  15. 2007版本中国网络新秀之七剑下天山
  16. RPG Maker MV 密码宝箱
  17. 关于Keil.STM32F1xx_DFP.1.0.5代码无法烧录解决办法
  18. multisim电流探棒怎么改变方向?MULTISIM电流探
  19. C语言之运算符练习题
  20. 解决电脑能上网,但是显示无法连接Internet

热门文章

  1. DevExpress Chart空间Y轴归一化(线性归一化函数)
  2. qml demo分析(customgeometry-贝塞尔曲线)
  3. Linux文件、目录权限及常用命令
  4. H3C s5500-SI-EI系列交换机 WEB界面登录配置
  5. pandas计算移动平均值
  6. mysql中count(*)和count(1)和count(column)区别
  7. 如何启用计算机的远程服务,远程桌面服务,教您怎么打开远程桌面服务
  8. mysql concat例子_MYSQL中CONCAT详解
  9. Python 内置模块之 os
  10. Python 之数据类型