本文主要讨论在高实时要求、高效能计算、DPDK等领域,Linux如何让某一个线程排他性独占CPU;独占CPU涉及的线程、中断隔离原理;以及如何在排他性独占的情况下,甚至让系统的timer tick也不打断独占任务,从而实现最低的延迟抖动。

目录

工程需求

用户态隔离

内核态隔离

中断

内核态线程

最佳实践指南

参考文献


工程需求


在一个SMP或者NUMA系统中,CPU的数量大于1。在工程中,我们有时候有一种需求,就是让某个能够独占CPU,这个CPU什么都不做,就只做指定的任务,从而获得低延迟、高实时的好处。

比如在DPDK中,通过设置

GRUB_CMDLINE_LINUX_DEFAULT=“isolcpus=0-3,5,7”

隔离CPU0,3,5,7,让DPDK的任务在运行的时候,其他任务不会和DPDK的任务进行上下文切换,从而保证网络性能最佳[1]。在Realtime应用场景中,通过isolcpus=2隔离CPU2,然后把实时应用通过taskset绑定到隔离的核:

taskset-c 2 pn_dev

从而保证低延迟要求[2]。

用户态隔离


这个地方,我们可以看出,它们统一都使用了isolcpus这样一个启动参数。

实践是检验真理的唯一标准,下面我们来启动一个8核的ARM64系统,运行Ubuntu,并指定isolcpus=2这个启动参数:

系统启动后,我们运行下面简单的程序(启动8个进程运行while死循环):

我们是8核的,现在又是运行8个进程,所以理论上来讲,负载均衡后,8个进程应该均分地运行在8个核上面,但是我们来看看实际的htop结果:

我们发现3(也就是CPU2)上面的CPU占用率是0.0%。这实证了CPU2已经被隔离,用户空间的进程不能在它上面跑。

当然,这个时候,我们可以通过taskset,强行把其中的一个a.out,绑定到CPU2上面去:

从上面命令的结果看出,663原本的affinity list只有0,1,3-7是没有2的,而我们强行把它设置为了2,之后再看htop,CPU2上面占用100%:

通过上面的实验,我们明显可以看出isolcpus=2使得CPU2上无法再运行用户空间的进程了(除非手动设置affinity)。

内核态隔离


中断


但是,能在CPU2上面运行的,不是只有用户态的任务,还可以有内核线程、中断等,那么isolcpus=能否隔离内核线程和中断呢?

对于中断,我们特别容易查看,就是实际去验证每个IRQ的smp_affinity就好了:

从上图明显可以看出,对于44、47号这种外设的中断,Linux内核把smp_affinity设置为了FB(11111011),明显避开了CPU2,所以,实际外设中断也不会在CPU2发生,除非我们强行给中断绑核,比如让44号中断绑定到CPU2:

echo 2 >/proc/irq/44/smp_affinity_list

之后,我们发现44号中断在CPU2可以发生:

但是,系统的timer中断、IPI,由于是Linux系统的运行基石,实际还是要在CPU2上面运行的。这里面最可能给任务带来延迟抖动的,自然是timer tick。

下面我们重点探讨下tick的问题,由于Linux一般情况下,已经配置IDLE状态的NO_HZ tickless,所以CPU2上面什么都不跑的时候,实际timer中断几乎不发生。

下面,我们还是在isolcpus=2的情况下,运行前面那个8个进程的a.out,默认情况下没有任务会占用CPU2。通过先后运行几次cat /proc/interrupts | head 2,我们会看到其他core的timer中断频繁发生,而CPU2几乎不变,这显然是IDLE时候的NO_HZ在发挥省电的作用:

但是,一旦我们放任务到CPU2,哪怕只是放1个,就会发现CPU2上面的timer中断开始增加:

这说明一点,哪怕隔离的CPU上面只有一个线程去跑,timer tick就会开始跑,当然,这个timer tick也会频繁打断这一个线程,从而造成大量的上下文切换。你肯定会觉得Linux怎么这么傻,既然只有一个人,那也没有时间片分片的必要,不需要在2个或者多个任务进行时间片划分地调度,为啥还要跑tick?其实原因是我们的内核默认只是使能了IDLE的NO_HZ:

我们来重新编译一个内核,使能NO_HZ_FULL:

当我们使能了NO_HZ_FULL后,Linux支持在CPU上仅有1个任务的时候,是可以NO_HZ的。但是有2个就傻眼了,所以这个“FULL”也不是真地FULL[3]。这当然也可以理解,因为有2个就涉及到时间片调度的问题。什么时候应该使能NO_HZ_FULL,内核文档Documentation/timers/no_hz.rst有明确地“指示”,只有在实时和HPC等的场景,才需要,否则默认的NO_HZ_IDLE是你最好的选择:

我们重新编译了内核,选中了NO_HZ_FULL,下面启动Linux,注意启动的时候参数添加nohz_full=2,让CPU2支持NO_HZ_FULL:

重新运行CPU2只有一个任务的场景,看看它的timer中断发生情况:

发现CPU2上面的tick稳定在188上面,这样相信你会更加开心,因为你独占地更加彻底了!

下面,我们再放一个task进去CPU2,有2个任务的情况下,CPU2上面的timer tick开始增加:

不过,这或许不是个问题,因为我们说好了“独占”,1个任务独占的时候,timer tick不来打扰,应该已经是非常理想的情况了!

内核态线程


内核态的线程其实和用户态差不多,当它们没有绑定到隔离的CPU的时候,是不会跑到隔离CPU运行的。下面用笔者在内核里面添加的dma_map_benchmark来做实验[4],开启16个内核线程来进行DMA map和unmap(注意我们只有8个核):

./dma_map_benchmark -s 120 -t 16

我们看到CPU2上面的CPU占用也是0:

内核里面的dma_map_benchmark线程在狂占CPU0-1, 3-7,但是就是不去占CPU2:

但是,内核线程如果用kthread_bind_mask()类似API把线程绑定到了隔离的CPU,则情况就不一样了,这就类似用taskset把用户态的任务绑定到CPU一样。

最佳实践指南


对于实时性要求高、高性能计算等场景,如果要让某个任务独占CPU,最理想的选择是:

  • 1.     采用isolcpus隔离CPU
  • 2.     将指定任务绑定到隔离CPU
  • 3.     小心意外地把中断、内核线程绑定到了隔离CPU,排查到这些“意外”分子
  • 4.     使能NO_HZ_FULL,则效果更佳,因为连timer tick中断也不打扰你了。

参考文献


  • [1]http://doc.dpdk.org/spp-18.02/setup/performance_opt.html
  • [2]https://rt-labs.com/docs/p-net/linuxtiming.html
  • [3]https://lwn.net/Articles/549580/
  • https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=65789daa80
  • https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/commit/?id=7679325702

Linux实时/高性能任务独占CPU的操作相关推荐

  1. linux 独占 cpu,宋宝华:谈一谈Linux让实时 高性能任务独占CPU的事

    本文主要讨论在高实时要求.高效能计算.DPDK等领域,Linux如何让某一个线程排他性独占CPU:独占CPU涉及的线程.中断隔离原理:以及如何在排他性独占的状况下,甚至让系统的timer tick也不 ...

  2. Linux -- 进程或线程独占CPU

    如果想让特定进程或线程独占某一或某些CPU,我们需要做三件事. 一,隔离CPU,避免其它线程run在被隔离的CPU上. 二,绑定所有的interrupts到非隔离的CPU上,避免被隔离的CPU收到in ...

  3. 【Linux进程、线程、任务调度】四多核下负载均衡 中断负载均衡,RPS软中断负载均衡 cgroups与CPU资源分群分配 Linux为什么不是硬实时 preempt-rt对Linux实时性的改造

    学习交流加 个人qq: 1126137994 个人微信: liu1126137994 学习交流资源分享qq群: 962535112 上一篇文章(点击链接:点击链接阅读上一篇文章)讲了: CPU/IO消 ...

  4. linux线程怎样实时性,高效轻型线程怎么提高Linux实时性能?

    这些用户空间扩展(有多个)已首先由电信/网络高性能 IP 数据包处理系统进行驱动,以实现所谓的"裸金属"实施,其中,多核设备中的Linux用户空间应用可以模拟"无操作系统 ...

  5. 【realtime】红帽 RedHat Linux实时内核配置要点全面分析

    CentOS Linux实时性配置要点 rtoax 2021年2月 1. 概要 1.1. 实时性补丁 补丁地址:CentOS 7 - RealTime for x86_64: RealTime: ke ...

  6. linux 实时监控系统IO状态和IO性能

    Snippet:2021-3-5 9:33 linux 实时监控系统IO状态和IO性能 问题概述:linux 实时监控系统IO状态和IO性能 方案细节 bash> iostat -c -k -p ...

  7. linux命令查看cpu序列号,Linux下用命令查看CPU ID以及厂家等信息

    Linux下用命令查看CPU ID // 获得CPU ID dmidecode -t 4 | grep ID |sort -u |awk -F': ' '{print $2}' // 获得磁盘ID f ...

  8. 【文献心得】Linux 实时化相关

    文章目录 [1]石伟民. 基于ARM9的嵌入式实时linux系统平台构建[D].中北大学,2010. [1]刘涛. 一种嵌入式实时Linux的设计与实现[D].电子科技大学,2007. [1]朱春飞. ...

  9. linux 实时时钟(RTC)驱动【转】

    本文转载自:http://blog.csdn.net/yaozhenguo2006/article/details/6820218 这个是linux内核文档关于rtc实时时钟部分的说明,此文档主要描述 ...

最新文章

  1. 机器人产业这些领域大有可为
  2. c语言 生成大素数,C语言实现寻找大素数
  3. 分布式事务中的CAP理论
  4. vscode安装和使用
  5. mysql中union 查询
  6. 蓝色营销型中央空调设备系统类网站源码 大型制冷设备网站织梦模板
  7. 减少HTTP请求之合并图片详解(大型网站优化技术)
  8. H5新增特性之语义化标签
  9. 数据安全:通过Oracle的基本函数实现简单加密脱敏函数
  10. 历史首次!中国联通、中国电信组队了,只为达成这个目的
  11. H.264简单码流分析
  12. MAPZONE GIS SDK接入Openlayers3之二——空间参考扩展
  13. 影视小程序v20首发源码
  14. 镭神智能C32 ROS Rviz使用教程
  15. 四川江安戏剧“青年训练营”:播撒颗颗戏剧种子
  16. .Net Core 阿里云短信服务Demo
  17. sketch如何在手机中预览
  18. dcb在c语言哪个文件,DCB 文件扩展名: 它是什么以及如何打开它?
  19. 第三章 使用多维存储(全局变量)(二)
  20. Cluster analysis :Basic Concepts and Algorithms -- Part 5 Cluster Evalation

热门文章

  1. Educational Codeforces Round 39 F Largest Beautiful Number
  2. Java - Thinking in Java 第2章 一切都是对象
  3. 插件 KSImageNamed 用图片时自动显示图片缩略图
  4. 当一个GameObject有两个Collider组件时,Physics Material不起作用
  5. 将 PAGE_VERIFY 数据库选项设置为 CHECKSUM
  6. 列出所有子集----------2013年1月3日
  7. 使用U盘引导安装CentOS操作系统
  8. 扩展CheckBoxList实现选中绑定
  9. 计算机应用基础图表填空,计算机应用基础填空题.doc
  10. 3d打印英语文献_DMD 激光熔覆3D打印机型设计在仿真计算中的经验分享