昨天在群里有朋友问:把进程绑定到某个 CPU 上运行是怎么实现的。

首先,我们先来了解下将进程与 CPU 进行绑定的好处。

进程绑定 CPU 的好处:在多核 CPU 结构中,每个核心有各自的L1、L2缓存,而L3缓存是共用的。如果一个进程在核心间来回切换,各个核心的缓存命中率就会受到影响。相反如果进程不管如何调度,都始终可以在一个核心上执行,那么其数据的L1、L2 缓存的命中率可以显著提高。

所以,将进程与 CPU 进行绑定可以提高 CPU 缓存的命中率,从而提高性能。而进程与 CPU 绑定被称为:CPU 亲和性

设置进程的 CPU 亲和性

前面介绍了进程与 CPU 绑定的好处后,现在来介绍一下在 Linux 系统下怎么将进程与 CPU 进行绑定的(也就是设置进程的 CPU 亲和性)。

Linux 系统提供了一个名为 sched_setaffinity 的系统调用,此系统调用可以设置进程的 CPU 亲和性。我们来看看 sched_setaffinity 系统调用的原型:

int sched_setaffinity(pid_t pid, size_t cpusetsize, const cpu_set_t *mask);

下面介绍一下 sched_setaffinity 系统调用各个参数的作用:

  • pid:进程ID,也就是要进行绑定 CPU 的进程ID。

  • cpusetsize:mask 参数所指向的 CPU 集合的大小。

  • mask:与进程进行绑定的 CPU 集合(由于一个进程可以绑定到多个 CPU 上运行)。

参数 mask 的类型为 cpu_set_t,而 cpu_set_t 是一个位图,位图的每个位表示一个 CPU,如下图所示:

例如,将 cpu_set_t 的第0位设置为1,表示将进程绑定到 CPU0 上运行,当然我们可以将进程绑定到多个 CPU 上运行。

我们通过一个例子来介绍怎么通过 sched_setaffinity 系统调用来设置进程的 CPU 亲和性:

#define _GNU_SOURCE
#include <sched.h>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>int main(int argc, char **argv)
{cpu_set_t cpuset;CPU_ZERO(&cpuset);    // 初始化CPU集合,将 cpuset 置为空CPU_SET(2, &cpuset);  // 将本进程绑定到 CPU2 上// 设置进程的 CPU 亲和性if (sched_setaffinity(0, sizeof(cpuset), &cpuset) == -1) {printf("Set CPU affinity failed, error: %s\n", strerror(errno));return -1; }return 0;
}

CPU 亲和性实现

知道怎么设置进程的 CPU 亲和性后,现在我们来分析一下 Linux 内核是怎样实现 CPU 亲和性功能的。

本文使用的 Linux 内核版本为 2.6.23

Linux 内核为每个 CPU 定义了一个类型为 struct rq 的 可运行的进程队列,也就是说,每个 CPU 都拥有一个独立的可运行进程队列。

一般来说,CPU 只会从属于自己的可运行进程队列中选择一个进程来运行。也就是说,CPU0 只会从属于 CPU0 的可运行队列中选择一个进程来运行,而绝不会从 CPU1 的可运行队列中获取。

所以,从上面的信息中可以分析出,要将进程绑定到某个 CPU 上运行,只需要将进程放置到其所属的 可运行进程队列 中即可。

下面我们来分析一下 sched_setaffinity 系统调用的实现,sched_setaffinity 系统调用的调用链如下:

sys_sched_setaffinity()
└→ sched_setaffinity()└→ set_cpus_allowed()└→ migrate_task()

从上面的调用链可以看出,sched_setaffinity 系统调用最终会调用 migrate_task 函数来完成进程与 CPU 进行绑定的工作,我们来分析一下 migrate_task 函数的实现:

static int
migrate_task(struct task_struct *p, int dest_cpu, struct migration_req *req)
{struct rq *rq = task_rq(p);// 情况1:// 如果进程还没有在任何运行队列中// 那么只需要将进程的 cpu 字段设置为 dest_cpu 即可if (!p->se.on_rq && !task_running(rq, p)) {set_task_cpu(p, dest_cpu);return 0;}// 情况2:// 如果进程已经在某一个 CPU 的可运行队列中// 那么需要将进程从之前的 CPU 可运行队列中迁移到新的 CPU 可运行队列中// 这个迁移过程由 migration_thread 内核线程完成// 构建进程迁移请求init_completion(&req->done);req->task = p;req->dest_cpu = dest_cpu;list_add(&req->list, &rq->migration_queue);return 1;
}

我们先来介绍一下 migrate_task 函数各个参数的意义:

  • p:要设置 CPU 亲和性的进程描述符。

  • dest_cpu:绑定的 CPU 编号。

  • req:进程迁移请求对象(下面会介绍)。

所以,migrate_task 函数的作用就是将进程描述符为 p 的进程绑定到编号为 dest_cpu 的目标 CPU 上。

migrate_task 函数主要分两种情况来将进程绑定到某个 CPU 上:

  • 情况1:如果进程还没有在任何 CPU 的可运行队列中(不可运行状态),那么只需要将进程描述符的 cpu 字段设置为 dest_cpu 即可。当进程变为可运行时,会根据进程描述符的 cpu 字段来自动放置到对应的 CPU 可运行队列中。

  • 情况2:如果进程已经在某个 CPU 的可运行队列中,那么需要将进程从之前的 CPU 可运行队列中迁移到新的 CPU 可运行队列中。迁移过程由 migration_thread 内核线程完成,migrate_task 函数只是构建一个进程迁移请求,并通知 migration_thread 内核线程有新的迁移请求需要处理。

而进程迁移过程由 __migrate_task 函数完成,我们来看看 __migrate_task 函数的实现:

static int
__migrate_task(struct task_struct *p, int src_cpu, int dest_cpu)
{struct rq *rq_dest, *rq_src;int ret = 0, on_rq;...rq_src = cpu_rq(src_cpu);    // 进程所在的原可运行队列rq_dest = cpu_rq(dest_cpu);  // 进程希望放置的目标可运行队列...on_rq = p->se.on_rq;  // 进程是否在可运行队列中(可运行状态)if (on_rq)deactivate_task(rq_src, p, 0);  // 把进程从原来的可运行队列中删除set_task_cpu(p, dest_cpu);if (on_rq) {activate_task(rq_dest, p, 0);   // 把进程放置到目标可运行队列中...}...return ret;
}

__migrate_task 函数主要完成以下两个工作:

  • 把进程从原来的可运行队列中删除。

  • 把进程放置到目标可运行队列中。

其工作过程如下图所示(将进程从 CPU0 的可运行队列迁移到 CPU3 的可运行队列中):

如上图所示,进程原本在 CPU0 的可运行队列中,但由于重新将进程绑定到 CPU3,所以需要将进程从 CPU0 的可运行队列迁移到 CPU3 的可运行中。

迁移过程首先将进程从 CPU0 的可运行队列中删除,然后再将进程插入到 CPU3 的可运行队列中。

当 CPU 要运行进程时,首先从它所属的可运行队列中挑选一个进程,并将此进程调度到 CPU 中运行。

总结

从上面的分析可知,其实将进程绑定到某个 CPU 只是将进程放置到 CPU 的可运行队列中。

由于每个 CPU 都有一个可运行队列,所以就有可能会出现 CPU 间可运行队列负载不均衡问题。如 CPU0 可运行队列中的进程比 CPU1 可运行队列多非常多,从而导致 CPU0 的负载非常高,而 CPU1 负载非常低的情况。

当出现上述情况时,就需要对 CPU 间的可运行队列进行重平衡操作,有兴趣的可以自行阅读源码或参考相关资料。


推荐阅读:

专辑|Linux文章汇总

专辑|程序人生

专辑|C语言

我的知识小密圈

关注公众号,后台回复「1024」获取学习资料网盘链接。

欢迎点赞,关注,转发,在看,您的每一次鼓励,我都将铭记于心~

嵌入式Linux

微信扫描二维码,关注我的公众号

一文读懂 | 进程怎么绑定 CPU相关推荐

  1. 从根上理解高性能、高并发(七):深入操作系统,一文读懂进程、线程、协程

    本文引用了"一文读懂什么是进程.线程.协程"一文的主要内容,感谢原作者的无私分享. 1.系列文章引言 1.1 文章目的 作为即时通讯技术的开发者来说,高性能.高并发相关的技术概念早 ...

  2. 一文读懂 | 进程并发与同步

    并发 是指在某一时间段内能够处理多个任务的能力,而 并行 是指同一时间能够处理多个任务的能力.并发和并行看起来很像,但实际上是有区别的,如下图(图片来源于网络): concurrency-parall ...

  3. 一文读懂 | CPU负载均衡实现

    在<一文读懂 | 进程怎么绑定 CPU>这篇文章中介绍过,在 Linux 内核中会为每个 CPU 创建一个可运行进程队列,由于每个 CPU 都拥有一个可运行进程队列,那么就有可能会出现每个 ...

  4. 腾讯资深架构师干货总结:一文读懂大型分布式系统设计的方方面面

    1.引言 我们常常会听说,某个互联网应用的服务器端系统多么牛逼,比如QQ.微信.淘宝.那么,一个大型互联网应用的服务器端系统,到底牛逼在什么地方?为什么海量的用户访问,会让一个服务器端系统变得更复杂? ...

  5. 一文读懂 Linux 内存分配全过程

    在<你真的理解内存分配>一文中,我们介绍了 malloc 申请内存的原理,但其在内核怎么实现的呢?所以,本文主要分析在 Linux 内核中对堆内存分配的实现过程. 本文使用 Linux 2 ...

  6. 人工智能(8)---一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用

    一文读懂人工智能产业链:基础技术.人工智能技术及人工智能应用 概要:针对人工智能产业链,主要有三个核心:基础技术.人工智能技术及人工智能应用,本文将从主要从这三个方面进行梳理 人工智能(Artific ...

  7. DDD - 一文读懂DDD领域驱动设计

    一文读懂DDD领域驱动设计 1. 领域驱动设计简介 1.1 什么是领域驱动设计 1.2 为什么要用领域驱动设计 优点 缺点 2.3 领域驱动设计过程 2. 对于DDD,我们需要学习什么? 2.1 DD ...

  8. 即时通讯新手入门:一文读懂什么是Nginx?它能否实现IM的负载均衡?

    本文引用了"蔷薇Nina"的"Nginx 相关介绍(Nginx是什么?能干嘛?)"一文部分内容,感谢作者的无私分享. 1.引言 Nginx(及其衍生产品)是目前 ...

  9. “一文读懂“系列:Android中的硬件加速

    浅谈 前几天有个朋友问我"了不了解关于手机硬件加速方面的知识?",嗯?其实我也想知道... 于是笔者就去网上搜罗了文章再结合自己对源码的理解,总结了这篇关于硬件加速的理解. 关于屏 ...

最新文章

  1. adc0808温度换算公式_温湿度传感器的三种模拟量换算关系
  2. [SimplePlayer] 4. 从视频文件中提取音频
  3. word-wrap: break-word; break-word: break-all;区别
  4. Robotium todolist.test.testcases.logout
  5. ADC0832程序完整版 源码+Proteus仿真
  6. ZeptoN正在将程序放入Java
  7. [转+整理]十道海量数据处理面试题与十个方法大总结
  8. 框架详解_Qt开发技术:QtCharts(一)QtCharts基本介绍以及图表框架详解
  9. Multiple CPUs,Multiple Cores、Hyper-Threading
  10. 【跃迁之路】【523天】程序员高效学习方法论探索系列(实验阶段280-2018.07.13)...
  11. python循环语句总结
  12. vue 浏览器地址是ip_Vue实战041:获取当前客户端IP地址详解(内网和外网)
  13. Bex5文档服务器,WeX5/BeX5 UIServer的缓存机制
  14. Golang六款优秀Web框架对比
  15. 泰勒公式的展开细节解析
  16. 如何避免B端产品失败(近万字解析)
  17. 我就发布个夏泽网注册码
  18. 09-一篇带你熟练使用多线程与原理「Thread」
  19. 中职网络安全2021年国赛Wireshark流量分析题目解析
  20. nodejs在Linux下使用图片相关模块出现Error: write EPIPE

热门文章

  1. linux -- read(), write()
  2. Oracle PL/SQL之LOOP循环控制语句
  3. (一)FlexViewer之整体框架解析
  4. juc线程池原理(六):jdk线程池中的设计模式
  5. ActiveReports 报表应用教程 (8)---交互式报表之动态过滤
  6. 很多人问为什么使用联合索引,为什么不建两个单独的索引呢?
  7. JSP中forward和include的区别
  8. 用计算机三级处理文件,【题目】计算机三级题目,献给为计算机三级挣扎的同学们...
  9. r语言做断轴_R语言用nls做非线性回归以及函数模型的参数估计
  10. 解决:pycharm运行程序时在Python console窗口中运行 һ����ң�������1�����