cpu亲和力总结taskset和setcpu及其他相关

分类: linux c 开发工具使用技巧 2013-09-16 11:23 3987人阅读 评论(0) 收藏 举报

目录(?)[+]

一:taskset -- 获取或指定进程运行的CPU.

man taskset出现
CPU affinity is a scheduler property that "bonds" a process to a given set of CPUs on the system. The Linux scheduler will honor the given CPU affinity and the process will not run on any other CPUs. Note that the Linux scheduler also supports natural CPU affinity:
翻译:
taskset设定cpu亲和力,cpu亲和力是指
CPU调度程序属性关联性是“锁定”一个进程,使他只能在一个或几个cpu线程上运行。  对于一个给定的系统上设置的cpu。给定CPU亲和力和进程不会运行在任何其他CPU。  注意,Linux调度器还支持自然CPU关联:(不能让这个cpu只为这一个进程服务)
这里要注意的是我们可以把某个程序限定在某一些CPU上运行,但这并不意味着该程序可以独占这些CPU,其实其他程序还是可以利用这些CPU运行。如果要精确控制CPU,taskset就略嫌不足,cpuset才是可以

-a, --all-tasks 操作所有的任务线程-p, --pid 操作已存在的pid-c, --cpu-list 通过列表显示方式设置CPU
(1)指定1和2号cpu运行25718线程的程序
taskset -cp 1,2 25718

(2),让某程序运行在指定的cpu上 taskset -c 1,2,4-7 tar jcf test.tar.gz test
(3)指定在1号CPU上后台执行指定的perl程序
taskset –c 1 nohup perl pi.pl &

二:cpuset编码测试

一个进程的CPU亲合力掩码决定了该进程将在哪个或哪几个CPU上运行.在一个多处理器系统中,设置CPU亲合力的掩码可能会获得更好的性能.一个CPU的亲合力掩码用一个cpu_set_t结构体来表示一个CPU集合,下面的几个宏分别对这个掩码集进行操作: ·CPU_ZERO() 清空一个集合 ·CPU_SET()与CPU_CLR()分别对将一个给定的CPU号加到一个集合或者从一个集合中去掉. ·CPU_ISSET()检查一个CPU号是否在这个集合中.下面两个函数就是用来设置获取线程CPU亲和力状态: ·sched_setaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask) 该函数设置进程为pid的这个进程,让它运行在mask所设定的CPU上.如果pid的值为0,则表示指定的是当前进程,使当前进程运行在mask所设定的那些CPU上.第二个参数cpusetsize是mask所指定的数的长度.通常设定为sizeof(cpu_set_t).如果当前pid所指定的进程此时没有运行在mask所指定的任意一个CPU上,则该指定的进程会从其它CPU上迁移到mask的指定的一个CPU上运行. ·sched_getaffinity(pid_t pid, unsigned int cpusetsize, cpu_set_t *mask) 该函数获得pid所指示的进程的CPU位掩码,并将该掩码返回到mask所指向的结构中.即获得指定pid当前可以运行在哪些CPU上.同样,如果pid的值为0.也表示的是当前进程.

[html] view plaincopy
  1. cpu_set_t的定义
  2. # define __CPU_SETSIZE 1024
  3. # define __NCPUBITS (8 * sizeof (__cpu_mask))
  4. typedef unsigned long int __cpu_mask;
  5. # define __CPUELT(cpu) ((cpu) / __NCPUBITS)
  6. # define __CPUMASK(cpu) ((__cpu_mask) 1 << ((cpu) % __NCPUBITS))
  7. typedef struct
  8. {
  9. __cpu_mask __bits[__CPU_SETSIZE / __NCPUBITS];
  10. } cpu_set_t;
  11. # define __CPU_ZERO(cpusetp) \
  12. do { \
  13. unsigned int __i; \
  14. cpu_set_t *__arr = (cpusetp); \
  15. for (__i = 0; __i < sizeof (cpu_set_t) / sizeof (__cpu_mask); ++__i) \
  16. __arr->__bits[__i] = 0; \
  17. } while (0)
  18. # define __CPU_SET(cpu, cpusetp) \
  19. ((cpusetp)->__bits[__CPUELT (cpu)] |= __CPUMASK (cpu))
  20. # define __CPU_CLR(cpu, cpusetp) \
  21. ((cpusetp)->__bits[__CPUELT (cpu)] &= ~__CPUMASK (cpu))
  22. # define __CPU_ISSET(cpu, cpusetp) \
  23. (((cpusetp)->__bits[__CPUELT (cpu)] & __CPUMASK (cpu)) != 0)

上面几个宏与函数的具体用法:

[html] view plaincopy
  1. cpu.c
  2. #include<stdlib.h>
  3. #include<stdio.h>
  4. #include<sys/types.h>
  5. #include<sys/sysinfo.h>
  6. #include<unistd.h>
  7. #define __USE_GNU
  8. #include<sched.h>
  9. #include<ctype.h>
  10. #include<string.h>
  11. int main(int argc, char* argv[])
  12. {
  13. int num = sysconf(_SC_NPROCESSORS_CONF);
  14. int created_thread = 0;
  15. int myid;
  16. int i;
  17. int j = 0;
  18. cpu_set_t mask;
  19. cpu_set_t get;
  20. if (argc != 2)
  21. {
  22. printf("usage : ./cpu num\n");
  23. exit(1);
  24. }
  25. myid = atoi(argv[1]);
  26. printf("system has %i processor(s). \n", num);
  27. CPU_ZERO(&mask);
  28. CPU_SET(myid, &mask);
  29. if (sched_setaffinity(0, sizeof(mask), &mask) == -1)
  30. {
  31. printf("warning: could not set CPU affinity, continuing...\n");
  32. }
  33. while (1)
  34. {
  35. CPU_ZERO(&get);
  36. if (sched_getaffinity(0, sizeof(get), &get) == -1)
  37. {
  38. printf("warning: cound not get cpu affinity, continuing...\n");
  39. }
  40. for (i = 0; i < num; i++)
  41. {
  42. if (CPU_ISSET(i, &get))
  43. {
  44. printf("this process %d is running processor : %d\n",getpid(), i);
  45. }
  46. }
  47. }
  48. return 0;
  49. }

下面是在两个终端分别执行了./cpu 0 ./cpu 2 后得到的结果. 效果比较明显.

QUOTE:
 
Cpu0  :  5.3%us,  5.3%sy,  0.0%ni, 87.4%id,  0.0%wa,  0.0%hi,  2.0%si,  0.0%st
Cpu1  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu2  :  5.0%us, 12.2%sy,  0.0%ni, 82.8%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Cpu3  :  0.0%us,  0.0%sy,  0.0%ni,100.0%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st

在我的机器上sizeof(cpu_set_t)的大小为128,即一共有1024位.第一位代表一个CPU号.某一位为1则表示某进程可以运行在该位所代表的cpu上.

例如CPU_SET(1, &mask);

则mask所对应的第2位被设置为1. 
此时如果printf("%d\n", mask.__bits[0]);就打印出2.表示第2位被置为1了. 
具体我是参考man sched_setaffinity文档中的函数的. 
然后再参考了一下IBM的 developerWorks上的一个讲解.

三:,使用nice和renice设置程序执行的优先级

格式:nice [-n 数值] 命令nice 指令可以改变程序执行的优先权等级。指令让使用者在执行程序时,指定一个优先等级,称之为 nice 值。 这个数值从最高优先级的-20到最低优先级的19。负数值只有 root 才有权力使。 一般使用者,也可使用 nice 指令來做执行程序的优先级管理,但只能将nice值越调越高。可以通过二种方式来给某个程序设定nice值:
1,开始执行程序时给定一个nice值,用nice命令 2,调整某个运行中程序的PID的nice值,用renice命令 通常通过调高nice值来备份,为的是不占用非常多的系统资源。例:
nice -n 10 tar zcf test.tar.gz test
由nice启动的程序,其子进程会继承父进程的nice值。查看nice值
# nice -n -6 vim test.txt &
# ps -l F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
4 S 0 19427 2637 0 75 0 – 16551 wait pts/6 00:00:00 bash
4 T 0 21654 19427 0 71 -6 – 23464 finish pts/6 00:00:00
vimrenice调整运行中程序的nice值 格式:renice [nice值] PID

四,使用ulimit限制cpu占用时间

注意,ulimit 限制的是当前shell进程以及其派生的子进程。因此可以在脚本中调用ulimit来限制cpu使用时间。 例如,限制tar的cpu占用时间,单位秒。
# cat limit_cpu.sh ulimit -SHt 100 tar test.tar.gz test如果tar占用时间超过了100秒,tar将会退出,这可能会导致打包不完全,因此不推荐使用ulimit对cpu占用时间进行限制。 另外,通过修改系统的/etc/security/limits配置文件,可以针对用户进行限制。

五。 使用程序自带的对cpu使用调整的功能

某些程序自带了对cpu使用调整的功能,比如nginx服务器,通过其配置文件,可以为工作进程指定cpu,如下:
worker_processes 3;
worker_cpu_affinity 0001 0010 0100 1000;
这里0001 0010 0100 1000是掩码,分别代表第1、2、3、4颗cpu核心,这就使得cpu的使用比较平均到每个核心上。

[html] view plaincopy

六:查看cpu状态

1,可以使用mpstat指令,UNIX系统下,mpstat有相当完备的选项可供使用,而在笔者的REDHAT AS5中,mpstat只有区区-P选项。以下是笔者运行mpstat –P ALL的截图,可以看到各个CPU的运行情况。
[kxu@nothung MovieInfo]$ mpstat -P ALL
Linux 2.6.18-8.el5 (nothung.localdomain) 02/03/2008
10:50:43 PM CPU %user %nice %sys %iowait %irq %soft %steal %idle intr/s
10:50:43 PM all 32.82 0.00 4.73 0.10 0.00 0.13 0.00 62.22 1035.82
10:50:43 PM 0 26.73 0.00 3.96 0.08 0.00 0.13 0.00 69.08 141.13

2,top,然后输入“1”,查看cpu状态输入大写“H”,查看程序的线程信息

七:写高并发量程序是需要注意问题

系统调用是许多开发人员经常忽视的障碍。影响可扩展性的 2 种最常见的意外调用是 malloc 和 gettimeofday。malloc 调用会遇到它里面的锁,它可序列化调用者和执行。如果线程分配 1 个大型内存块,然后运行较长时间,那么该费用就没那么急需。使用更高效的内存分配器,顺畅运行多次调用 malloc 的应用。英特尔线程构建模块包括可为该目的而极致扩展的内存分配调用。其它可用的第三方内存分配库也可比 malloc 表现出色。在第二个示例中,当 200 多条线程同时调用 gettimeofday,它也可能像顺序区域一样运行。只有一条线程调用 gettimeofday。使用本地计时器在线程内计时。可通过配置使 gettimeofday 调用恢复本地内核计数器或全局处理器计数器,该技巧假设它正利用全局处理器而非本地内核 tsc 计数器。考虑其它可能成为障碍的系统调用和库,使用替代选项或尽可能不使用它们。

cpu缓存相关网站介绍

http://software.intel.com/zh-cn/articles/optimization-and-performance-tuning-for-intel-xeon-phi-coprocessors-part-1-optimization

http://www.cnblogs.com/yanlingyin/archive/2012/02/15/thinkingincache.html

cpu亲和力总结taskset和setcpu及其他相关相关推荐

  1. Linux线程性能分析和CPU亲和力

    一,线程迁移和负载均衡 Linux系统在多核CPU和SMP系统上有完善的负载均衡支持.在SMP系统中,每个CPU的核都有一个迁移线程守护程序migration(一般是系统最高优先级139,实时99), ...

  2. 设置cpu亲和性_如何快速设置一个任务的CPU亲和力?

    设置cpu亲和性 How to set one task's CPU affinity quickly? 如何快速设置一个任务的CPU亲和力? 1, Get this task's ID 1,获取此任 ...

  3. linux c设置cpu亲和力,关于多线程:如何设置特定pthread的CPU亲和力?

    我想指定特定pthread的cpu亲和力. 到目前为止,我发现的所有引用都涉及设置进程(pid_t)而不是线程(pthread_t)的cpu亲和力. 我尝试了一些传递pthread_t的实验,并且按预 ...

  4. Unix/Linux编程:CPU亲和力

    CPU亲和力 当一个进程在一个多处理器系统上被重新调度时无需在上一次执行的CPU上运行.之所以会在另一个CPU上运行的原因是原来的CPU处于忙碌状态. 进程切换CPU时对性能会有一定的影响:如果在原来 ...

  5. Nginx运行CPU亲和力

    Nginx运行CPU亲和力 1.Nginx运行工作进程数量 Nginx运行工作进程个数一般设置CPU的核心或者核心数x2.如果不了解cpu的核数,可以top命令之后按1看出来,也可以查看/proc/c ...

  6. Linux cpu亲和力

    最近在对项目进行性能优化,由于在多核平台上,所以了解了些进程.线程绑定cpu核的问题,在这里将所学记录一下. 不管是线程还是进程,都是通过设置亲和性(affinity)来达到目的.对于[进程]的情况, ...

  7. Linux设置进程CPU亲和力(核心绑定)

    文章目录 1. 获取CPU核数 2. 线程绑定CPU核心 ① 概念 ② 函数 ③ 例子 1. 获取CPU核数 int CPU_NUM = sysconf(_SC_NPROCESSORS_CONF); ...

  8. Electron中通过process进程对象的api获取CPU、系统位数、环境变量等相关信息

    场景 用HTML和CSS和JS构建跨平台桌面应用程序的开源库Electron的介绍以及搭建HelloWorld: https://blog.csdn.net/BADAO_LIUMANG_QIZHI/a ...

  9. 关于使用WindowsUpdate 或 Windows 自动升级时碰到的 svchost.exe 进程 CPU 资源占用过高的问题的相关信息...

    当你使用 WindowsUpdate 或 Windows 自动升级的时候,可能会碰到 svchost.exe 进程CPU占用100%的现象.如果你的现象符合下面的相关症状,请安装一个补丁程序用于缓解这 ...

  10. Qt windows下获取CPU、主板、硬盘、网卡等相关信息

    首先磁盘ID和磁盘序列号是不一样的,磁盘的一些相关信息可通过以下方式获取 查看步骤,右键我的电脑---->选择属性---->选择设备管理器---->展开磁盘驱动器    就可以看到磁 ...

最新文章

  1. windows中PyCharm的安装和使用
  2. angularJS学习笔记一
  3. vs2013编译apr时遇到的疑难杂症
  4. 自学Java5.19
  5. java 动态转换器,Java 编程的动态性,第 5 部分: 动态转换类
  6. python安装requests库超时_【Python 库】requests 详解超时和重试
  7. iPhone 14不会全部采用挖孔屏 仅两款Pro版采用
  8. CRM运维工程师主要职责
  9. LT8619B 产品功能概述 HDMI1080P转BT1120
  10. 21年11月第二周 力扣每日一题记录
  11. 计算机中什么是数组公式,EXCEL中数组的应用:什么是函数公式,什么是数组公式...
  12. Nuxt入门到打包部署 Vue-SSR项目
  13. python控制键盘输入_神技能:Python控制键盘鼠标
  14. Ubuntu 安装uwsgi出错
  15. 计算机毕业设计ssm东湖爱心系统的众筹设计和实现t4a84系统+程序+源码+lw+远程部署
  16. 解决Ubuntu系统下启动root账户后Linux版本edge浏览器无法启动
  17. 30天自制操作系统 导读
  18. 利用aboboo,轻听app等软件以及通过看美剧方式学习英语
  19. windows 7 共享文件夹
  20. ABP官方文档(四十九)【集成EntityFramework】

热门文章

  1. 性能测试入门(一):性能测试中的各项指标告诉我们什么
  2. 用户界面组件-菜单(Menus)
  3. 拯救者Y7000电脑一直呼呼呼 声音很大的解决办法
  4. 【图文测评】小智的服务器亲测
  5. sphinx(附demo)
  6. Jupyter Notebook又一懒人神器,拖拽生成Python代码!
  7. 一文读懂 delete和delete[ ]
  8. 矿大计算机学院的周裕浩,2019年“中国矿业大学优秀创新硕士奖学金”评选结果...
  9. 为什么有人劝别选计算机专业?
  10. Qt设计精美的登录注册界面(包含SQLite数据库应用)