为什么要有进程优先级?

这似乎不用过多的解释,毕竟自从多任务操作系统诞生以来,进程执行占用cpu的能力就是一个必须要可以人为控制的事情。因为有的进程相对重要,而有的进程则没那么重要。

进程优先级起作用的方式从发明以来基本没有什么变化,无论是只有一个cpu的时代,还是多核cpu时代,都是通过控制进程占用cpu时间的长短来实现的。

就是说在同一个调度周期中,优先级高的进程占用的时间长些,而优先级低的进程占用的短些。

请大家真的不要混淆了系统中的这两个概念:nice(NI)和priority(PR),他们有着千丝万缕的关系,但对于当前的Linux系统来说,它们并不是同一个概念。

我们看这个命令:

大家是否真的明白其中PRI列NI列的具体含义有什么区别?

同样的,如果是top命令:

大家是否搞清楚了这其中PR值NI值的差别?如果没有,那么我们可以首先搞清楚什么是nice值。

什么是NICE值?

NICE值应该是熟悉Linux/UNIX的人很了解的概念了,它是反应一个进程“优先级”状态的值,其取值范围是-20至19,一共40个级别。

这个值越小,表示进程”优先级”越高,而值越大“优先级”越低。

例如,我们可以通过NICE命令来对一个将要执行的bash命令进行NICE值设置,方法是:

  1. [root@zorrozou-pc0 zorro]# nice -n 10 bash

这样我就又打开了一个bash,并且其nice值设置为10,而默认情况下,进程的优先级应该是从父进程继承来的,这个值一般是0。

我们可以通过nice命令直接查看到当前shell的nice值:

  1. [root@zorrozou-pc0 zorro]# nice
  2. 10

对比一下正常情况:

  1. [root@zorrozou-pc0 zorro]# exit

退出当前nice值为10的bash,打开一个正常的bash,我们查看下其 Nice值:

  1. [root@zorrozou-pc0 zorro]# bash
  2. [root@zorrozou-pc0 zorro]# nice
  3. 0

另外,使用renice命令可以对一个正在运行的进程进行nice值的调整,我们也可以使用比如top、ps等命令查看进程的nice值,具体方法我就不多说了,大家可以参阅相关man page。

需要大家注意的是,我在这里都在使用nice值这一称谓,而非优先级(priority)这个说法。

nice值虽然不是priority,但是它确实可以影响进程的优先级。

在英语中,如果我们形容一个人nice,那一般说明这个人的人缘比较好。什么样的人人缘好?往往是谦让、有礼貌的人。

比如,你跟一个nice的人一起去吃午饭,点了两个一样的饭,先上了一份后,nice的那位一般都会说:“你先吃你先吃!”,这就是人缘好,这人nice!但是如果另一份上的很晚,那么这位nice的人就要饿着了。

这说明什么?

越nice的人抢占资源的能力就越差,而越不nice的人抢占能力就越强。这就是nice值大小的含义,nice值越低,说明进程越不nice,抢占cpu的能力就越强,优先级就越高(作者这个解释太形象了,小编忍不住要手动点赞!!)。

在原来使用O1调度的Linux上,我们还会把nice值叫做静态优先级,这也基本符合nice值的特点,就是当nice值设定好了之后,除非我们用renice去改它,否则它是不变的。

而priority的值在之前内核的O1调度器上表现是会变化的,所以也叫做动态优先级

什么是优先级和实时进程?

我们再来看看什么是priority值,就是ps命令中看到的PRI值或者top命令中看到的PR值。

本文为了区分这些概念,以后:

  • 统一用nice值表示NI值,或者叫做静态优先级,也就是用nice和renice命令来调整的优先级;
  • 而实用priority值表示PRI和PR值,或者叫动态优先级。
  • 我们也统一将“优先级”这个词的概念规定为表示priority值的意思。

在内核中,进程优先级的取值范围是通过一个宏定义的,这个宏的名称是MAX_PRIO,它的值为140。

而这个值又是由另外两个值相加组成的,一个是代表nice值取值范围的NICE_WIDTH宏,另一个是代表实时进程(realtime)优先级范围的MAX_RT_PRIO宏。

说白了就是,Linux实际上实现了140个优先级范围,取值范围是从0-139,这个值越小,优先级越高。nice值的-20到19,映射到实际的优先级范围是100-139。

新产生进程的默认优先级被定义为:

  1. #define DEFAULT_PRIO (MAX_RT_PRIO + NICE_WIDTH / 2)

实际上对应的就是nice值的0。

正常情况下,任何一个进程的优先级都是这个值,即使我们通过nice和renice命令调整了进程的优先级,它的取值范围也不会超出100-139的范围,除非这个进程是一个实时进程,那么它的优先级取值才会变成0-99这个范围中的一个。

这里隐含了一个信息,就是说当前的Linux是一种已经支持实时进程的操作系统。

什么是实时操作系统?

我们就不再这里详细解释其含义以及在工业领域的应用了,有兴趣的可以参考一下实时操作系统的维基百科。

简单来说,实时操作系统需要保证相关的实时进程在较短的时间内响应,不会有较长的延时,并且要求最小的中断延时和进程切换延时。

对于这样的需求,一般的进程调度算法,无论是O1还是CFS都是无法满足的,所以内核在设计的时候,将实时进程单独映射了100个优先级,这些优先级都要高于正常进程的优先级(nice值),而实时进程的调度算法也不同,它们采用更简单的调度算法来减少调度开销。

总的来说,Linux系统中运行的进程可以分成两类:

  • 实时进程
  • 非实时进程

它们的主要区别就是通过优先级来区分的。

所有优先级值在0-99范围内的,都是实时进程,所以这个优先级范围也可以叫做实时进程优先级,而100-139范围内的是非实时进程。

在系统中可以使用chrt命令来查看、设置一个进程的实时优先级状态。我们可以先来看一下chrt命令的使用:

我们先来关注显示出的Policy options部分,会发现系统给各种进程提供了5种调度策略。

但是这里并没有说明的是,这五种调度策略是分别给两种进程用的,对于实时进程可以用的调度策略是:SCHED_FIFO、SCHED_RR,而对于非实时进程则是:SCHED_OTHER、SCHED_OTHER、SCHED_IDLE。

系统的整体优先级策略是:

  • 如果系统中存在需要执行的实时进程,则优先执行实时进程。
  • 直到实时进程退出或者主动让出CPU时,才会调度执行非实时进程。

实时进程可以指定的优先级范围为1-99,将一个要执行的程序以实时方式执行的方法为:

  1. [root@zorrozou-pc0 zorro]# chrt 10 bash
  2. [root@zorrozou-pc0 zorro]# chrt -p $$
  3. pid 14840's current scheduling policy: SCHED_RR
  4. pid 14840's current scheduling priority: 10

可以看到,新打开的bash已经是实时进程,默认调度策略为SCHED_RR,优先级为10。如果想修改调度策略,就加个参数:

  1. [root@zorrozou-pc0 zorro]# chrt -f 10 bash
  2. [root@zorrozou-pc0 zorro]# chrt -p $$
  3. pid 14843's current scheduling policy: SCHED_FIFO
  4. pid 14843's current scheduling priority: 10

刚才说过,SCHED_RR和SCHED_FIFO都是实时调度策略,只能给实时进程设置。对于所有实时进程来说,优先级高的(就是priority数字小的)进程一定会保证先于优先级低的进程执行。

SCHED_RR和SCHED_FIFO的调度策略只有当两个实时进程的优先级一样的时候才会发生作用,其区别也是顾名思义:

SCHED_FIFO

以先进先出的队列方式进行调度,在优先级一样的情况下,谁先执行的就先调度谁,除非它退出或者主动释放CPU。

SCHED_RR

以时间片轮转的方式对相同优先级的多个进程进行处理。时间片长度为100ms。

这就是Linux对于实时进程的优先级和相关调度算法的描述。整体很简单,也很实用。

而相对更麻烦的是非实时进程,它们才是Linux上进程的主要分类。对于非实时进程优先级的处理,我们首先还是要来介绍一下它们相关的调度算法:O1和CFS。

什么是O1调度?

O1调度算法是在Linux 2.6开始引入的,到Linux 2.6.23之后内核将调度算法替换成了CFS。

虽然O1算法已经不是当前内核所默认使用的调度算法了,但是由于大量线上的服务器可能使用的Linux版本还是老版本,所以我相信很多服务器还是在使用着O1调度器,那么费一点口舌简单交代一下这个调度器也是有意义的。

这个调度器的名字之所以叫做O1,主要是因为其算法的时间复杂度是O1。

O1调度器仍然是根据经典的时间片分配的思路来进行整体设计的。

简单来说,时间片的思路就是将CPU的执行时间分成一小段一小段的,假如是5ms一段。于是多个进程如果要“同时”执行,实际上就是每个进程轮流占用5ms的cpu时间,而从1s的时间尺度上看,这些进程就是在“同时”执行的。

当然,对于多核系统来说,就是把每个核心都这样做就行了。而在这种情况下,如何支持优先级呢?

实际上就是将时间片分配成大小不等的若干种,优先级高的进程使用大的时间片,优先级小的进程使用小的时间片。这样在一个周期结速后,优先级大的进程就会占用更多的时间而因此得到特殊待遇。

O1算法还有一个比较特殊的地方是,即使是相同的nice值的进程,也会再根据其CPU的占用情况将其分成两种类型:CPU消耗型和IO消耗性。

典型的CPU消耗型的进程的特点是,它总是要一直占用CPU进行运算,分给它的时间片总是会被耗尽之后,程序才可能发生调度。

比如常见的各种算数运算程序。

而IO消耗型的特点是,它经常时间片没有耗尽就自己主动先释放CPU了。

比如vi,emacs这样的编辑器就是典型的IO消耗型进程。

为什么要这样区分呢?因为IO消耗型的进程经常是跟人交互的进程,比如shell、编辑器等。

当系统中既有这种进程,又有CPU消耗型进程存在,并且其nice值一样时,假设给它们分的时间片长度是一样的,都是500ms,那么人的操作可能会因为CPU消耗型的进程一直占用CPU而变的卡顿。

可以想象,当bash在等待人输入的时候,是不占CPU的,此时CPU消耗的程序会一直运算,假设每次都分到500ms的时间片,此时人在bash上敲入一个字符的时候,那么bash很可能要等个几百ms才能给出响应,因为在人敲入字符的时候,别的进程的时间片很可能并没有耗尽,所以系统不会调度bash程度进行处理。

为了提高IO消耗型进程的响应速度,系统将区分这两类进程,并动态调整CPU消耗的进程将其优先级降低,而IO消耗型的将其优先级变高,以降低CPU消耗进程的时间片的实际长度。

已知nice值的范围是-20-19,其对应priority值的范围是100-139,对于一个默认nice值为0的进程来说,其初始priority值应该是120,随着其不断执行,内核会观察进程的CPU消耗状态,并动态调整priority值,可调整的范围是+-5。

就是说,最高优先级可以被自动调整到115,最低到125。这也是为什么nice值叫做静态优先级,而priority值叫做动态优先级的原因。不过这个动态调整的功能在调度器换成CFS之后就不需要了,因为CFS换了另外一种CPU时间分配方式,这个我们后面再说。

什么是CFS完全公平调度?

O1已经是上一代调度器了,由于其对多核、多CPU系统的支持性能并不好,并且内核功能上要加入cgroup等因素,Linux在2.6.23之后开始启用CFS作为对一般优先级(SCHED_OTHER)进程调度方法。

在这个重新设计的调度器中,时间片,动态、静态优先级以及IO消耗,CPU消耗的概念都不再重要。CFS采用了一种全新的方式,对上述功能进行了比较完善的支持。

其设计的基本思路是:我们想要实现一个对所有进程完全公平的调度器。

又是那个老问题:如何做到完全公平?答案跟上一篇IO调度中CFQ的思路类似:

如果当前有n个进程需要调度执行,那么调度器应该在一个比较小的时间范围内,把这n个进程全都调度执行一遍,并且它们平分cpu时间,这样就可以做到所有进程的公平调度。

那么这个比较小的时间就是任意一个R状态进程被调度的最大延时时间,即:任意一个R状态进程,都一定会在这个时间范围内被调度响应。这个时间也可以叫做调度周期,其英文名字叫做:sched_latency_ns。

CFS的优先级

当然,CFS中还需要支持优先级。在新的体系中,优先级是以时间消耗(vruntime增长)的快慢来决定的。

就是说,对于CFS来说,衡量的时间累积的绝对值都是一样纪录在vruntime中的,但是不同优先级的进程时间增长的比率是不同的,高优先级进程时间增长的慢,低优先级时间增长的快。

比如,优先级为19的进程,实际占用cpu为1秒,那么在vruntime中就记录1s。但是如果是-20优先级的进程,那么它很可能实际占CPU用10s,在vruntime中才会纪录1s。

CFS真实实现的不同nice值的cpu消耗时间比例在内核中是按照“每差一级cpu占用时间差10%左右”这个原则来设定的。

这里的大概意思是说,如果有两个nice值为0的进程同时占用cpu,那么它们应该每人占50%的cpu,如果将其中一个进程的nice值调整为1的话,那么此时应保证优先级高的进程比低的多占用10%的cpu,就是nice值为0的占55%,nice值为1的占45%。那么它们占用cpu时间的比例为55:45。

这个值的比例约为1.25。就是说,相邻的两个nice值之间的cpu占用时间比例的差别应该大约为1.25。根据这个原则,内核对40个nice值做了时间计算比例的对应关系,它在内核中以一个数组存在:

多CPU的CFS调度是怎样的?

在上面的叙述中,我们可以认为系统中只有一个CPU,那么相关的调度队列只有一个。

实际情况是系统是有多核甚至多个CPU的,CFS从一开始就考虑了这种情况,它对每个CPU核心都维护一个调度队列,这样每个CPU都对自己的队列进程调度即可。

这也是CFS比O1调度算法更高效的根本原因:每个CPU一个队列,就可以避免对全局队列使用大内核锁,从而提高了并行效率。

当然,这样最直接的影响就是CPU之间的负载可能不均,为了维持CPU之间的负载均衡,CFS要定期对所有CPU进行load balance操作,于是就有可能发生进程在不同CPU的调度队列上切换的行为。

这种操作的过程也需要对相关的CPU队列进行锁操作,从而降低了多个运行队列带来的并行性。

不过总的来说,CFS的并行队列方式还是要比O1的全局队列方式要高效。尤其是在CPU核心越来越多的情况下,全局锁的效率下降显著增加。

最后

本文的目的是从Linux系统进程的优先级为出发点,通过了解相关的知识点,希望大家对系统的进程调度有个整体的了解。

其中,我们也对CFS调度算法进行了比较深入的分析。在我的经验来看,这些知识对我们在观察系统的状态和相关优化的时候都是非常有用的。

比如在使用top命令的时候,NI和PR值到底是什么意思?类似的地方还有ps命令中的NI和PRI值、ulimit命令-e和-r参数的区别等等。当然,希望看完本文后,能让大家对这些命令显示的了解更加深入。

除此之外,我们还会发现,虽然top命令中的PR值和ps -l命令中的PRI值的含义是一样的,但是在优先级相同的情况下,它们显示的值确不一样。

转载于:https://www.cnblogs.com/lcword/p/8267342.html

Linux的进程优先级NI和PR相关推荐

  1. 【linux】进程优先级、nice系统中的nice值和nice time,top中的PR和ps中的PRI

    出处:https://blog.csdn.net/u010317005/article/details/80531985 linux内核目前实现了6中调度策略(即调度算法), 用于对不同类型的进程进行 ...

  2. 【Linux】进程优先级PRI NI/并行与并发的概念

    文章目录 基本概念 为什么会有优先级? 如何查看进程优先级? PRI and NI 如何更改进程优先级? 优先级vs权限 并行与并发的概念 基本概念 CPU资源分配的先后顺序,就是指进程的优先权(pr ...

  3. Linux下的top命令PR,NI,VIRT,RES,SHR,S的解释

    今天在观察服务器运行情况的时候用top命令看我的程序是否在运行,一般只关心内存,CPU这些参数,但是它还有很多的参数,我们一起来看看其他的参数都是什么意思. VIRT:Virtual memory u ...

  4. 一文辨析,性能分析top命令中进程NI和PR

    ✒️分析 Linux 服务器性能,首先想到的命令肯定是 top, 通过它,我们可以看到当前服务器资源使用情况和进程运行资源占用情况. 在查看进程资源占用情况时,有两列大家是最难区分,PR(priori ...

  5. 【Linux】进程优先级PRI

    文章目录 基本概念 PRI vs NI 调整进程优先级-调整nice值:top 基本概念 进程的优先级,就是CPU资源分配的先后顺序. 使用ps -l会输出: UID:代表执行者的身份 PID:代表这 ...

  6. Linux改变进程优先级的nice命令

    前言: VPS普遍性能不高,很多人可能有这样一个感受,在执行du.tar等命令时,会造成系统负载飙升,Apache响应缓慢.这时nice命令改变进程优先级可能能缓解这种状况.nice命令用于调整Lin ...

  7. linux修改进程优先级

    1. 非实时 NI 是优先值,是用户层面的概念, PR是进程的实际优先级, 是给内核(kernel)看(用)的. 一般情况下,PR=NI+20, 如果一个进程的优先级PR是20, 那么它的NI(nic ...

  8. linux中进程优先级,linux下调整进程优先级

    linux下调整进程优先级 进程的优先级决定了进程是否优先被cpu分配资源进行处理. 在cpu资源十分充足时,每个正在运行的进程都能分配到足够的资源进行处理,此时调整进程的优先级是没有什么意义的: 如 ...

  9. linux设置进程优先级,Linux线程属性及优先级设置

    POSIX.1线程属性及优先级设置 By zieckey All Right Reserved 线程的属性由pthread_attr_t结构类型表示. 在使用pthread_attr_t之前,需要调用 ...

最新文章

  1. 控制系统设计_PLC自动化控制系统设计基本原则
  2. OpenMP入门教程
  3. MVC3 在提交表单以后 return View(model) 页面不会根据model的内容更新表单
  4. JAVA实验——Java的基本程序设计结构
  5. ZfNet解卷积:可视化CNN模型( PythonCode可视化Cifar10)
  6. C++11列表初始化
  7. Linux 统计文件行数,字节数。
  8. Exchange邮箱的创建与配置
  9. 音乐节拍自动标记插件 BeatEdit
  10. Dreamweaver cc 2019
  11. 腾讯下载的视频怎么转换成mp4格式
  12. 读写锁就是恶霸和良民一起桑拿
  13. 游戏编程该读哪些书?
  14. c语言万年历怎么加节日,C语言万年历
  15. 十、【Vue-Router】两个新生命周期钩子 activated/deactivated
  16. github史上最全教程
  17. Windows下cmd进入MySql的命令界面
  18. PHM2010刀具磨损数据集分享
  19. ecshop smarty php,ecshop的smarty基础普及知识
  20. java 复数_java 中实现复数的加减

热门文章

  1. 使用DynamicObject的自定义动态行为
  2. 使用ASP.NET Web API构建Restful API
  3. matlab 散点 面,求大神指点绘制空间内散点图的包络面,,,散点程序如下
  4. java number 转 long_Java Number.longValue()用法及代码示例
  5. java 重复代码优化_利用注解 + 反射消除重复代码(Java项目)
  6. python字符串转换元组_python 字符串,列表,元组,字典相互转换
  7. java 创建日程到期提醒_晓日程 微信日历加桌面日历,规划时间,掌握未来
  8. mac xampp连接mysql数据库_在mac上如何使用终端打开XAMPP自带的MySQL
  9. linux mysql 6.0.4 启动_CentOS 6.0之MySQL+FreeRadiu实现帐号统一认证
  10. 折线图 放大_第二个折线图(Line Plot)的示例代码