版权所有:

原文名称:《Linux Performance and Tuning Guidelines》

原文地址:http://www.redbooks.ibm.com/abstracts/redp4285.html

-------------------------------------------------------------------------------------------

1.1.1 进程是什么?
1.1.2 进程生命周期
1.1.3 线程
1.1.4 进程优先级和Nice值
1.1.5 上下文交换
1.1.6 中断处理
1.1.7 进程状态
1.1.8 进程内存段
1.1.9 CPU调度器

-------------------------------------------------------------------------------------------

进程管理对于任何一个操作系统来说都是最重要的任务之一。高效的进程管理能保证应用平稳有效的运行。linux的进程管理与UNIX十分相似。它包括进程调度、中断处理、信号发送、进程优先级、进程切换、进程状态、进程内存等。在本章节中,我将讨论Linux进程管理的原理。它能帮助你更好的了解Linux内核是怎样管理进程来影响系统性能的。

1.1.1 进程是什么?

 

进程就是执行程序运行在处理器上的一个实例。进程可以使用Linux内核所能控制的任何资源来完成它的任务。所有运行在Linux操作系统上的进程都使用一个名叫task_struct的结构来管理,这个结构亦被称作进程描述符【Process Descriptor】。进程描述符包括进程运行的所有信息如进程ID、进程属性和构建这个进程所需要的资源。如果你清楚进程的结构,就能了解到什么对于 进程执行和效能来说是重要的。图1-2展现了进程结构的概要。

图 1-2 task_struct结构

1.1.2 进程生命周期

每个进程都有自己的生命周期如创建、执行、结束和消除。这些阶段在系统启动运行中会被重复无数次。因此从性能角度来看进程生命周期是极其重要的。图1-3展示进程典型的生命周期

图1-3进程典型的生命周期

当进程创建一个新的进程,创建进程(父进程)发出fork()系统调用。当一个fork()系统调用被发出,它将得到一个关于新进程(子进程)的进 程描述符并设置一个新的进程ID。它会将父进程的进程描述符中所有数据复制到子进程。此时父进程的整个地址空间并没有被复制的,所以父子进程会共享相同的 地址空间。exec()系统调用会复制一个新的程序到子进程的地址空间。因为父子进程共享相同的地址空间,所以当新程序写入数据时会导致分页错误【page fault】的例外发生。这时候内核会分配给子进程一个新的物理分页。这个推迟的操作被叫做写时复制 【Copy On Write】。子进程通常是执行自己的程序,与其父进程所执行的有所不同。这样的操作可以避免没有必要的系统开销,因为复制整个地址空间是一个非常慢而且 效率低的操作,它会消耗很多处理器时间和资源。当程序执行完成时,子进程调用exit()系统调用结束。系统调用exit()会释放进程的大部分数据结构并发送信号通知父进程。此时子进程被称作僵 尸进程 【zombie process】。在子进程使用wait()系统调用让父进程知道其已经结束之前,子进程是不会被清除的。当父进程得到子进程结束的通知后,会立即清除子进程的所有数 据结构并释放进程描述符。

1.1.3 线程

线程是由一个单独进程产生的执行单元。它与同一进程中的其他线程并行运行。它们能共享同一资源如内存、地址空间、打开的文件等。它们能访问同样一组 应用数据。线程也被称作轻量级进程 (Light Weight Process LWP)。因为它们共享资源,线程不可以在同一时间修改它们共享的资源。互斥的实现、锁、序列化等是用户应用的职责。从性能角度来说,创建线程要比创建进程的开销小,因为线程在创建时不需要复制资源。另一方面,进程和线程在调度算法方面上有很多相似的特性。内核在 处理它们时都使用类似的方法。

图1-4 进程和线程

在目前Linux的实现中,线程支持可移植操作系统接口(POSIX)。在Linux操作系统中有几种线程的实现。下面列举几种最常使用的线程实 现。

▶ LinuxThreads

LinuxThreads自从Linux内核2.0就被作为默认的线程实现。但LinuxThread有许多实现与POSIX标准不兼容。 Native POSIX Thread Library(NPTL)正在取代LinuxThreads。在未来的Linux企业发行版中将不在支持LinuxThreads。

▶ Native POSIX Thread Libray(NPTL)本地POSIX线程库

NPTL最初是由Red Hat开发。NPTL与POSIX标准更加兼容。利用2.6内核增强特性如新的系统调用clone()、信号处理实现等,它可以提供较 LinuxThreads更好的性能和伸缩性。

NPTL与LinuxThreads有很多的不兼容之处。一个应用如果依赖于LinuxThreads,可能在NPTL实现中无法工作。

▶ Next Generation POSIX Thread(NGPT)下一代POSIX线程

NGPT是IBM开发的POSIX线程库的版本。目前处于维护阶段,未来也没有开发计划。

使用LD_ASSUME_KERNEL环境变量,你可以设定应用使用哪个线程库。

1.1.4 进程优先级和Nice值

 

进程优先级 【Process priority】是一个数值,用来让CPU根据动态优先级和静态优先级来决定进程执行的顺序。一个高优先级的进程可以获得更多在处理器上运行的机会。内核会根据进程的行为和特性使用试探算法【Heuristic Algorithm】来动态调高和调低动态优先级。用户进程可以通过进程Nice 的 值间接改变静态优先级。静态优先级高的进程可以获得较长的时间片【Time Slice】(进程能运行在处理器有多长时间)。

Linux中Nice值范围为19(最低优先级)到-20(最高优先级),默认值为0。要将Nice值更改为负数,必须通过登录或使用su命令由 root执行。

1.1.5 上下文交换【Context switching】

 

在进程执行过程中,进程信息存储在处理器的寄存器和缓存中。这组为执行中进程而载入寄存器的数据被称作上下文【Context】。 为切换进程,当前执行中进程的上下文会被暂存,下一个执行进程的上下文会被还原到寄存器,进程描述符和内核模式堆栈【Kernel mode stack】的区块会被用来存储上下文,这个交换过程被叫做上下文交换【Context Switching】。发生过多的上下文交换是不好的,因为处理器每次都要刷新寄存器和缓存为新进程让出资源,这会导致性能上的问题。图1-5 说明了上下文交换是怎样工作的。

1.1.6 中断处理

中断处理是优先级最高的任务之一。中断通常是由I/O设备产生的如网卡、键盘、硬盘控制器、串行适配器等。中断控制会向内核发送一个事件通知(如键 盘输入、以太帧到达等),它指示内核中断执行中的进程并尽快处理中断,因为大多数设备需要快速的回应,这对系统性能是很关键的。当一个中断信号到达内核 时,内核必须切换当前执行的进程到处理中断的新进程,这意味着中断会触发上下文交换,因此大量的中断可以导致系统性能的下降。

在Linux中,有两种类型的中断。一种为硬中断 【Hard Interrupt】,是由需要回应的设备产生的(硬盘I/O中断、网络适配器中断,键盘中断,鼠标中断)。另一种为软中断 【Soft Interrupt】,用于可以延后执行的任务(TCP/IP操作,SCSI协议操作等)。你可以在/proc/interrupts 中 查看到有关硬中断的信息。

在多处理器环境下,每个处理器都可以用来处理中断。将中断绑定到某一个物理处理可以提升系统的性能。要了解更详细的内容,请参考4.4.2“关于中 断处理的CPU亲和力【CPU Affinity】”。

1.1.7 进程状态

每个进程都有它自己的状态,来显示进程当前的情况。在进程执行过程中其状态会发生变化。可能状态有如下几种:

▶ TASK_RUNNING【运行中】

此状态表示进程正运行在CPU上或在队列中等待运行(运行队列【Run Queue】)。

▶ TASK_STOPPED【停止】

当进程接收到某些信号(例如SIGINT、SIGSTOP)后被暂停就处于此种状态,该等待的进程在收到恢复信号如SIGCONT后会重新投入运 行。

▶ TASK_INTERRUPTIBLE【可中断】

在这种状态下,进程被暂停运行,等待某些状态的达成。如果一个处于可中断状态的进程收到停止的信号,将变更进程的状态并中断操作。可中断状态进程的 一个典型例子就是等待键盘的输入。

▶ TASK_UNINTERRUPTIBLE【不可中断】

此状态基本上与可中断状态十分相似。但可中断状态进程可以被中断,而向一个不可中断进程发送信号却不会有任何反应。不可中断状态进程的一个典型例子 就是等待硬盘I/O操作。

▶ TASK_ZOMBIE【僵尸】

在进程使用系统调用exit() 退出后,其父进程就会知道。僵尸状态的进程会等待父进程通知其释放所有的数据结 构。

 
图1-6 进程状态

僵尸进程

当一个进程收到信号并已经终止,它通常需要一些时间来完成结束前的所有任务(如关闭打开的文件)。在这个通常很短的时间里,该进程就是一个僵 尸 (Zombie)。

当进程完成所有的关闭任务后,它会向父进程报告其即将终止。但有时僵尸进程并不能将自己终止,在这种情况状态会显示为(Zombie)。

使用kill命令是不可能结束这样一个进程的,因为这个进程被认为已经死掉了。如果你不能清除僵尸,你可以结束其父进程,这样僵尸也会随之消失。然 而如果父进程是init进程,你就不可以结束它,因为init进程是一个极为重要的进程。因此你可能需要重新启动系统来清除这个僵尸进程。

1.1.8 进程内存段

一个进程需要使用自己的内存区域来执行工作。工作的变化随情况和进程用法而定。一个进程可以有不同的工作负载特性和不同的数据大小的需求,进程需要 处理数据的大小多种多样。为了满足这样的需求,Linux内核使用动态内存分配机制。进程内存分配结构如图1-7。

 
图1-7 进程地址空间

进程的内存区有几部分组成

▶ 文字段

用来存储执行代码。

▶ 数据段

数据段由三块区域组成。

― 数据【Data】:存储已初始化数据如静态变量。

― BSS :存储零初始化的数据,数据被初始化为零。

― 堆【Heap】:这块区域由malloc()用来按需要分配动态内存。堆向高地址扩张。

▶ 堆栈段

用来存储本地变量、函数参数、函数返回地址。堆栈段向低地址扩张。

使用pmap 命令可以显示用户进程地址空间的内存分配。你可以使用ps 命令 显示此内存段的大小。参考2.3.10“pmap”和2.3.4“ps和pstree”。

1.1.9 Linux CPU调度器

计算机的基本功能非常简单就是计算。为了计算,这就意味要管理计算资源或处理器和计算任务(被称作线程或进程)。Linux内核使用与过去CPU调 度器使用的算法O(n)截然不同的O(1)算法,这要感谢Lngo Molnar的巨大贡献。O(1)指的是一种静态算法,意思就是不管进程的数量有多少,进程的执行时间都是不变的。

这种新的调度器的扩展性非常好,不管进程的数量或处理器的数量有多少,系统的开销都是非常小的。此算法中使用到两个进程优先级数组:

▶ 活动的【Active】

▶ 过期的【Expired】

调度器根据进程的优先级和优先拦截率【Prior Blocking Rate】分配时间片,然后它们被以优先级顺序置于活动数组【Active Array】中。当时间片耗尽,它们会被分配一个新的时间片并置于过期数组中。当活动数组中所有进程的时间片都全部耗尽,两个数组会被互换并重新执行。对 于交互进程(相对于实时进程),拥有长时间片的高优先级进程可以得到比低优先级进程更多的时间,但这并不意味着低优先级的进程会被置之不理。在企业环境 中,拥有很多的处理器并经常出现大量的线程和进程,这样做可以大大提升Linux内核的伸缩性。新的O(1)CPU调度器被设计用于2.6内核,但已被移 植到2.4内核家族。图1-8说明了Linux CPU调度器是怎样工作的。

 
图1-8 Linux 2.6内核 O(1)调度器

新调度器另一个大的改进就是支持非一致性内存架构(NUMA)和对称多线程处理器,如Intel超线程技术。改良后的NUMA支持确保只有当某个节点过载时,负载平衡才会跨越NUMA节点。This mechanism ensures that traffic over the comparatively slow scalability links in a NUMA system are minimized。尽管在每个调度节拍【tick】时负载平衡会遍历调度域群组【Scheduler Domain Group】中的处理器,但只有在节点过载并请求负载平衡时,负载才会跨越调度域【Scheduler Domain】转移。

 
图1-9 O(1) CPU调度器结构

译者注:在翻译过程中,深深的感觉到进程调度是一项非常复杂的工作。如果想深入了解2.6内核进程调度还需要多多查看相关资料,下面是一些 关于2.6内核进程调度的文章,有兴趣的朋友不妨看看。

Linux 2.6 调度系统分析:http://www.ibm.com/developerworks/cn/linux/kernel/l-kn26sch/index.html 
Linux 的 NUMA 技术:http://www.ibm.com/developerworks/cn/linux/l-numa/index.html 
Linux Scheduling Domains:http://www.ibm.com/developerworks/cn/linux/l-cn-schldom/index.html 
Inside the Linux scheduler:http://www.ibm.com/developerworks/linux/library/l-scheduler/

转载于:https://www.cnblogs.com/jiangzhaowei/p/11168732.html

《Linux性能及调优指南》 Linux进程管理相关推荐

  1. 《Linux 性能及调优指南》1.6 了解Linux性能指标

    翻译:飞哥 (http://hi.baidu.com/imlidapeng) 版权所有,尊重他人劳动成果,转载时请注明作者和原始出处及本声明. 原文名称:<Linux Performance a ...

  2. 《Linux 性能及调优指南》1.4 硬盘I/O子系统

    翻译:飞哥 (http://hi.baidu.com/imlidapeng) 版权所有,尊重他人劳动成果,转载时请注明作者和原始出处及本声明. 原文名称:<Linux Performance a ...

  3. linux性能架构,Linux性能及调优指南(翻译)之Linux内存架构

    Jmeter性能测试入门(转) 出处:http://www.cnblogs.com/by-dream/p/5611555.html Jmeter性能测试步骤 1. 添加线程组之后,先设置这两项: 2. ...

  4. Linux性能及调优指南(翻译)

    http://blog.csdn.net/ljianhui/article/details/46718835 http://blog.chinaunix.net/uid-26000296-id-406 ...

  5. linux磁盘io调优,Linux系统管理和调优(内存、CPU、磁盘IO、网络)

    系统管理 Author:Rich七哥 查看 CPU 负载相关工具,找出系统中使用 CPU 最多的进程 查看 Memory 运行状态相关工具,找出系统中使用内存最多的进程 查看 IO 运行状态相关工具, ...

  6. linux 分析磁盘性能,03.分析性能瓶颈 - 3.4.磁盘瓶颈 - 《Linux性能调优指南》 - 书栈网 · BookStack...

    磁盘瓶颈磁盘瓶颈性能调优选项 磁盘子系统通常是服务器性能的最重要方面,是瓶颈问题的高发部件.但是,磁盘问题表现的有时候并不是那么直接,比如说可能是内存不足.如果CPU周期浪费在等待I/O任务完成,应用 ...

  7. 问君能有几多愁,恰似不懂Linux SQL如何调优——聊聊SQL Server on Linux最佳实践

    问君能有几多愁,恰似不懂Linux SQL如何调优--聊聊SQL Server on Linux最佳实践 自从微软开始拥抱Linux, SQL Server 很快就推出了 Linux版本, linux ...

  8. 国产数据库清单;微盟《生产环境和数据恢复》;TiDB招聘;Oracle备份还原指南、GaussDB性能调优指南……墨天轮数据库周刊-第5期

    热门资讯 1.国产数据库清单(2020年第1季度)发布! modb.pro/db/22488 [摘要]本文统计了国产数据库产品清单,共58个产品仅供参考,同时在清单下方简单整理了各产品的基本介绍.应用 ...

  9. linux满负荷运行tail,linux内核tcp调优规范与方案

    1.TCP常用内核参数优化 上一篇我们介绍了服务器上有大量的TIME_WAIT等待,可能造成的危害,以及给web服务器带来负担.如何解决这个问题呢,其实,解决思路很简单,就是让服务器能够快速回收和重用 ...

  10. linux系统基础调优32条技巧

    linux系统基础调优32条技巧 版权声明:原创作品,如需转载,请与作者联系.否则将追究法律责任. 缘起:本文为老男孩linux系统基础优化部分,一些高级方面的调优欢迎大家一起讨论或单独交流,谢谢大家 ...

最新文章

  1. CentOS系统Yum源配置
  2. 算法刷题-数论-组合数、快速幂、逆元、递推求组合数、逆元求组合数
  3. 开源跳板机(堡垒机)Jumpserver v0.3.0 发布
  4. mybatis使用statement.getGenreatedKeys(); useGeneratedKeys=”true”;使用自增主键获取主键值策略和Oracle不支持自增,Oracle使用序列
  5. 茌平计算机中考成绩查询,中考成绩查询系统入口2021
  6. MySQL常见面试题与答案
  7. Node.js Path 模块
  8. hihocoder216周:贪心或二分
  9. asp 图片上传源码 【亲测】
  10. 【SICP练习】150 练习4.6
  11. 计算机类毕业论文中期检查,计算机类毕业论文中期检查表
  12. 英语口语中的音变现象及读音规则
  13. asp与php的区别
  14. org.jboss.netty.internal.LoggerConfigurator.DESCRIBED is already registered
  15. Duplicate问题
  16. 干货!mysql初始密码
  17. 云出阿里见月明(二)
  18. 搜索算法——双向bfs
  19. react钩子_了解用户的React钩子
  20. 《Cocos Creator游戏实战》滚动数字

热门文章

  1. java服务器访问html_浏览器输入服务器端口号来访问html网页
  2. python 实现两个excel表格数据的对比--代码
  3. 帆软 JS给填报控件(单元格)赋值 包含扩展单元格赋值
  4. 查看工作日志Linux,工作日志,Linux的表现还是不错的
  5. python是一种跨平台开源免费的高级动态编程_Python是一种跨平台、开源、免费的高级动态编程语言。...
  6. C语言项目大作业万历年,用C语言编写万历,详细代码.doc
  7. 密码学加解密实训(墨者学院摩斯密码第2题)
  8. null值是不会算在count以内的
  9. LYNC2013部署系列PART7:TMG部署
  10. 能大大提升工作效率和时间效率的9个重要习惯