浅析Linux下的task_struct结构体

参考:https://blog.csdn.net/qq_29503203/article/details/5461827

本文的重点是剖析task_struct,在这之前我们需要先了解一下进程的概念和Linux下进程控制块PCB。

1.首先什么是进程?

1.1进程可以这样描述:

  1. 进程是程序的一个执行实例;
  2. 进程是正在执行的程序;
  3. 进程是能分配处理器并由处理器执行的实体。
    按内核观点来谈进程:它担当分配系统资源(CPU时间,内存)的实体。

1.2进程的两个基本元素

一是程序代码(可能被执行相同程序的其他进程共享),二是和代码相关联的数据集。这里的“和代码相关联的数据集指的是数据段和进程控制块”。进程是一种动态描述,但是并不代表所有的进程都在运行。(进程在内存中因策略或调度需求,会处于各种状态)。

1.3这里再明确以下几点:

(1) 操作系统执行程序的过程:

(2)进程是动态运行的实例,但是并不是所有的进程都在运行,这前后两句话并不矛盾,因为程序被加载到内存中后,它的执行由进程的状态以及调度算法等来决定进程的运行。

2.进程的描述

上面我们已经提到过PCB,那么PCB到底是用来干什么的呢?

学了操作系统后,我们都知道操作系统要想管理一个对象,它不是直接进行管理的,而是通过得到被管理者的一些有效信息加以管理的,因此在这里我们也可以这样理解,操作系统管理进程,实则是将进程的有效信息提取出来然后通过管理这些信息来管理进程,而所有的进程信息被存放在一个叫做进程控制块的数据结构中(可以理解为进程属性的集合),这也就是即将要介绍的进程控制块(PCB).

每个进程在内核中都有一个进程控制块(PCB)来维护进程相关的信息,Linux内核的进程控制块是task_struct结构体.

task_struct是Linux内核的一种数据结构,它会被装载到RAM中并且包含着进程的信息。每个进程都把它的信息放在 task_struct 这个数据结构体,task_struct 包含了这些内容:

  1. 标示符: 描述本进程的唯一标识符,用来区别其他进程。
  2. 状态 :任务状态,退出代码,退出信号等。
  3. 优先级 :相对于其他进程的优先级。
  4. 程序计数器:程序中即将被执行的下一条指令的地址。
  5. 内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。
  6. 上下文数据:进程执行时处理器的寄存器中的数据。
  7. I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。
  8. 记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。

有关进程信息还有以下三点需要了解:

  1. 保存进程信息的数据结构叫做 task_struct,可以在 include/linux/sched.h 中找到它;
  2. 所有运行在系统中的进程都以 task_struct 链表的形式存在内核中;
  3. 进程的信息可以通过 /proc 系统文件夹查看。要获取PID为400的进程信息,你需要查看 /proc/400 这个文件夹。大多数进程信息同样可以使用top和ps这些用户级工具来获取,例如:

3.剖析task_struct结构体

(1)进程的状态

volatile long state;

state的可能取值为:

#define TASK_RUNNING        0//进程要么正在执行,要么准备执行
#define TASK_INTERRUPTIBLE  1 //可中断的睡眠,可以通过一个信号唤醒
#define TASK_UNINTERRUPTIBLE    2 //不可中断睡眠,不可以通过信号进行唤醒
#define __TASK_STOPPED      4 //进程停止执行
#define __TASK_TRACED       8 //进程被追踪
/* in tsk->exit_state */
#define EXIT_ZOMBIE     16 //僵尸状态的进程,表示进程被终止,但是父进程还没有获取它的终止信息,比如进程有没有执行完等信息。
#define EXIT_DEAD       32 //进程的最终状态,进程死亡
/* in tsk->state again */
#define TASK_DEAD       64 //死亡
#define TASK_WAKEKILL       128 //唤醒并杀死的进程
#define TASK_WAKING     256 //唤醒进程

(2)进程的唯一标识(pid)

pid_t pid;//进程的唯一标识
pid_t tgid;// 线程组的领头线程的pid成员的值

在Linux系统中,一个线程组中的所有线程使用和该线程组的领头线程(该组中的第一个轻量级进程)相同的PID,并被存放在tgid成员中。只有线程组的领头线程的pid成员才会被设置为与tgid相同的值。注意,getpid()系统调用返回的是当前进程的tgid值而不是pid值。(线程是程序运行的最小单位,进程是程序运行的基本单位。)
(3)进程的标记:
unsigned int flags; //flags成员的可能取值如下

#define PF_ALIGNWARN    0x00000001    /* Print alignment warning msgs *//* Not implemented yet, only for 486*/
#define PF_STARTING    0x00000002    /* being created */
#define PF_EXITING    0x00000004    /* getting shut down */
#define PF_EXITPIDONE    0x00000008    /* pi exit done on shut down */
#define PF_VCPU        0x00000010    /* I'm a virtual CPU */
#define PF_FORKNOEXEC    0x00000040    /* forked but didn't exec */
#define PF_MCE_PROCESS  0x00000080      /* process policy on mce errors */
#define PF_SUPERPRIV    0x00000100    /* used super-user privileges */
#define PF_DUMPCORE    0x00000200    /* dumped core */
#define PF_SIGNALED    0x00000400    /* killed by a signal */
#define PF_MEMALLOC    0x00000800    /* Allocating memory */
#define PF_FLUSHER    0x00001000    /* responsible for disk writeback */
#define PF_USED_MATH    0x00002000    /* if unset the fpu must be initialized before use */
#define PF_FREEZING    0x00004000    /* freeze in progress. do not account to load */
#define PF_NOFREEZE    0x00008000    /* this thread should not be frozen */
#define PF_FROZEN    0x00010000    /* frozen for system suspend */
#define PF_FSTRANS    0x00020000    /* inside a filesystem transaction */
#define PF_KSWAPD    0x00040000    /* I am kswapd */
#define PF_OOM_ORIGIN    0x00080000    /* Allocating much memory to others */
#define PF_LESS_THROTTLE 0x00100000    /* Throttle me less: I clean memory */
#define PF_KTHREAD    0x00200000    /* I am a kernel thread */
#define PF_RANDOMIZE    0x00400000    /* randomize virtual address space */
#define PF_SWAPWRITE    0x00800000    /* Allowed to write to swap */
#define PF_SPREAD_PAGE    0x01000000    /* Spread page cache over cpuset */
#define PF_SPREAD_SLAB    0x02000000    /* Spread some slab caches over cpuset */
#define PF_THREAD_BOUND    0x04000000    /* Thread bound to specific cpu */
#define PF_MCE_EARLY    0x08000000      /* Early kill for mce process policy */
#define PF_MEMPOLICY    0x10000000    /* Non-default NUMA mempolicy */
#define PF_MUTEX_TESTER    0x20000000    /* Thread belongs to the rt mutex tester */
#define PF_FREEZER_SKIP    0x40000000    /* Freezer should not count it as freezeable */
#define PF_FREEZER_NOSIG 0x80000000    /* Freezer won't send signals to it */

(4)进程之间的亲属关系:

struct task_struct *real_parent; /* real parent process */
struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */
struct list_head children;    /* list of my children */
struct list_head sibling;    /* linkage in my parent's children list */
struct task_struct *group_leader;    /* threadgroup leader */

在Linux系统中,所有进程之间都有着直接或间接地联系,每个进程都有其父进程,也可能有零个或多个子进程。拥有同一父进程的所有进程具有兄弟关系。

real_parent指向其父进程,如果创建它的父进程不再存在,则指向PID为1的init进程。
parent指向其父进程,当它终止时,必须向它的父进程发送信号。它的值通常与** real_parent**相同。
children表示链表的头部,链表中的所有元素都是它的子进程(进程的子进程链表)。
sibling用于把当前进程插入到兄弟链表中(进程的兄弟链表)。
group_leader指向其所在进程组的领头进程。

(5)进程调度信息:

 int prio, static_prio, normal_prio;unsigned int rt_priority;const struct sched_class *sched_class;struct sched_entity se;struct sched_rt_entity rt;unsigned int policy;

实时优先级范围是0到MAX_RT_PRIO-1(即99),而普通进程的静态优先级范围是从MAX_RT_PRIO到MAX_PRIO-1(即100到139)。值越大静态优先级越低。

static_prio用于保存静态优先级,可以通过nice系统调用来进行修改。
rt_priority用于保存实时优先级。
normal_prio的值取决于静态优先级和调度策略(进程的调度策略有:先来先服务,短作业优先、时间片轮转、高响应比优先等等的调度算法。
prio用于保存动态优先级。
policy表示进程的调度策略,目前主要有以下五种:

#define SCHED_NORMAL        0//按照优先级进行调度(有些地方也说是CFS调度器)
#define SCHED_FIFO        1//先进先出的调度算法
#define SCHED_RR        2//时间片轮转的调度算法
#define SCHED_BATCH        3//用于非交互的处理机消耗型的进程
#define SCHED_IDLE        5//系统负载很低时的调度算法
#define SCHED_RESET_ON_FORK     0x40000000

SCHED_NORMAL用于普通进程,通过CFS调度器实现;
SCHED_BATCH用于非交互的处理器消耗型进程;
SCHED_IDLE是在系统负载很低时使用;
SCHED_FIFO(先入先出调度算法)和SCHED_RR(轮流调度算法)都是实时调度策略.

(6)ptrace系统调用

unsigned int ptrace;
struct list_head ptraced;
struct list_head ptrace_entry;
unsigned long ptrace_message;
siginfo_t *last_siginfo;      /* For ptrace use.  */
ifdef CONFIG_HAVE_HW_BREAKPOINT
atomic_t ptrace_bp_refcnt;

成员ptrace被设置为0时表示不需要被跟踪,它的可能取值如下:

/* linux-2.6.38.8/include/linux/ptrace.h */
#define PT_PTRACED  0x00000001
#define PT_DTRACE   0x00000002  /* delayed trace (used on m68k, i386) */
#define PT_TRACESYSGOOD 0x00000004
#define PT_PTRACE_CAP   0x00000008  /* ptracer can follow suid-exec */
#define PT_TRACE_FORK   0x00000010
#define PT_TRACE_VFORK  0x00000020
#define PT_TRACE_CLONE  0x00000040
#define PT_TRACE_EXEC   0x00000080
#define PT_TRACE_VFORK_DONE 0x00000100
#define PT_TRACE_EXIT   0x00000200

(7) 时间数据成员

一个进程从创建到终止叫做该进程的生存期,进程在其生存期内使用CPU时间,内核都需要进行记录,进程耗费的时间分为两部分,一部分是用户模式下耗费的时间,一部分是在系统模式下耗费的时间

cputime_t utime, stime, utimescaled, stimescaled;cputime_t gtime;cputime_t prev_utime, prev_stime;//记录当前的运行时间(用户态和内核态)unsigned long nvcsw, nivcsw; //自愿/非自愿上下文切换计数struct timespec start_time;  //进程的开始执行时间    struct timespec real_start_time;  //进程真正的开始执行时间unsigned long min_flt, maj_flt;struct task_cputime cputime_expires;//cpu执行的有效时间struct list_head cpu_timers[3];//用来统计进程或进程组被处理器追踪的时间struct list_head run_list;unsigned long timeout;//当前已使用的时间(与开始时间的差值)unsigned int time_slice;//进程的时间片的大小int nr_cpus_allowed;

(8)信号处理信息

struct signal_struct *signal;//指向进程信号描述符struct sighand_struct *sighand;//指向进程信号处理程序描述符sigset_t blocked, real_blocked;//阻塞信号的掩码sigset_t saved_sigmask;    /* restored if set_restore_sigmask() was used */struct sigpending pending;//进程上还需要处理的信号unsigned long sas_ss_sp;//信号处理程序备用堆栈的地址size_t sas_ss_size;//信号处理程序的堆栈的地址

(9)文件系统信息

/* filesystem information */struct fs_struct *fs;//文件系统的信息的指针
/* open file information */struct files_struct *files;//打开文件的信息指针

以下是对task_struct的定义及注释:

struct task_struct {
volatile long state;  //说明了该进程是否可以执行,还是可中断等信息
unsigned long flags;  //Flage 是进程号,在调用fork()时给出
int sigpending;    //进程上是否有待处理的信号
mm_segment_t addr_limit; //进程地址空间,区分内核进程与普通进程在内存存放的位置不同//0-0xBFFFFFFF for user-thead//0-0xFFFFFFFF for kernel-thread
//调度标志,表示该进程是否需要重新调度,若非0,则当从内核态返回到用户态,会发生调度
volatile long need_resched;
int lock_depth;  //锁深度
long nice;       //进程的基本时间片
//进程的调度策略,有三种,实时进程:SCHED_FIFO,SCHED_RR, 分时进程:SCHED_OTHER
unsigned long policy;
struct mm_struct *mm; //进程内存管理信息
int processor;
//若进程不在任何CPU上运行, cpus_runnable 的值是0,否则是1 这个值在运行队列被锁时更新
unsigned long cpus_runnable, cpus_allowed;
struct list_head run_list; //指向运行队列的指针
unsigned long sleep_time;  //进程的睡眠时间
//用于将系统中所有的进程连成一个双向循环链表, 其根是init_task
struct task_struct *next_task, *prev_task;
struct mm_struct *active_mm;
struct list_head local_pages;       //指向本地页面
unsigned int allocation_order, nr_local_pages;
struct linux_binfmt *binfmt;  //进程所运行的可执行文件的格式
int exit_code, exit_signal;
int pdeath_signal;     //父进程终止时向子进程发送的信号
unsigned long personality;
//Linux可以运行由其他UNIX操作系统生成的符合iBCS2标准的程序
int did_exec:1;
pid_t pid;    //进程标识符,用来代表一个进程
pid_t pgrp;   //进程组标识,表示进程所属的进程组
pid_t tty_old_pgrp;  //进程控制终端所在的组标识
pid_t session;  //进程的会话标识
pid_t tgid;
int leader;     //表示进程是否为会话主管
struct task_struct *p_opptr,*p_pptr,*p_cptr,*p_ysptr,*p_osptr;
struct list_head thread_group;   //线程链表
struct task_struct *pidhash_next; //用于将进程链入HASH表
struct task_struct **pidhash_pprev;
wait_queue_head_t wait_chldexit;  //供wait4()使用
struct completion *vfork_done;  //供vfork() 使用
unsigned long rt_priority; //实时优先级,用它计算实时进程调度时的weight值//it_real_value,it_real_incr用于REAL定时器,单位为jiffies, 系统根据it_real_value
//设置定时器的第一个终止时间. 在定时器到期时,向进程发送SIGALRM信号,同时根据
//it_real_incr重置终止时间,it_prof_value,it_prof_incr用于Profile定时器,单位为jiffies。
//当进程运行时,不管在何种状态下,每个tick都使it_prof_value值减一,当减到0时,向进程发送
//信号SIGPROF,并根据it_prof_incr重置时间.
//it_virt_value,it_virt_value用于Virtual定时器,单位为jiffies。当进程运行时,不管在何种
//状态下,每个tick都使it_virt_value值减一当减到0时,向进程发送信号SIGVTALRM,根据
//it_virt_incr重置初值。
unsigned long it_real_value, it_prof_value, it_virt_value;
unsigned long it_real_incr, it_prof_incr, it_virt_value;
struct timer_list real_timer;   //指向实时定时器的指针
struct tms times;      //记录进程消耗的时间
unsigned long start_time;  //进程创建的时间
//记录进程在每个CPU上所消耗的用户态时间和核心态时间
long per_cpu_utime[NR_CPUS], per_cpu_stime[NR_CPUS];
//内存缺页和交换信息:
//min_flt, maj_flt累计进程的次缺页数(Copy on Write页和匿名页)和主缺页数(从映射文件或交换
//设备读入的页面数); nswap记录进程累计换出的页面数,即写到交换设备上的页面数。
//cmin_flt, cmaj_flt, cnswap记录本进程为祖先的所有子孙进程的累计次缺页数,主缺页数和换出页面数。
//在父进程回收终止的子进程时,父进程会将子进程的这些信息累计到自己结构的这些域中
unsigned long min_flt, maj_flt, nswap, cmin_flt, cmaj_flt, cnswap;
int swappable:1; //表示进程的虚拟地址空间是否允许换出
//进程认证信息
//uid,gid为运行该进程的用户的用户标识符和组标识符,通常是进程创建者的uid,gid
//euid,egid为有效uid,gid
//fsuid,fsgid为文件系统uid,gid,这两个ID号通常与有效uid,gid相等,在检查对于文件
//系统的访问权限时使用他们。
//suid,sgid为备份uid,gid
uid_t uid,euid,suid,fsuid;
gid_t gid,egid,sgid,fsgid;
int ngroups; //记录进程在多少个用户组中
gid_t groups[NGROUPS]; //记录进程所在的组
//进程的权能,分别是有效位集合,继承位集合,允许位集合
kernel_cap_t cap_effective, cap_inheritable, cap_permitted;
int keep_capabilities:1;
struct user_struct *user;
struct rlimit rlim[RLIM_NLIMITS];  //与进程相关的资源限制信息
unsigned short used_math;   //是否使用FPU
char comm[16];   //进程正在运行的可执行文件名//文件系统信息
int link_count, total_link_count;
//NULL if no tty 进程所在的控制终端,如果不需要控制终端,则该指针为空
struct tty_struct *tty;
unsigned int locks;
//进程间通信信息
struct sem_undo *semundo;  //进程在信号灯上的所有undo操作
struct sem_queue *semsleeping; //当进程因为信号灯操作而挂起时,他在该队列中记录等待的操作
//进程的CPU状态,切换时,要保存到停止进程的task_struct中
struct thread_struct thread;//文件系统信息
struct fs_struct *fs;//打开文件信息
struct files_struct *files;//信号处理函数
spinlock_t sigmask_lock;
struct signal_struct *sig; //信号处理函数
sigset_t blocked;  //进程当前要阻塞的信号,每个信号对应一位
struct sigpending pending;  //进程上是否有待处理的信号
unsigned long sas_ss_sp;
size_t sas_ss_size;
int (*notifier)(void *priv);
void *notifier_data;
sigset_t *notifier_mask;
u32 parent_exec_id;
u32 self_exec_id;spinlock_t alloc_lock;
void *journal_info;
};

task_struct的定义及注释部分参考:
http://blog.csdn.net/npy_lp/article/details/7292563
http://blog.csdn.net/peiyao456/article/details/54407343

1.1 进程的概念

我之前在操作系统这门课中学过的有关进程的概念如下:

从操作系统层面上讲:进程是程序的一次执行过程,是系统进行资源分配和处理机调度的一个独立单位。进程的结构特性:进程=程序段+数据段+进程控制块。进程的三种基本状态:

· 就绪状态(ready) : 等处理机
       · 执行状态(running) : 用处理机
       · 阻塞状态(blocked): 等事件

进程的状态转换图如下:

对于一个程序来说,是不是只要不在执行状态,就一定不是进程呢?

不是。假如在单处理机的系统中,一次只能执行一个进程,即只有一个进程处于执行状态,那么其他的被加载到内存的程序(已经获得了除处理机之外的所需的全部资源),

也是进程。

从内核的层面上讲:进程担当分配系统资源(包括内存等)的实体。 进程的两个基本元素是程序代码(可能与其他进程共享)和与代码相关联的数据集(这个是私有的)。这与进程的结构特性是一样的:进程=程序段+数据段+进程控制块。“。数据集就是指的是数据段和进程控制块。其中代码段是共享的,数据段是私有的。

1.2 进程控制块(PCB)

当一个程序加载到内存当中,计算机系统中就有了一个进程。每个进程在内核中都有一个进程控制块(PCB)来维护自身进程的信息,这个进程控制块(PCB)是为了方便进行进程管理所设置的一个数据结构,里面存放的是进程的相关信息。也就是说,进程管理管理的是PCB。

进程控制块(PCB)具体起什么作用?在单处理机系统,我们每次只能执行一个进程,我们如何知道是哪个进程在执行?执行完这个进程之后,又需要去执行哪些进程?假如一个进程由于种种原因,需要被中断,那么之后再来执行此进程的时候,我们怎么会知道之前执行到哪,等等情形,所以就需要进程控制块。通过分析以上的种种情况,我们得出:进程控制块至少应该包含进程标识(是进程的唯一标识,PID),还有进程的优先级,记录进程的上下文信息,记录进程下一次下一条指令的地址,进程中的程序的地址,等等。当操作系统要调度某进程去执行时,要从该进程的PCB中查询进程的优先级和现行状态;当系统调度到某个进程时,要根据PCB中保存的现行信息先去恢复现场,然后再去修改进程的状态,根据程序的地址,找到程序的位置,并开始执行;当进程由于某个原因需要暂停时,就必须将现行状态保存在PCB中,并记录下一条指令的地址。可见,在进程的整个执行过程中,进程控制块都起着非常重要的作用。

Linux内核的进程控制块是task_struct结构体,task_struct是Linux内核的一种数据结构,它会被装载到RAM里并且包含着进程的信息。每个进程都把它的信息放在task_struct这个数据结构里,task_struct里包含了这些进程信息:

标识符、状态、优先级、程序计数器、内存指针、上下文数据、I/O状态信息、记账信息。

在Linux系统中,所有运行在系统里的进程都是task_struct链表的形式存在内核里。见下图:

下面,我们开始剖析task_struct结构体。

1.3 task_struct结构体

centos6.5 Linux内核下,打开/usr/src/kernels/2.6.32-431.el6.i686/include/linux/sched.h  可以找到task_struct的定义。

1>进程状态(state)

volatile long state;
   int exit_state;

进程可能出现的状态如下:

#define TASK_RUNNING        0
#define TASK_INTERRUPTIBLE    1
#define TASK_UNINTERRUPTIBLE    2
#define __TASK_STOPPED        4
#define __TASK_TRACED        8
/* in tsk->exit_state */
#define EXIT_ZOMBIE        16
#define EXIT_DEAD        32
/* in tsk->state again */
#define TASK_DEAD        64
#define TASK_WAKEKILL        128
#define TASK_WAKING        256

2>进程标识符(PID)

pid_t pid;//进程的唯一标识
 pid_t tgid;// 线程组的领头线程的pid成员的值

PID的取值范围是0到32767,即系统中的进程数最大为32768个。

在Linux系统中,一个线程组中的所有线程使用和该线程组的领头线程(该组中的第一个轻量级进程)相同的PID,并被存放在tgid成员中。(线程是程序运行的最小单位,进程是程序运行的基本单位。)

3>进程内核栈

void *stack
       stack用来维护分配给进程的内核栈,内核栈的意义在于,进程task_struct所占的内存是由内核动态分配的,确切的说就是内核根本不给task_struct分配内存,只给内核栈分配8KB内存,并且一部分会提供给task_struct使用。
task_struct结构体大约占用的大小为1K左右,根据内核版本的不同,大小也会有差异。 
所以,也就可以知道内核栈最大也就是7KB,否则,内核栈会覆盖task_struct结构。

Linux内核通过thread_union联合体来表示进程的内核栈.

union thread_union {
    struct thread_info thread_info;
    unsigned long stack[THREAD_SIZE/sizeof(long)];
};

4>标记

unsigned int flags;    /* per process flags, defined below */

用来反映一个进程的状态信息,但不是运行状态,用于内核识别进程当前的状态,flags成员的可能取值如下:

/*
 * Per process flags
 */
#define PF_ALIGNWARN    0x00000001    /* Print alignment warning msgs */
                    /* Not implemented yet, only for 486*/
#define PF_STARTING    0x00000002    /* being created */
#define PF_EXITING    0x00000004    /* getting shut down */
#define PF_EXITPIDONE    0x00000008    /* pi exit done on shut down */
#define PF_VCPU        0x00000010    /* I'm a virtual CPU */
#define PF_FORKNOEXEC    0x00000040    /* forked but didn't exec */
#define PF_MCE_PROCESS  0x00000080      /* process policy on mce errors */
#define PF_SUPERPRIV    0x00000100    /* used super-user privileges */
#define PF_DUMPCORE    0x00000200    /* dumped core */
#define PF_SIGNALED    0x00000400    /* killed by a signal */
#define PF_MEMALLOC    0x00000800    /* Allocating memory */
#define PF_FLUSHER    0x00001000    /* responsible for disk writeback */
#define PF_USED_MATH    0x00002000    /* if unset the fpu must be initialized before use */
#define PF_FREEZING    0x00004000    /* freeze in progress. do not account to load */
#define PF_NOFREEZE    0x00008000    /* this thread should not be frozen */
#define PF_FROZEN    0x00010000    /* frozen for system suspend */
#define PF_FSTRANS    0x00020000    /* inside a filesystem transaction */
#define PF_KSWAPD    0x00040000    /* I am kswapd */
#define PF_LESS_THROTTLE 0x00100000    /* Throttle me less: I clean memory */
#define PF_KTHREAD    0x00200000    /* I am a kernel thread */
#define PF_RANDOMIZE    0x00400000    /* randomize virtual address space */
#define PF_SWAPWRITE    0x00800000    /* Allowed to write to swap */
#define PF_SPREAD_PAGE    0x01000000    /* Spread page cache over cpuset */
#define PF_SPREAD_SLAB    0x02000000    /* Spread some slab caches over cpuset */
#define PF_THREAD_BOUND    0x04000000    /* Thread bound to specific cpu */
#define PF_MCE_EARLY    0x08000000      /* Early kill for mce process policy */
#define PF_MEMPOLICY    0x10000000    /* Non-default NUMA mempolicy */
#define PF_MUTEX_TESTER    0x20000000    /* Thread belongs to the rt mutex tester */
#define PF_FREEZER_SKIP    0x40000000    /* Freezer should not count it as freezeable */
#define PF_FREEZER_NOSIG 0x80000000    /* Freezer won't send signals to it */

5>表示进程亲属关系的成员

struct task_struct *real_arent;  /* real parent process */
    struct task_struct *parent;  /* recipient of SIGCHLD, wait4() reports */
    struct list_head children;  /* list of my children */
    struct list_head sibling;  /* linkage in my parent's children list */
    struct task_struct *group_leader;  /* threadgroup leader */
      在Linux系统中,所有进程之间都有着直接或间接地联系,每个进程都有其父进程,也可能有零个或多个子进程。拥有同一父进程的所有进程具有兄弟关系。

real_parent指向其父进程,如果创建它的父进程不再存在,则指向PID为1的init进程。

parent指向其父进程,当它终止时,必须向它的父进程发送信号。它的值通常与real_parent相同。

children表示链表的头部,链表中的所有元素都是它的子进程。

sibling用于把当前进程插入到兄弟链表中。

group_leader指向其所在进程组的领头进程。

6>进程调度

int prio, static_prio, normal_prio;  
   unsigned int rt_priority;  
   const struct sched_class *sched_class;  
   struct sched_entity se;  
   struct sched_rt_entity rt;  
   unsigned int policy;  
   cpumask_t cpus_allowed;

prio用于保存动态优先级。

static_prio用于保存静态优先级,可以通过nice系统调用来进行修改。
     normal_prio的值取决于静态优先级和调度策略。
     rt_priority用于保存实时优先级。
     policy表示进程的调度策略。

这里重点说明一下进程调度策略,我们来看下关于调度策略的成员:
    unsigned int policy;
    const struct sched_class *sched_class;
    struct sched_entity se;
    struct sched_rt_entity rt;

policy表示进程的调度策略,主要有以下五种:
#define SCHED_NORMAL        0//按照优先级进行调度(有些地方也说是CFS调度器)
#define SCHED_FIFO          1//先进先出的调度算法
#define SCHED_RR            2//时间片轮转的调度算法
#define SCHED_BATCH         3//用于非交互的处理机消耗型的进程
#define SCHED_IDLE          5//系统负载很低时的调度算法
#define SCHED_RESET_ON_FORK     0x40000000

7> ptrace系统调用
   unsigned int ptrace;
   struct list_head ptraced;
   struct list_head ptrace_entry;
ptrace是一种提供父进程控制子进程运行,并且可以检查和改变它的核心image。当trace设置为0时不需要被跟踪。

8>性能诊断工具——Performance Event

#ifdef CONFIG_PERF_EVENTS
#ifndef __GENKSYMS__
    void * __reserved_perf__;
#else
    struct perf_event_context *perf_event_ctxp;
#endif
    struct mutex perf_event_mutex;
    struct list_head perf_event_list;
#endif
PerformanceEvent是一款随 Linux 内核代码一同发布和维护的性能诊断工具。这些成员用于帮PerformanceEvent分析进程的性能问题。

9>进程的地址空间

struct mm_struct *mm, *active_mm;
 mm  进程所拥有的用户空间的内存描述符

active_mm   指向进程运行时使用的内存描述符,对于普通的进程来说,mm和active_mm是一样的,但是内核线程是没有进程地址空间的,所以内核线程的mm是空的,所以需要初始化内核线程的active_mm

10>时间与定时器

一个进程从创建到终止叫做该进程的生存期。进程在其生存期内使用CPU的时间,内核都要进行记录,以便进行统计、计费等有关操作。进程耗费CPU的时间由两部分组成:一是在用户模式(或称为用户态)下耗费的时间、一是在系统模式(或称为系统态)下耗费的时间。每个时钟滴答,也就是每个时钟中断,内核都要更新当前进程耗费CPU的时间信息。描述CPU时间的内容如下:

cputime_t utime, stime, utimescaled, stimescaled;
    cputime_t gtime;
    cputime_t prev_utime, prev_stime;
    unsigned long nvcsw, nivcsw; 
    struct timespec start_time;    
    struct timespec real_start_time; 
    unsigned long min_flt, maj_flt;
    struct task_cputime cputime_expires;
    struct list_head cpu_timers[3];
    struct list_head run_list;
    unsigned long timeout;//当前已使用的时间(与开始时间的差值)
    unsigned int time_slice;//进程的时间片的大小
    int nr_cpus_allowed;

进程有三种类型的定时器:实时定时器、虚拟定时器和概况定时器。这三种定时器的特征共有三个:到期时间、定时间隔、要触发的事件。

11>判断标志

//用于进程判断标志
    int exit_state;
    int exit_code, exit_signal;
    int pdeath_signal; 
    unsigned int personality;
    unsigned did_exec:1;
    unsigned in_execve:1;  
    unsigned in_iowait:1;
    unsigned sched_reset_on_fork:1;
exit_state  进程终止的状态

exit_code  设置进程的终止代号

exit_signal  设置为-1的时候表示是某个线程组当中的一员,只有当线程组的最后一个成员终止时,才会产生型号给父进程

pdeath_signal  用来判断父进程终止时的信号

12>信号处理信息

struct signal_struct *signal; //指向进程信号描述符
    struct sighand_struct *sighand; //指向进程信号处理程序描述符
    sigset_t blocked, real_blocked; //阻塞信号的掩码
    sigset_t saved_sigmask; 
    struct sigpending pending; //进程上还需要处理的信号
    unsigned long sas_ss_sp; //信号处理程序备用堆栈的地址
    size_t sas_ss_size; //信号处理程序的堆栈的地址

13>文件系统信息

进程可以打开或关闭文件,文件属于系统资源,Linux内核要对进程使用文件的情况进行记录。task_struct结构中有两个数据结构用于描述进程与文件相关的信息。其中,fs_struct中描述了两个VFS索引节点,这两个索引节点叫做root和pwd。file_struct结构用来记录了进程打开的文件的描述符。

//文件系统信息结构体
    struct fs_struct *fs;
 
    //打开文件相关信息结构体
    struct files_struct *files;

struct fs_struct *fs   进程可执行镜像所在的文件系统
struct files_struct *files   进程当前打开的文件

14>task_struct的完整定义及注释

struct task_struct {
    //进程状态(-1就绪态,0运行态,>0停止态)
    volatile long state;    /* -1 unrunnable, 0 runnable, >0 stopped */
    
    //进程内核栈
    void *stack;
    
    //有几个进程只在使用此结构
    atomic_t usage;
    
    //标记
    unsigned int flags;    /* per process flags, defined below */
    
    //ptrace系统调用,关于实现断点调试,跟踪进程运行。
    unsigned int ptrace;
 
    //锁的深度
    int lock_depth;        /* BKL lock depth */
 
    //SMP实现无加锁的进程切换
#ifdef CONFIG_SMP
#ifdef __ARCH_WANT_UNLOCKED_CTXSW
    int oncpu;
#endif
#endif
 
    //关于进程调度
    int prio, static_prio, normal_prio;
    
    //优先级
    unsigned int rt_priority;
    
    //关于进程
    const struct sched_class *sched_class;
    struct sched_entity se;
    struct sched_rt_entity rt;
 
    //preempt_notifier结构体链表
#ifdef CONFIG_PREEMPT_NOTIFIERS
    /* list of struct preempt_notifier: */
    struct hlist_head preempt_notifiers;
#endif
 
    /*
     * fpu_counter contains the number of consecutive context switches
     * that the FPU is used. If this is over a threshold, the lazy fpu
     * saving becomes unlazy to save the trap. This is an unsigned char
     * so that after 256 times the counter wraps and the behavior turns
     * lazy again; this to deal with bursty apps that only use FPU for
     * a short time
     */
     
     //FPU使用计数
    unsigned char fpu_counter;
    
    //块设备I/O层的跟踪工具
#ifdef CONFIG_BLK_DEV_IO_TRACE
    unsigned int btrace_seq;
#endif
    //进程调度策略相关的字段
    unsigned int policy;
    
    cpumask_t cpus_allowed;
 
    //RCU同步原语
#ifdef CONFIG_TREE_PREEMPT_RCU
    int rcu_read_lock_nesting;
    char rcu_read_unlock_special;
    struct rcu_node *rcu_blocked_node;
    struct list_head rcu_node_entry;
#endif /* #ifdef CONFIG_TREE_PREEMPT_RCU */
 
//用于调度器统计进程运行信息
#if defined(CONFIG_SCHEDSTATS) || defined(CONFIG_TASK_DELAY_ACCT)
    struct sched_info sched_info;
#endif
 
//用于构架进程链表
    struct list_head tasks;
    struct plist_node pushable_tasks;
 
    //关于进程的地址空间,指向进程的地址空间。(链表和红黑树)
    struct mm_struct *mm, *active_mm;
 
/* task state */
    //进程状态参数
    int exit_state;
    
    //退出信号处理
    int exit_code, exit_signal;
    
    //接收父进程终止的时候会发送信号
    int pdeath_signal;  /*  The signal sent when the parent dies  */
    /* ??? */
    unsigned int personality;
    unsigned did_exec:1;
    unsigned in_execve:1;    /* Tell the LSMs that the process is doing an
                 * execve */
    unsigned in_iowait:1;
 
 
    /* Revert to default priority/policy when forking */
    unsigned sched_reset_on_fork:1;
 
    //进程pid,父进程ppid。
    pid_t pid;
    pid_t tgid;
 
    //防止内核堆栈溢出
#ifdef CONFIG_CC_STACKPROTECTOR
    /* Canary value for the -fstack-protector gcc feature */
    unsigned long stack_canary;
#endif
 
    /*
     * pointers to (original) parent process, youngest child, younger sibling,
     * older sibling, respectively.  (p->father can be replaced with
     * p->real_parent->pid)
     */
     
     //这部分是用来进行维护进程之间的亲属关系的。
     //初始化父进程
    struct task_struct *real_parent; /* real parent process */
    //接纳终止的进程
    struct task_struct *parent; /* recipient of SIGCHLD, wait4() reports */
    /*
     * children/sibling forms the list of my natural children
     */
     //维护子进程链表
    struct list_head children;    /* list of my children */
    //兄弟进程链表
    struct list_head sibling;    /* linkage in my parent's children list */
    //线程组组长
    struct task_struct *group_leader;    /* threadgroup leader */
 
    /*
     * ptraced is the list of tasks this task is using ptrace on.
     * This includes both natural children and PTRACE_ATTACH targets.
     * p->ptrace_entry is p's link on the p->parent->ptraced list.
     */
     
     //ptrace,系统调用,关于断点调试。
    struct list_head ptraced;
    struct list_head ptrace_entry;
 
    //PID与PID散列表的联系
    /* PID/PID hash table linkage. */
    struct pid_link pids[PIDTYPE_MAX];
    
    //维护一个链表,里面有该进程所有的线程
    struct list_head thread_group;
 
    //do_fork()函数
    struct completion *vfork_done;        /* for vfork() */
    int __user *set_child_tid;        /* CLONE_CHILD_SETTID */
    int __user *clear_child_tid;        /* CLONE_CHILD_CLEARTID */
 
    //描述CPU时间的内容
    //utime是用户态下的执行时间
    //stime是内核态下的执行时间
    cputime_t utime, stime, utimescaled, stimescaled;
    cputime_t gtime;
    cputime_t prev_utime, prev_stime;
    
    //上下文切换计数
    unsigned long nvcsw, nivcsw; /* context switch counts */
    struct timespec start_time;         /* monotonic time */
    struct timespec real_start_time;    /* boot based time */
/* mm fault and swap info: this can arguably be seen as either mm-specific or thread-specific */
    
    //缺页统计
    unsigned long min_flt, maj_flt;
 
    struct task_cputime cputime_expires;
    struct list_head cpu_timers[3];
 
/* process credentials */
 
//进程身份凭据
    const struct cred *real_cred;    /* objective and real subjective task
                     * credentials (COW) */
    const struct cred *cred;    /* effective (overridable) subjective task
                     * credentials (COW) */
    struct mutex cred_guard_mutex;    /* guard against foreign influences on
                     * credential calculations
                     * (notably. ptrace) */
    struct cred *replacement_session_keyring; /* for KEYCTL_SESSION_TO_PARENT */
    
    //去除路径以后的可执行文件名称,进程名
    char comm[TASK_COMM_LEN]; /* executable name excluding path
                     - access with [gs]et_task_comm (which lock
                       it with task_lock())
                     - initialized normally by setup_new_exec */
/* file system info */
 
    //文件系统信息
    int link_count, total_link_count;
#ifdef CONFIG_SYSVIPC
/* ipc stuff */
//进程通信
    struct sysv_sem sysvsem;
#endif
#ifdef CONFIG_DETECT_HUNG_TASK
/* hung task detection */
    unsigned long last_switch_count;
#endif
 
//该进程在特点CPU下的状态
/* CPU-specific state of this task */
    struct thread_struct thread;
    
    //文件系统信息结构体
/* filesystem information */
    struct fs_struct *fs;
    
    //打开文件相关信息结构体
/* open file information */
    struct files_struct *files;
/* namespaces */
//命名空间:
    struct nsproxy *nsproxy;
/* signal handlers */
 
    //关于进行信号处理
    struct signal_struct *signal;
    struct sighand_struct *sighand;
 
    sigset_t blocked, real_blocked;
    sigset_t saved_sigmask;    /* restored if set_restore_sigmask() was used */
    struct sigpending pending;
 
    unsigned long sas_ss_sp;
    size_t sas_ss_size;
    int (*notifier)(void *priv);
    void *notifier_data;
    sigset_t *notifier_mask;
    
    //进程审计
    struct audit_context *audit_context;
#ifdef CONFIG_AUDITSYSCALL
    uid_t loginuid;
    unsigned int sessionid;
#endif
    seccomp_t seccomp;
 
    
#ifdef CONFIG_UTRACE
    struct utrace *utrace;
    unsigned long utrace_flags;
#endif
 
//线程跟踪组
/* Thread group tracking */
       u32 parent_exec_id;
       u32 self_exec_id;
/* Protection of (de-)allocation: mm, files, fs, tty, keyrings, mems_allowed,
 * mempolicy */
    spinlock_t alloc_lock;
 
    //中断
#ifdef CONFIG_GENERIC_HARDIRQS
    /* IRQ handler threads */
    struct irqaction *irqaction;
#endif
 
//task_rq_lock函数所使用的锁
    /* Protection of the PI data structures: */
    spinlock_t pi_lock;
 
    //基于PI协议的等待互斥锁
#ifdef CONFIG_RT_MUTEXES
    /* PI waiters blocked on a rt_mutex held by this task */
    struct plist_head pi_waiters;
    /* Deadlock detection and priority inheritance handling */
    struct rt_mutex_waiter *pi_blocked_on;
#endif
 
//死锁检测
#ifdef CONFIG_DEBUG_MUTEXES
    /* mutex deadlock detection */
    struct mutex_waiter *blocked_on;
#endif
 
//中断
#ifdef CONFIG_TRACE_IRQFLAGS
    unsigned int irq_events;
    int hardirqs_enabled;
    unsigned long hardirq_enable_ip;
    unsigned int hardirq_enable_event;
    unsigned long hardirq_disable_ip;
    unsigned int hardirq_disable_event;
    int softirqs_enabled;
    unsigned long softirq_disable_ip;
    unsigned int softirq_disable_event;
    unsigned long softirq_enable_ip;
    unsigned int softirq_enable_event;
    int hardirq_context;
    int softirq_context;
#endif
 
//lockdep
#ifdef CONFIG_LOCKDEP
# define MAX_LOCK_DEPTH 48UL
    u64 curr_chain_key;
    int lockdep_depth;
    unsigned int lockdep_recursion;
    struct held_lock held_locks[MAX_LOCK_DEPTH];
    gfp_t lockdep_reclaim_gfp;
#endif
 
//日志文件
/* journalling filesystem info */
 
    void *journal_info;
 
/* stacked block device info */
    //块设备链表
    struct bio *bio_list, **bio_tail;
 
/* VM state */
    //虚拟内存状态,内存回收
    struct reclaim_state *reclaim_state;
 
    //存放块设备I/O流量信息
    struct backing_dev_info *backing_dev_info;
 
    //I/O调度器所用信息
    struct io_context *io_context;
 
    unsigned long ptrace_message;
    siginfo_t *last_siginfo; /* For ptrace use.  */
    
    //记录进程I/O计数
    struct task_io_accounting ioac;
#if defined(CONFIG_TASK_XACCT)
    u64 acct_rss_mem1;    /* accumulated rss usage */
    u64 acct_vm_mem1;    /* accumulated virtual memory usage */
    cputime_t acct_timexpd;    /* stime + utime since last update */
#endif
 
    //CPUSET功能
#ifdef CONFIG_CPUSETS
    nodemask_t mems_allowed;    /* Protected by alloc_lock */
#ifndef __GENKSYMS__
    /*
     * This does not change the size of the struct_task(2+2+4=4+4)
     * so the offsets of the remaining fields are unchanged and 
     * therefore the kABI is preserved.  Only the kernel uses
     * cpuset_mem_spread_rotor and cpuset_slab_spread_rotor so
     * it is safe to change it to use shorts instead of ints.
     */   
    unsigned short cpuset_mem_spread_rotor;
    unsigned short cpuset_slab_spread_rotor;
    int mems_allowed_change_disable;
#else
    int cpuset_mem_spread_rotor;
    int cpuset_slab_spread_rotor;
#endif
#endif
 
//Control Groups
#ifdef CONFIG_CGROUPS
    /* Control Group info protected by css_set_lock */
    struct css_set *cgroups;
    /* cg_list protected by css_set_lock and tsk->alloc_lock */
    struct list_head cg_list;
#endif
 
//futex同步机制
#ifdef CONFIG_FUTEX
    struct robust_list_head __user *robust_list;
#ifdef CONFIG_COMPAT
    struct compat_robust_list_head __user *compat_robust_list;
#endif
    struct list_head pi_state_list;
    struct futex_pi_state *pi_state_cache;
#endif
 
//关于内存检测工具Performance Event
#ifdef CONFIG_PERF_EVENTS
#ifndef __GENKSYMS__
    void * __reserved_perf__;
#else
    struct perf_event_context *perf_event_ctxp;
#endif
    struct mutex perf_event_mutex;
    struct list_head perf_event_list;
#endif
 
    //非一致内存访问
#ifdef CONFIG_NUMA
    struct mempolicy *mempolicy;    /* Protected by alloc_lock */
    short il_next;
#endif
 
    //文件系统互斥资源
    atomic_t fs_excl;    /* holding fs exclusive resources */
    
    //RCU链表
    struct rcu_head rcu;
 
    /*
     * cache last used pipe for splice
     */
     
     //管道
    struct pipe_inode_info *splice_pipe;
    
    //延迟计数
#ifdef    CONFIG_TASK_DELAY_ACCT
    struct task_delay_info *delays;
#endif
#ifdef CONFIG_FAULT_INJECTION
    int make_it_fail;
#endif
    struct prop_local_single dirties;
#ifdef CONFIG_LATENCYTOP
    int latency_record_count;
    struct latency_record latency_record[LT_SAVECOUNT];
#endif
    /*
     * time slack values; these are used to round up poll() and
     * select() etc timeout values. These are in nanoseconds.
     */
     
     //time slack values,常用于poll和select函数
    unsigned long timer_slack_ns;
    unsigned long default_timer_slack_ns;
 
    //socket控制消息
    struct list_head    *scm_work_list;
#ifdef CONFIG_FUNCTION_GRAPH_TRACER
    
    //ftrace跟踪器
    /* Index of current stored adress in ret_stack */
    int curr_ret_stack;
    /* Stack of return addresses for return function tracing */
    struct ftrace_ret_stack    *ret_stack;
    /* time stamp for last schedule */
    unsigned long long ftrace_timestamp;
    /*
     * Number of functions that haven't been traced
     * because of depth overrun.
     */
    atomic_t trace_overrun;
    /* Pause for the tracing */
    atomic_t tracing_graph_pause;
#endif
#ifdef CONFIG_TRACING
    /* state flags for use by tracers */
    unsigned long trace;
    /* bitmask of trace recursion */
    unsigned long trace_recursion;
#endif /* CONFIG_TRACING */
    /* reserved for Red Hat */
    unsigned long rh_reserved[2];
#ifndef __GENKSYMS__
    struct perf_event_context *perf_event_ctxp[perf_nr_task_contexts];
#ifdef CONFIG_CGROUP_MEM_RES_CTLR /* memcg uses this to do batch job */
    struct memcg_batch_info {
        int do_batch;    /* incremented when batch uncharge started */
        struct mem_cgroup *memcg; /* target memcg of uncharge */
        unsigned long bytes;         /* uncharged usage */
        unsigned long memsw_bytes; /* uncharged mem+swap usage */
    } memcg_batch;
#endif
#endif
};

参考:

http://blog.csdn.net/qq_26768741/article/details/54348586

http://blog.csdn.net/peiyao456/article/details/54407343?ref=myread

————————————————
版权声明:本文为CSDN博主「qinghe0808」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qinghe0808/article/details/70148225

*************************************************************************************************************************************************

1、cpu进程状态

linux中进程状态如下图:

浅度睡眠为进程等待资源或中断响应,即使资源没有拿到也可以被唤醒;深度睡眠为进程等待资源,拿到资源后进入就绪状态。

僵死状态为进程死亡,但还没有被父进程执行wait操作,此时进程中只剩下task_struct,其他资源已经被释放,当父进程执行完wait操作后,子进程的僵死状态被清除。如果一个父进程死了,那该父进程下面的子进程将被托孤给离该父进程最近的收割进程,该进程内含有wait操作,监控子进程。

暂停状态是进程暂时被挂起,ctrl+Z可以暂停进程,按fg继续执行进程。可用于作业控制。

2、进程描述符

Linux进程描述符采用task_struct结构体描述,该结构体内含有五个部分:

Linux中针对task_struct进行调度。多线程应用中同一个进程创建的多个线程它们pid和进程的pid一样,但是每个线程拥有不同的tid。

Linux对于进程描述符有三种表现形式,task_struct双向链表,进程树,哈希表。可以通过这三种数据格式描述同一个进程。

3、linux进程创建

创建进程有三种方式

Fork 创建子进程,将父进程的资源复制一份给子进程,task_struct内五项内容不共享,fork的返回值为0,必须要有mmu进行页表管理

Vfork 创建子进程,父进程和子进程共享mm,其他四项内容不共享,没有mmu的方式下使用

Clone(pthread_create) 创建子线程,资源共享,task_struct内五项内容共享。

三个函数最终都是调用do_fork。

在fork时,父进程和子进程最终会有不一样的物理地址,必须要有mmu才行。

4、进程生命周期

系统上电以后最早的进程为进程0,当进程0创建完进程1(init)后变化为idle进程,该进程在linux中优先级最低,当执行到该进程时,表明系统很闲,进入省电状态WFI

5、linux进程调度

进程类型分为I/O消耗性,CPU消耗性。

I/O消耗性是能够及时响应I/O中断消息,用户体验好,类似于手机。

CPU消耗性是运算好,用户体验差。

一个进程是I/O消耗性或是CPU消耗性只有进程运行过程中才能知道,不是由用户创建时选定的。

6、linux进程调度

linux进程分为两个类别

0-99采用SCHED_FIFO或SCHED_RR模式,直接抢占,数字越小优先级越高(linux内部用99-数字),现在也可以设定rt_period_us或rt_runtime_us,指定抢占式进程最多不超过一个固定值,比如1ms中最多执行0.95ms

100-139采用SCHED_OTHER模式,非抢占,每个进程都有时间来执行,通过nice来判断进程优先级。

Nice -20 对应 100,优先级高,每次被分到更多的时间片执行

Nice 19 对应 139,优先级低,分到的时间片较少

可以通过renice –n -5 –g pidof设定某个pidof的nice值。

切换FIFO RR或者OTHER命令为

Chrt –a –f –p 50 pid 修改为FIFO

Chrt –a –r –p [1..99] pid 修改为RR

Chrt –a –o –p -0 1024 修改为OTHER

后续linux采用CFS红黑树方式进行OTHER内存调度,每次选取VT值最小的进程进行调度

进程的virtual time=physical time/权重

权重和nice相关,nice值越小权重越大,得到的vt越小,但是如果pt执行的次数越多,pt越大,vt也会变大。

新内核中加入组的概念,不同组直接采用CFS调度,组内采用CFS调度。加入组的概念后可以进行CPU流量控制,每个组设置不同,获得的CPU资源不同。

创建组:/sys/fs/cgroup/cpu内创建mkdir A,mkdir B

将进程加入该组:sh –c ‘echo pod > cgroup.procs’

修改组内的配置 sh –c ‘echo 100 > cpu.shares’ shares越大,该组cpu拿到的时间片越多

Sh –c ‘echo 1000> cpu_cfs_quota_us’ 值越大,该组cpu每一个时间片内拿到的时间越多

7、smp负载均衡

负载均衡为硬件自动实现,RR和FIFO自动均分到每个核上执行,每个核进行推拉操作获取进程,每个核的调度算法都一样。可以通过命令指定将任务放到哪个核上。

Pthread_attr_setaffinity_np()内含有设置CPU掩码,指定在哪个CPU上面跑。0X1为CPU1,0x2为CPU2。
————————————————
版权声明:本文为CSDN博主「Felven」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/zhaoxinfan/article/details/82079284

浅析Linux下的task_struct结构体相关推荐

  1. Linux下网络相关结构体 struct servent

    Linux下网络相关结构体 struct servent 参考书籍:<UNIX环境高级编程> 参考链接: http://www.cnblogs.com/benxintuzi/p/45898 ...

  2. Linux进程中task_struct结构体

    一.进程的定义: ①正在执行的程序: ②正在计算机上执行的实例: ③能分配给处理器并由处理器可以执行的实体. ④具有以下特征的活动单元: 一组指令序列的执行.一个当前状态和相关的系统资源. 进程的两个 ...

  3. linux windows 结构体,Linux下C语言——结构体对齐

    结构体对齐的步骤: 1.结构体各成员对齐 2.整个结构体圆整 结构体对齐的特定对齐值: 1.自身对齐值: 自身对齐值就是结构体变量里每个成员的自身大小; 2.指定对齐值: 指定对齐值是由宏#pragm ...

  4. Linux下网络相关结构体 struct addrinfo

    参考书籍:<UNIX环境高级编程> 参考连接: http://www.cnblogs.com/benxintuzi/p/4589819.html 一.简介 结构体定义如下: struct ...

  5. linux arp头文件,Linux下ARP头结构体的问题

    在我的系统中 /usr/include/net/if_arp.h中arphdr的结构体定义如下 struct arphdr { unsigned short int ar_hrd;/* Format ...

  6. Linux下的PCB结构体

    进程的主要信息: 1.pid_t pid标识符:与进程相关的唯一标识符,区别正在执行的进程和其他进程 2.状态:描述进程的状态,因为进程有阻塞.挂起.运行等好几个状态,所以都有个表示符来记录进程的执行 ...

  7. Linux进程描述符task_struct结构体简析

    进程是处于执行期的程序以及它所管理的资源(如打开的文件.挂起的信号.进程状态.地址空间等等)的总称 Linux内核通过一个被称为进程描述符的task_struct结构体来管理进程,这个结构体包含了一个 ...

  8. Linux进程描述符task_struct结构体详解--Linux进程的管理与调度(一)

    转自:http://blog.csdn.net/gatieme/article/details/51383272 日期 内核版本 架构 作者 GitHub CSDN 2016-05-12 Linux- ...

  9. 【Linux 内核】进程管理 task_struct 结构体 ⑤ ( files 字段 | nsproxy 字段 | 信号处理相关字段 | 信号量和共享内存相关字段 )

    文章目录 一.task_struct 结构体字段分析 1.files 字段 2.nsproxy 字段 3.信号处理相关字段 4.信号量和共享内存相关字段 在 Linux 内核 中 , " 进 ...

  10. 【Linux 内核】进程管理 task_struct 结构体 ④ ( comm 字段 | 进程优先级字段 | cpus_ptr 字段 | mm、active_mm 字段 | fs 字段 )

    文章目录 一.task_struct 结构体字段分析 1.comm 字段 2.进程优先级字段 3.cpus_ptr 字段 4.mm.active_mm 字段 5. fs 字段 在 Linux 内核 中 ...

最新文章

  1. 《深入理解ElasticSearch》——2.4 批量操作
  2. VTK:循环布尔PolyData用法实战
  3. 7. SQL -- 创建数据库(表,字段)
  4. 查看Mysql数据库有多大
  5. 基于ASP.NET 3.5 Web Service 的JSON扩展应用
  6. [转]关于凸优化的一些简单概念
  7. Java版二叉树遍历,查找,顺序化存储代码实现
  8. Python《使用lxml解析xpath--爬取konachan》
  9. 奇安信代码安全实验室研究员入选“2021微软 MSRC 最具价值安全研究者”榜单
  10. linux下无法正常打开pdf文件的解决方法
  11. 同余方程-NOIP2012TGD2T1
  12. springboot自定义启动logo
  13. 超声波无线充电电动牙刷方案开发设计
  14. Java核心类库之(常用API、字符串类、集合类、泛型)
  15. mysql emoy表情_GitHub - PandaQAQ/PandaEmoView: emoji gif 表情图文混排,仿微信表情输入...
  16. Android系统学习(一)------编译系统Android7.0
  17. Eclipse使用Maven创建Web时错误:Could not resolve archetype org.apache.maven.archetypes:maven-archetype-webap
  18. C语言——连续做10道题,通过计算机随机产生两个1~10之间的加数给学生出一道加法运算题, 如果输入答案正确,则显示“Right!”,否则显示“Not correct!”,不给机会重做, 10道题做完
  19. 自动驾驶算法详解(8):特斯拉Tesla决策规划算法Planning解析下
  20. PC版有道词典全白皮肤太亮?自己修改背景颜色(Win10)

热门文章

  1. About ListView
  2. 我的blog终于开通了!
  3. 一个计算周次和本周时间范围的代码(c#)
  4. Netty4.0学习笔记系列之四:混合使用coder和handler
  5. Redis常见的5种不同的数据类型详解
  6. [JavaScript] - replaceAll,将字符串中的字母或数字等全部替换掉的方式
  7. 完全总结bash中的条件判断test [ [[ 使用
  8. IIS安装与部署,站点的部署与配置
  9. 简单介绍,基于ldirectord的高可用lvs-dr调度器
  10. 利用EEPROM实现arduino的断电存储