CPU执行的也不只是一条指令,一般一个程序包含很多条指令
因为有if…else、for这样的条件和循环存在,这些指令也不会一路平直执行下去。

一个计算机程序是怎么被分解成一条条指令来执行的呢

1 CPU如何执行指令

CPU里差不多几百亿个晶体管
实际上,一条条计算机指令执行起来非常复杂
好在CPU在软件层面已经为我们做好了封装
对于程序员来说,我们只要知道,写好的代码变成了指令之后,是一条一条顺序执行

不管几百亿的晶体管的背后是怎么通过电路运转起来的
逻辑上,我们可以认为,CPU其实就是由一堆寄存器组成的
而寄存器就是CPU内部,由多个触发器(Flip-Flop)或者锁存器(Latches)组成的简单电路。

触发器和锁存器,其实就是两种不同原理的数字电路组成的逻辑门
如果想要深入学习的话,可以学习数字电路的相关课程

N个触发器或者锁存器,就可以组成一个N位(Bit)的寄存器,能够保存N位的数据
比方说,我们用的64位Intel服务器,寄存器就是64位的

CPU里有很多种不同功能的

1.1 寄存器

寄存器(Register),是中央处理器内的其中组成部分。寄存器是有限存贮容量的高速存贮部件,它们可用来暂存指令、数据和地址。在中央处理器的控制部件中,包含的寄存器有指令寄存器(IR)和程序计数器。在中央处理器的算术及逻辑部件中,包含的寄存器有累加器。

在计算机体系结构里,处理器中的寄存器是少量且速度快的计算机存储器,借由提供快速共同地访问数值来加速计算机程序的运行:典型地说就是在已知时间点所作的之计算中间的数值。

寄存器是存储器层次结构中的最顶端,也是系统操作数据的最快速途径。寄存器通常都是以他们可以保存的比特数量来估量,举例来说,一个8位寄存器或32位寄存器。寄存器现在都以寄存器数组的方式来实现,但是他们也可能使用单独的触发器、高速的核心存储器、薄膜存储器以及在数种机器上的其他方式来实现出来。

这个名词通常都用来意指由一个指令之输出或输入可以直接索引到的寄存器组群。更适当的是称他们为“架构寄存器”。例如,x86指令集定义八个32位寄存器的集合,但一个实现x86指令集的CPU可以包含比八个更多的寄存器。

1.1.1 PC寄存器(Program Counter Register)

亦称指令地址寄存器(Instruction Address Register)

存放下一条需要执行的计算机指令的内存地址

1.1.2 指令寄存器(Instruction Register)

存放当前正在执行的指令

1.1.3 条件码寄存器(Status Register)

用里面的一个一个标记位(Flag),存放CPU进行算术或者逻辑计算的结果

CPU里面还有更多用来存储数据和内存地址的寄存器
这样的寄存器通常一类里面不止一个
通常根据存放的数据内容来给它们取名字,比如

  • 常量寄存器
    用来持有只读的数值(例如0、1、圆周率等等)。由于“其中的值不可更改”这一特殊性质,这些寄存器未必会有实体的硬件电路相对应,例如将从零常数寄存器读的操作实现为接通目标寄存器的下拉电阻。
    一般而言,即使真正在硬件中放置常数寄存器也未必会是出于体系结构理论上的考虑,而很可能是由硬件描述语言为了简化操作而自动生成的电路
  • 整数寄存器
    用来存储整数数字(参考以下的浮点寄存器)。在某些简单(或旧)的CPU,特别的数据寄存器是累加器,作为数学计算之用。
  • 浮点数寄存器(FPRs)
    用来存储浮点数字。
  • 向量寄存器
    用来存储由向量处理器运行SIMD指令所得到的数据。
  • 地址寄存器
    持有存储器地址,以及用来访问存储器。在某些简单/旧的CPU里,特别的地址寄存器是索引寄存器(可能出现一个或多个)。

有些寄存器既可以存放数据,又能存放地址,我们就叫它通用寄存器(GPRs)。

程序执行的时候,CPU会

  1. 根据PC寄存器里的地址
  2. 从内存里面把需要执行的指令读取到指令寄存器里面执行
  3. 然后根据指令长度自增
  4. 开始顺序读取下一条指令

可以看到,一个程序的一条条指令,在内存里是连续保存的,也会一条条顺序加载

而有些特殊指令,比如上一讲我们讲到J类指令,也就是跳转指令,会修改PC寄存器里面的地址值
这样,下一条要执行的指令就不是从内存里面顺序加载的了
事实上,这些跳转指令的存在,也是我们可以在写程序的时候,使用

  • if…else条件语句
  • while/for循环语句

的原因

2 从if/else看程序的执行和跳转

我们现在就来看一个包含if…else的简单程序。

  • test.c

用rand生成了一个随机数r(0/1)

  • 当r是0,我们把之前定义的变量a设成1
  • 不然就设成2

我们把这个程序编译成汇编代码。你可以忽略前后无关的代码,只关注于这里的if…else条件判断语句

  • 对应的汇编代码是这样的

对于r == 0的条件判断,被编译成了cmp和jne两条指令。

  • cmp指令比较了前后两个操作数的值
    DWORD PTR 代表操作的数据类型是32位的整数
    [rbp-0x4]则是一个寄存器的地址
    第一个操作数就是从寄存器里拿到的变量r的值
    第二个操作数0x0就是我们设定的常量0的16进制表示

cmp指令的比较结果,会存入到条件码寄存器

状态寄存器又名条件码寄存器,它是计算机系统的核心部件——运算器的一部分
状态寄存器用来存放两类信息:
一类是体现当前指令执行结果的各种状态信息(条件码),如有无进位(CF位)、有无溢出(OF位)、结果正负(SF位)、结果是否为零(ZF位)、奇偶标志位(P位)等
另一类是存放控制信息(PSW:程序状态字寄存器),如允许中断(IF位)、跟踪标志(TF位)等
有些机器中将PSW称为标志寄存器FR(Flag Register)。

如果比较结果 True,即 r == 0,就把零标志条件码(对应的条件码是ZF,Zero Flag)设置为1

条件码是CPU根据运算结果由硬件设置的位,体现当前指令执行结果的各种状态信息
例如:算术运算产生的正、负、零或溢出等的结果。条件码可被测试,作为分支运算的依据,此外,有些条件码可被设置,例如对于最高位进位标志C,可用指令对它置位和复位。

Intel的CPU下还有

  • 进位标志(CF,Carry Flag)
    最近的操作使最高位产生了进位。可以用来检查无符号操作数据的溢出。
  • 符号标志(SF,Sign Flag)
    最近的操作得到的结果为负数。
  • 溢出标志(OF,Overflow Flag)
    最近的操作导致一个补码溢出–正溢出或负溢出

用在不同的判断条件下。

cmp指令执行完成之后,PC寄存器会自增,开始执行下一条jne的指令

跟着的jne指令(jump if not equal),它会查看对应的零标志位
如果为0,会跳转到后面跟着的操作数4a的位置
4a,对应汇编代码的行号,也就是else条件里的第一条指令
当跳转发生,PC寄存器不再是自增变成下一条指令的地址,而被直接设置4a这个地址
这个时候,CPU再把4a地址里的指令加载到指令寄存器执行。

跳转到执行地址为4a的指令,实际是一条mov指令
第一个操作数和前面的cmp指令一样,是另一个32位整型的寄存器地址,以及对应的2的16进制值0x2
mov指令把2设置到对应的寄存器里去,相当于一个赋值操作
然后,PC寄存器里的值继续自增,执行下一条mov指令。

这条mov指令的第一个操作数eax,代表累加寄存器

在中央处理器中,累加器 (accumulator) 是一种寄存器,用来储存计算产生的中间结果。如果没有像累加器这样的寄存器,那么在每次计算 (加法,乘法,移位等等) 后就必须要把结果写回到 内存,也许马上就得读回来。然而存取主存的速度是比从算术逻辑单元到有直接路径的累加器存取更慢。

第二个操作数0x0则是16进制的0的表示。这条指令其实没有实际的作用,它的作用是一个占位符
if条件如果满足,在赋值的mov指令执行完成之后,有一个jmp的无条件跳转指令
跳转的地址就是这一行的地址51
我们的main函数没有设定返回值,而mov eax, 0x0 其实就是给main函数生成了一个默认的为0的返回值到累加器里面
if条件里面的内容执行完成之后也会跳转到这里,和else里的内容结束之后的位置是一样的。

上一讲我们讲打孔卡的时候说到,读取打孔卡的机器会顺序地一段一段地读取指令,然后执行。
执行完一条指令,它会自动地顺序读取下一条指令
如果执行的当前指令带有跳转的地址,比如往后跳10个指令,那么机器会自动将卡片带往后移动10个指令的位置,再来执行指令
同样的,机器也能向前移动,去读取之前已经执行过的指令
这也就是我们的while/for循环实现的原理。

如何通过if…else和goto来实现循环?

我们再看一段简单的利用for循环的程序。我们循环自增变量i三次,三次之后,i>=3,就会跳出循环。整个程序,对应的Intel汇编代码就是这样的:

可以看到,对应的循环也是用1e这个地址上的cmp比较指令
和紧接着的jle条件跳转指令来实现的

主要的差别在于,这里的jle跳转的地址,在这条指令之前的地址14,而非if…else编译出来的跳转指令之后
往前跳转使得条件满足的时候,PC寄存器会把指令地址设置到之前执行过的指令位置,重新执行之前执行过的指令,直到条件不满足,顺序往下执行jle之后的指令,整个循环才结束。

如果你看一长条打孔卡的话,就会看到卡片往后移动一段,执行了之后,又反向移动,去重新执行前面的指令。

jle和jmp指令,有点像程序语言里面的goto命令,直接指定了一个特定条件下的跳转位置
虽然我们在用高级语言开发程序的时候反对使用goto,但是实际在机器指令层面,无论是if…else…也好,还是for/while也好,都是用和goto相同的跳转到特定指令位置的方式来实现的。

3 总结

学习了程序里的多条指令,究竟是怎么样一条一条被执行的
除了简单地通过PC寄存器自增的方式顺序执行外
条件码寄存器会记录下当前执行指令的条件判断状态
然后通过跳转指令读取对应的条件码
修改PC寄存器内的下一条指令的地址
最终实现if…else以及for/while这样的程序控制流程。

虽然我们可以用高级语言,可以用不同的语法,比如 if…else 这样的条件分支,或者 while/for 这样的循环方式,来实现不用的程序运行流程
但是回归到计算机可以识别的机器指令级别,其实都只是一个简单的地址跳转而已,也就是一个类似于goto的语句。

想要在硬件层面实现这个goto语句,除了本身需要用来保存下一条指令地址,以及当前正要执行指令的PC寄存器、指令寄存器外
我们只需要再增加一个条件码寄存器,来保留条件判断的状态。这样简简单单的三个寄存器,就可以实现条件判断和循环重复执行代码的功能。

4 推荐阅读

  • 《深入理解计算机系统》的第3章
    详细讲解了C语言和Intel CPU的汇编语言以及指令的对应关系,以及Intel CPU的各种寄存器和指令集。

Intel指令集相对于之前的MIPS指令集要复杂一些

  • 所有的指令是变长的
    从1个字节到15个字节不等
  • 即使是汇编代码,还有很多针对操作数据的长度不同有不同的后缀

参考

  • 状态寄存器
  • 寄存器
  • 条件码
  • 累加器
  • 深入浅出计算机组成原理

重学计算机组成原理(五)- 旋转跳跃的指令实现相关推荐

  1. 重学计算机组成原理(三)- 进击,更强的性能!

    在上一篇中,我们谈到过 程序的CPU执行时间 = 指令数×CPI×Clock Cycle Time 要提升计算机的性能,可以从上面这三方面着手. 通过指令数/CPI,好像都太难了. 因此工程师们,就在 ...

  2. 重学计算机组成原理(十二)- 加法器

    下面这些门电路的标识,你需要非常熟悉,后续的电路都是由这些门电路组合起来的. 这些基本的门电路,是我们计算机硬件端的最基本的"积木" 包含十亿级别晶体管的现代CPU,都是由这样一个 ...

  3. 重学计算机组成原理(十)- 烫烫烫乱码的由来

    程序 = 算法 + 数据结构 对应到计算机的组成原理(硬件层面) 算法 - 各种计算机指令 数据结构 - 二进制数据 计算机用0/1组成的二进制,来表示所有信息 程序指令用到的机器码,是使用二进制表示 ...

  4. 计算机组成原理 五,重学计算机组成原理(五)

    CPU执行的也不只是一条指令,一般一个程序包含很多条指令 因为有if-else.for这样的条件和循环存在,这些指令也不会一路平直执行下去. 一个计算机程序是怎么被分解成一条条指令来执行的呢 1 CP ...

  5. 重学计算机组成原理(一) —— 冯诺伊曼结构

    背景介绍 第一台通用电子计算机 ENIAC EDVAC -> 冯诺伊曼关于EDVAC的报告草案,即是冯诺伊曼结构计算机的起始 EDSAC UNIVAC 冯诺伊曼结构要点 在冯诺依曼署名的< ...

  6. 重学计算机组成原理(十一)- 门电路的千里传音

    人用纸和笔来做运算,都是用十进制,直接用十进制和我们最熟悉的符号不是最简单么? 为什么计算机里我们最终要选择二进制呢? 来看看,计算机在硬件层面究竟是怎么表示二进制的,你就会明白,为什么计算机会选择二 ...

  7. 河北工程大学计算机考试试题,河北工程大学计算机组成原理08-09考试题B卷.doc...

    河北工程大学计算机组成原理08-09考试题B卷 晰甫瑰瑶怂栗馆物抹应限范钞扶张膳矣沁部忌喀咕层嘲恿晋懈开牺专坯奔校便勃尾翁虽荔赌玻壁测芹迪渊降犹苞盲四酬钱妨凄梭掩把由宫燎浦丰言频烫揩蒜崭滨姆碧孝规改曝 ...

  8. 湖南工业大学计算机组成原理,计算机组成原理实验指导书_湖南工业大学.pptx

    计算机组成原理实验指导书_湖南工业大学 计算机组成原理实验指导书;实验一 算术逻辑运算实验一.实验目的1.掌握简单运算器的组成以及数据传送通路.2.验证运算功能发生器(74LS181)的组合功能.二. ...

  9. 计算机组成原理试卷五套,计算机组成原理(五套试题)

    计算机组成原理(五套试题) 计算机组成原理试题(一) 一.选择题(共20分,每题1分) 1.零地址运算指令在指令格式中不给出操作数地址,它的操作数来自______. A.立即数和栈顶: B.暂存器: ...

  10. 重学计算机(六、程序是怎么运行的)

    今天我们又来肝一个重要的主题.不知道大家有没有思考过,程序是怎么运行起来的? 肯定有同学说在linux下./hello_world就可以执行了,在windows下双点hello_world.exe文件 ...

最新文章

  1. spring elasticsearch 按条件删除_Elasticsearch系列之Query DSL
  2. 梯度累加策略对准确率的影响
  3. linux下core dump--转载
  4. 【机器学习】K-Means算法的原理流程、代码实现及优缺点
  5. hdu 1880 魔咒词典
  6. P1579哥德巴赫猜想
  7. 10大最重要的Web安全风险之三----A3,错误的认证和会话管理
  8. 计算机基础知识 音频,计算机基础知识(总结+试题).pdf
  9. IOS开发之实现App消息推送(最新)
  10. 2021-2025年中国电子束加速器行业市场供需与战略研究报告
  11. 【2(2N+1)魔方阵 】
  12. Android 常用抓包工具介绍之Charles
  13. NetApp 数据存储解决方案
  14. 硬盘安装XP蓝屏,U盘安装XP提示INF file txtsetup……
  15. 知乎网站胡说八道,误人子弟!
  16. 计算机英语期末试题,计算机英语期末考试试题
  17. 描绘软件结构的图形工具:层次图和结构图(层次图和层次方框图的区别)
  18. PHP实现数字金额轻松转成中文繁体大写
  19. linux网络接口lo,linux网络接口介绍
  20. 千牛中文件已存在于服务器上,千牛登陆在云服务器上

热门文章

  1. 极域电子教室怎么修改学生端频道号
  2. 项目经理需要什么职称 计算机,项目经理要什么职称
  3. MTK G-sensor 1
  4. java 将pdf转换成word_java实现pdf转word(文字)
  5. java山地车 故障,山地车经常会出现的十个小故障,你都遇到了几个
  6. 斯坦福大学公开课:编程方法学
  7. iPhone中BigBoss源添加以及SBSettings安装。
  8. 【教学类-12-08】20221111《连连看竖版6*6 (3套题目空心图案(中班教学)》(中班主题《》)
  9. TOM邮箱容量满了收发不了邮件?你应该快速做到这些事
  10. 测试minio集群的上传下载速度