寄存器(内存访问)

序言

第二章，我们主要从CPU如何执行指令的角度讲解了8086CPU的逻辑结构、形成物理地址的方法、相关的寄存器以及一些指令。

这一章，我们从访问内存的角度继续学习几个寄存器。

3.1 内存中字的存储

CPU中，用16位寄存器来存储一个字。字是有2个内存单元组成。高8位存放高位字节，低8位存放低位字节。

例如：问题 3.1 所描述的。

（1） 0 地址单元中存放的字节型数据是多少？
（2） 0 地址字单元中存放的字型数据是多少？
（3） 2 地址单元中存放的字节型数据是多少？
（4） 2 地址字单元中存放的字型数据是多少？
（5） 1 地址字单元中存放的字型数据是多少？

答案一目了然，分别是20H、4E20H、12H、0012H、124E。

3.2 DS和[address]

CPU要读写一个内存单元时，必须给出这个内存单元的地址，内存地址由段地址和偏移地址组成。 DS 存放要访问数据的段地址， [address] 中address是偏移地址并且是一个具体的数。

这里注意，DS并不能直接给定一个数值。比如 mov ds,1000H 语句在8086CPU中是错的。我们只能通过寄存器去改变ds的值，比如 mov ds,ax 语句。

问题 3.2

写几条指令，将 al 中的数据送入内存单元 10000H 中。

mov ax,1000H    ;为了让ds为1000H,先让ax为1000H
mov ds,ax       ;ds只接受寄存器向它传送的数据
mov al,[0]      ;[0]是偏移地址,1000:0的内存单元是10000H

3.3 字的传送

8086CPU是 16 位结构，有16根数据线，所以，可以一次性传送16位数据，也就是一个字。

问题 3.3

内存中的情况如下图所示，写出下面指令执行后寄存器ax,bx,cx中的值。

mov ax,1000H    ;AX = 1000H
mov ds,ax       ;DS = 1000H
mov ax,[0]      ;由于传送的是一个字数据,所以AX = 1123H
mov bx,[2]      ;同上,BX = 6622H
mov cx,[1]      ;CX = 2211H
add bx,[1]      ;BX = 8833H
add cx,[2]      ;CX = 8833H

问题 3.4

内存中的情况如图所示，写出下面指令执行后内存中的值。

mov ax,1000H    ;AX = 1000H
mov ds,ax       ;DS = 1000H
mov ax,11316    ;AX = 11316 = 0x2C34H
mov [0],ax      ;1000:0 = 34 , 1000:1 = 2C
mov bx,[0]      ;BX = 2C34
sub bx,[2]      ;BX = 1B12
mov [2],bx      ;1000:2 = 12 , 1000:3 = 1B

我们知道高字节放入高地址，低字节放入低地址。也就是[0]的高地址为1000:1，低地址为1000:0。

3.4 mov、add、sub指令

我们在没什么了解的情况之前就是是要几个了mov、add、sub等指令。

先了解mov指令的几种形式：

mov 寄存器,数据
mov 寄存器,寄存器
mov 寄存器,内存单元
mov 内存单元,寄存器
mov 段寄存器,寄存器

（1）我们猜想，既然有 mov 段寄存器,寄存器 指令，那么会有mov 寄存器,段寄存器指令这样的相反通路吗？

实验如下(再此声明一次：借用了实验楼的环境)：

如图所示：

第一个红框的 AX 为 0000H；
第二个红框是 DS 为 1000H；
第三个红框发生AX的值改变。

由此可知，mov 寄存器,段寄存器指令是可用的。

（2）同样，既然有 mov 寄存器,内存单元 ，会拥有 mov 内存单元,寄存器指令吗？

实验如下：

如图所示，内存单元 1000:0 和 1000:1 发生变化，也就是1000:[0]发生变化。

（3）那么 mov 段寄存器,内存单元 也应该可以。

实验如下：

发现指令出错。

同mov一样， add 和 sub 也有以下几种形式：

add 寄存器,数据
add 寄存器,寄存器
add 寄存器,内存单元
add 内存单元,寄存器sub 寄存器,数据
sub 寄存器,寄存器
sub 寄存器,内存单元
sub 内存单元,寄存器

我们尝试一下 add 段寄存器,ax 指令，看看可行吗？

实验如下：

指令出错。

3.5 数据段

前面提到，可以根据需要，将一组内存单元定义为一个段。我们可以将一组的长度为N(N<=64KB)、地址连续、起始地址为16的倍数的内存单元当作专门存储数据的内存空间。

例如将 123B0H~123B9H 的内存单元定义为数据段。现在要累加这个数据段中的前3个单元中的数据，如下：

mov ax,123BH
mov ds,ax
mov al,0        ;注意,由于题目要求是"单元",而不是"字",所以采用al
add al,[0]
add al,[1]
add al,[2]

问题 3.5

写几条指令，累加数据段中的前3个字型数据。代码如下：

mov ax,123BH
mov ds,ax
mov ax,[0]      ;因为这里采用的是"字"
add ax,[2]
add ax,[4]

3.1~3.5 小结

（1）字在内存中存储时，采用两个地址连续的内存单元来存放，字的低位字节存放在低地址单元中，高位字节存放在高地址单元中。

（2）用 mov 指令访问内存单元，可以在 mov 指令中只给出单元的偏移地址，此时，段地址默认在 DS 寄存器中。

（3）[address] 表示一个偏移地址为 address 的内存单元。

（4）在内存和寄存器之间传送字型数据时，高地址单元和高8位寄存器、低地址单元和低8位寄存器相对应。

（5）mov、add、sub 是具有两个操作对象的指令。jmp 是具有一个操作对象的指令。

（6）可以根据自己的推测，在 Debug 中实验指令的新格式。

其实，最麻烦的就是第6点，每种CPU的汇编指令都会有一些不同，所以在针对不同的CPU时需要去猜测所谓的“新格式”。

检测点 3.1

（1）在 Debug 中，用“d 0:0 1f”查看内存，结果如下。

写出下面每条汇编指令执行后寄存器的值。

mov ax,1        ;AX = 0001H
mov ds,ax       ;DS = 0001H
mov ax,[0000]   ;AX = 2662H
mov bx,[0001]   ;BX = E626H
mov ax,bx       ;AX = E626H
mov ax,[0000]   ;AX = 2662H
mov bx,[0002]   ;BX = D6E6H
add ax,bx       ;AX = FD48H
add ax,[0004]   ;AX = 2C14H
mov ax,0        ;AX = 0000H
mov al,[0002]   ;AL = E6H
mov bx,0        ;BX = 0000H
mov bl,[000c]   ;BL = 26H
add al,bl       ;AL = 0CH

（2）内存中的情况如图 3.6 所示。

各寄存器的初始值：CS=2000H , IP=0 , DS=1000H , AX=0 , BX=0;

写出CPU执行的指令序列(用汇编指令写出)。
写出CPU执行每条指令后，CS、IP和相关寄存器中的数值。
再次体会：数据和程序有区别吗？如何确定内存中的信息哪些是数据，哪些是程序？

①：我们知道CS=2000H，IP=0，所以从2000:0000处开始执行。因此，代码如下。

mov ax,6622H
jmp 0FF0:0100   ;0FF0:0100 == 1000:0
mov ax,2000H
mov ds,ax
mov ax,[0008]
mov ax,[0002]

②：CS:IP的值如下。

指令	CS	IP	ax	ds
mov ax,6622	2000H	0003H	6622H	1000H
jmp 0FF0:0100	OFFOH	0100H	6622H	1000H
mov ax,2000H	0FF0H	0103H	2000H	1000H
mov ds,ax	0FF0H	0105H	2000H	2000H
mov ax,[0008]	0FF0H	0108H	C389H	2000H
mov ax,[0002]	OFFOH	010BH	EA66H	2000H

③：初步猜测，我认为数据和指令无区别。原因，是因为可以将mov bx,ax当做数据传送到[0008]内存中。那我们如何确定是数据还是指令呢？当然是通过我们的CS:IP来确认咯，IP指向的第一个值是我们的指令，例如A1是为 mov ax,内存地址的指令。执行指令后，IP根据指令来确定向后移动几个位置。(以上是本人的猜想，不知道是否成立)

猜想：CP是时钟脉冲，以A1为例子，我们知道读取一个数据需要一个脉冲，A1是需要3个脉冲时间才能完成的操作？

以上是本人猜想，未经过验证。

3.6 栈

栈是一种具有特殊访问方式的存储空间。特殊点在于，数据入栈出栈的次序是“先进后出”或者说“后进先出”（LIFO，Last In First Out）。拥有两种操作：入栈(PUSH)和出栈(POP)。

3.7 CPU 提供的栈机制

CPU 提供相关的指令来以栈的方式访问内存空间。说明了，我们可以将一段内存当做栈来使用。(其实我们编程在写递归的时候，总是很经常没有考虑递归基的情况就运行程序，导致内存溢出。我们通过前面所说内存被当做栈来使用，推导出：其实就是栈内存被使用了无限次，导致的内存溢出结果。)

如下所示是栈的操作：

可以看出高地址单元存放高8位，低地址单元存放低8位。

在这里，我们会疑惑！总结一下，大概是两个问题。

CPU如何知道10000H~1000FH这段空间被当做栈来使用？
push和pop在执行的时候，如何知道哪个单元是栈顶单元？

这里给出答案，8086CPU 中，有两个寄存器SS、IP分别是栈的段地址和偏移地址。在任意时刻，SS:IP 指向栈顶元素。

我们来看看PUSH操作的过程，如图：

反之，则是POP操作过程，如图：

我们看到，POP操作并没有将栈顶之前的值清 0 。

问题 3.6

如果将 10000H~1000FH 这段空间当做栈，初始状态栈是空的，此时，SS=1000H，SP=？

答案显然是最高地址的下一个单元，即10010H。

3.8 栈顶超界的问题

我们知道栈顶的指向有 SS:IP 控制。但并没有控制这栈空间pop次数过多导致下溢以及push多次导致上溢的检测。这样会出现一个问题，我们脑海中的栈空间之外的数据会被栈的pop或者push操作给覆盖，从而导致一系列的错误发生。这非常严重，试想一下，如果C语言编写的一段递归程序没有递归基就运行之后，秒级的时候就会讲内存占满，从而导致RAM死机，计算机只能重启。这也是为什么VC++给程序只分配了4K空间的原因(我记得是4K，若有错误请指正)。

因此，我们在编写汇编程序的时候，需要注意我们的PUSH和POP操作不会导致上溢以及下溢。

3.9 push、pop 指令

push和pop 指令的格式可以是如下形式：

push 寄存器    ;将一个寄存器中的数据入栈
pop  寄存器    ;出栈,用一个寄存器接受出栈的数据
push 段寄存器
pop  段寄存器
push 内存单元
pop  内存单元

问题 3.7
编程，将 10000H~1000FH 这段空间当做栈，初始状态栈是空的，将 AX、BX、DS 中的数据入栈。

mov ax,1000H
mov ss,ax       ;由于是段寄存器,所以需要ax来中转
mov sp,0010H    ;由于栈是由高地址开始
push ax
push bx
push ds

问题 3.8

编程：
（1）将 10000H~1000FH 这段空间当作栈，初始状态栈是空的；
（2）设置 AX=001AH，BX=001BH；
（3）将 AX、BX 中的数据入栈；
（4）然后将AX、BX清零；
（5）从栈中恢复AX、BX原来的内容。

;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H;第二题答案
mov ax,001AH
mov bx,001BH;第三题答案
push ax
push bx;第四题答案
mov ax,0000H
mov bx,0000H;第五题答案
pop bx  ;出栈顺序是LIFO
pop ax  ;同上

问题 3.9
编程：
（1）将 10000H~1000FH 这段空间当做栈，初始状态为空；
（2）设置 AX=001AH，BX=001BH；
（3）利用栈，交换 AX 和 BX 中的数据。

;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H;第二题答案
mov ax,001AH
mov bx,001BH;第三题答案
push ax
push bx
pop ax
pop bx

问题 3.10

如果要在 10000H 处写入字型数据 2266H，可以用以下代码完成：

mov ax,1000H
mov ds,ax
mov ax,2266H
mov [0],ax

补全下面的代码，实现功能：在 10000H 处写入字型数据 2266H 。
要求：不能使用“mov 内存单元,寄存器”这类指令。

;要求三条指令搞定
mov ax,1000H
mov ss,ax
mov sp,2H       ;push是先将sp-=2后再传送数据给SS:SP内存单元中;题目的代码
mov ax,2266H
push ax

栈的综述

（1）8086CPU 提供了栈操作机制，方案如下。

在 SS、IP 中存放栈顶的段地址和偏移地址；
提供入栈和出栈指令，它们根据 SS:SP 指示的地址，按照栈的方式访问内存单元。

（2）push 指令的执行步骤：

SP=SP-2；
向SS:SP指向的字单元中送入数据。

（3）pop 指令的执行步骤：

从 SS:SP 指向的子单元中读取数据；
SP=SP+2。

（4）任意时刻，SS:SP 指向栈顶元素。
（5）8086CPU 只记录栈顶，栈空间的大小我们要自己管理。
（6）用栈来暂存以后需要回复的寄存器的内容时，寄存器出栈的顺序要和入栈的顺序相反。
（7）push、pop 实质上是一种内存传送指令，注意它们的灵活应用。

栈是一种非常重要的机制，一定要深入理解，灵活掌握。

3.10 栈段

在编程时，我们可以根据需要，将一组内存单元定义为一个段。我们要注意控制栈不会超界。

问题 3.11

如果将 10000H~1FFFFH 这段空间当作栈段，初始状态栈是空的，此时，SS=1000H，SP=？

答案很显然，SP= FFFF+1 = 10000H = 0000H。这是一个64K大小的栈段。

问题 3.12
一个栈最大可以设为多少？为什么？

最大可以设为64K，因为SP的范围只能是 0000H~FFFFH 之间。

段的综述

数据段，段地址放在DS中，偏移地址[address]。
代码段，段地址放在CS中，偏移地址IP。
栈段，段地址放在SS中，偏移地址SP。

例如一段代码，假设CS=1000H，IP=0000H：

mov ax,1000H
mov ss,ax
mov sp,0020H
mov ax,cs
mov ds,ax
mov ax,[0]
add ax,[2]
mov bx,[4]
add bx,[6]
push ax
push bx
pop ax
pop bx

这段代码给我们的信息是：在 10000H~1001FH这段内存中，既是代码段，又是栈段和数据段。这样的代码可能会出现数据发生错误，尽量让一段内存当做三者中的一种段。

检测点 3.2

（1）补全下面的程序，使其可以将 10000H~1000FH 中的 8 个字，逆序复制到 20000H~2000FH 中。逆序复制的含义如下图所示。

;题目代码
mov ax,1000H
mov ds,ax;三行代码
mov ax,2000H
mov ss,ax
mov sp,0010H;题目代码
push [0]
push [2]
push [4]
push [6]
push [8]
push [A]
push [C]
push [E]

（2）补全下面的代码，使其可以将 10000H~1000FH 中的 8 个字，逆序复制到 20000H~2000FH 中。

;题目代码
mov ax,2000H
mov ds,ax;三行代码
mov ax,1000H
mov ss,ax
mov sp,0000H;题目代码
pop [E]
pop [C]
pop [A]
pop [8]
pop [6]
pop [4]
pop [2]
pop [0]

实验 2 用机器指令和汇编指令编程

1. 预备知识：Debug 的使用

D命令，查看内存数据。
E命令，修改内存数据。
A命令，输入汇编指令。
U命令，查看汇编程序。

2. 实验任务

（1）使用 Debug，将上面的程序段写入内存，逐条执行，根据指令执行后的实际运行情况填空。

mov ax,FFFF
mov ds,ax
mov ax,2200
mov ss,ax
mov sp,0100;填空
mov ax,[0]      ;我们不考虑AX与BX的值
add ax,[2]
mov bx,[4]
add bx,[6]push ax         ;研究SP的变化,SP = 00FEH
push bx         ;SP = 00FCH
pop ax          ;SP = 00FEH
pop bx          ;SP = 0100Hpush [4]        ;SP = 00FEH
push [6]        ;SP = 00FCH

（2）仔细观察下图的实验过程，然后分析：为什么 2000:0~2000:f 中的内容会发生改变？

我们发现指令 mov ss,ax 被执行后，下一条指令是 mov ax,3123 也就是说一次T指令对ss操作连同sp也执行了。这变相的说明ss和sp需要连续的改变，也就是mov ss,ax之后必须是mov sp,10。

那我们从中寻找原因：如果ss执行后，不立马执行sp会发生什么情况？

百度了一下，回答是这样的，我们的 T指令是中断指令，也就是 T指令执行后需要把相关寄存器信息压入栈中。那么，我们就知道了，SS之后必须跟SP，否则会出现错误。执行后还需要把 T指令相关的东西压入栈中，所以出现了一堆数据。比如：0B39 是 DS 的值等。