寄存器(内存访问)---汇编学习笔记
寄存器(内存访问)
序言
第二章,我们主要从CPU如何执行指令的角度讲解了8086CPU的逻辑结构、形成物理地址的方法、相关的寄存器以及一些指令。
这一章,我们从访问内存的角度继续学习几个寄存器。
3.1 内存中字的存储
CPU中,用16位寄存器来存储一个字。字是有2个内存单元组成。高8位存放高位字节,低8位存放低位字节。
例如:问题 3.1 所描述的。
(1) 0 地址单元中存放的字节型数据是多少?
(2) 0 地址字单元中存放的字型数据是多少?
(3) 2 地址单元中存放的字节型数据是多少?
(4) 2 地址字单元中存放的字型数据是多少?
(5) 1 地址字单元中存放的字型数据是多少?
答案一目了然,分别是20H、4E20H、12H、0012H、124E。
3.2 DS和[address]
CPU要读写一个内存单元时,必须给出这个内存单元的地址,内存地址由段地址和偏移地址组成。 DS 存放要访问数据的段地址, [address] 中address是偏移地址并且是一个具体的数。
这里注意,DS并不能直接给定一个数值。比如 mov ds,1000H 语句在8086CPU中是错的。我们只能通过寄存器去改变ds的值,比如 mov ds,ax 语句。
问题 3.2
写几条指令,将 al 中的数据送入内存单元 10000H 中。
mov ax,1000H ;为了让ds为1000H,先让ax为1000H
mov ds,ax ;ds只接受寄存器向它传送的数据
mov al,[0] ;[0]是偏移地址,1000:0的内存单元是10000H
3.3 字的传送
8086CPU是 16 位结构,有16根数据线,所以,可以一次性传送16位数据,也就是一个字。
问题 3.3
内存中的情况如下图所示,写出下面指令执行后寄存器ax,bx,cx中的值。
mov ax,1000H ;AX = 1000H
mov ds,ax ;DS = 1000H
mov ax,[0] ;由于传送的是一个字数据,所以AX = 1123H
mov bx,[2] ;同上,BX = 6622H
mov cx,[1] ;CX = 2211H
add bx,[1] ;BX = 8833H
add cx,[2] ;CX = 8833H
问题 3.4
内存中的情况如图所示,写出下面指令执行后内存中的值。
mov ax,1000H ;AX = 1000H
mov ds,ax ;DS = 1000H
mov ax,11316 ;AX = 11316 = 0x2C34H
mov [0],ax ;1000:0 = 34 , 1000:1 = 2C
mov bx,[0] ;BX = 2C34
sub bx,[2] ;BX = 1B12
mov [2],bx ;1000:2 = 12 , 1000:3 = 1B
我们知道高字节放入高地址,低字节放入低地址。也就是[0]的高地址为1000:1,低地址为1000:0。
3.4 mov、add、sub指令
我们在没什么了解的情况之前就是是要几个了mov、add、sub等指令。
先了解mov指令的几种形式:
mov 寄存器,数据
mov 寄存器,寄存器
mov 寄存器,内存单元
mov 内存单元,寄存器
mov 段寄存器,寄存器
(1)我们猜想,既然有 mov 段寄存器,寄存器 指令,那么会有mov 寄存器,段寄存器 指令这样的相反通路吗?
实验如下(再此声明一次:借用了实验楼的环境):
如图所示:
- 第一个红框的 AX 为 0000H;
- 第二个红框是 DS 为 1000H;
- 第三个红框发生AX的值改变。
由此可知,mov 寄存器,段寄存器指令是可用的。
(2)同样,既然有 mov 寄存器,内存单元 ,会拥有 mov 内存单元,寄存器 指令吗?
实验如下:
如图所示,内存单元 1000:0 和 1000:1 发生变化,也就是1000:[0]发生变化。
(3)那么 mov 段寄存器,内存单元 也应该可以。
实验如下:
发现指令出错。
同mov一样, add 和 sub 也有以下几种形式:
add 寄存器,数据
add 寄存器,寄存器
add 寄存器,内存单元
add 内存单元,寄存器sub 寄存器,数据
sub 寄存器,寄存器
sub 寄存器,内存单元
sub 内存单元,寄存器
我们尝试一下 add 段寄存器,ax 指令,看看可行吗?
实验如下:
指令出错。
3.5 数据段
前面提到,可以根据需要,将一组内存单元定义为一个段。我们可以将一组的长度为N(N<=64KB)、地址连续、起始地址为16的倍数的内存单元当作专门存储数据的内存空间。
例如将 123B0H~123B9H 的内存单元定义为数据段。现在要累加这个数据段中的前3个单元中的数据,如下:
mov ax,123BH
mov ds,ax
mov al,0 ;注意,由于题目要求是"单元",而不是"字",所以采用al
add al,[0]
add al,[1]
add al,[2]
问题 3.5
写几条指令,累加数据段中的前3个字型数据。代码如下:
mov ax,123BH
mov ds,ax
mov ax,[0] ;因为这里采用的是"字"
add ax,[2]
add ax,[4]
3.1~3.5 小结
(1)字在内存中存储时,采用两个地址连续的内存单元来存放,字的低位字节存放在低地址单元中,高位字节存放在高地址单元中。
(2)用 mov 指令访问内存单元,可以在 mov 指令中只给出单元的偏移地址,此时,段地址默认在 DS 寄存器中。
(3)[address] 表示一个偏移地址为 address 的内存单元。
(4)在内存和寄存器之间传送字型数据时,高地址单元和高8位寄存器、低地址单元和低8位寄存器相对应。
(5)mov、add、sub 是具有两个操作对象的指令。jmp 是具有一个操作对象的指令。
(6)可以根据自己的推测,在 Debug 中实验指令的新格式。
其实,最麻烦的就是第6点,每种CPU的汇编指令都会有一些不同,所以在针对不同的CPU时需要去猜测所谓的“新格式”。
检测点 3.1
(1)在 Debug 中,用“d 0:0 1f”查看内存,结果如下。
写出下面每条汇编指令执行后寄存器的值。
mov ax,1 ;AX = 0001H
mov ds,ax ;DS = 0001H
mov ax,[0000] ;AX = 2662H
mov bx,[0001] ;BX = E626H
mov ax,bx ;AX = E626H
mov ax,[0000] ;AX = 2662H
mov bx,[0002] ;BX = D6E6H
add ax,bx ;AX = FD48H
add ax,[0004] ;AX = 2C14H
mov ax,0 ;AX = 0000H
mov al,[0002] ;AL = E6H
mov bx,0 ;BX = 0000H
mov bl,[000c] ;BL = 26H
add al,bl ;AL = 0CH
(2)内存中的情况如图 3.6 所示。
各寄存器的初始值:CS=2000H , IP=0 , DS=1000H , AX=0 , BX=0;
- 写出CPU执行的指令序列(用汇编指令写出)。
- 写出CPU执行每条指令后,CS、IP和相关寄存器中的数值。
- 再次体会:数据和程序有区别吗?如何确定内存中的信息哪些是数据,哪些是程序?
①:我们知道CS=2000H,IP=0,所以从2000:0000处开始执行。因此,代码如下。
mov ax,6622H
jmp 0FF0:0100 ;0FF0:0100 == 1000:0
mov ax,2000H
mov ds,ax
mov ax,[0008]
mov ax,[0002]
②:CS:IP的值如下。
指令 | CS | IP | ax | ds |
---|---|---|---|---|
mov ax,6622 | 2000H | 0003H | 6622H | 1000H |
jmp 0FF0:0100 | OFFOH | 0100H | 6622H | 1000H |
mov ax,2000H | 0FF0H | 0103H | 2000H | 1000H |
mov ds,ax | 0FF0H | 0105H | 2000H | 2000H |
mov ax,[0008] | 0FF0H | 0108H | C389H | 2000H |
mov ax,[0002] | OFFOH | 010BH | EA66H | 2000H |
③:初步猜测,我认为数据和指令无区别。原因,是因为可以将mov bx,ax当做数据传送到[0008]内存中。那我们如何确定是数据还是指令呢?当然是通过我们的CS:IP来确认咯,IP指向的第一个值是我们的指令,例如A1是为 mov ax,内存地址 的指令。执行指令后,IP根据指令来确定向后移动几个位置。(以上是本人的猜想,不知道是否成立)
猜想:CP是时钟脉冲,以A1为例子,我们知道读取一个数据需要一个脉冲,A1是需要3个脉冲时间才能完成的操作?
以上是本人猜想,未经过验证。
3.6 栈
栈是一种具有特殊访问方式的存储空间。特殊点在于,数据入栈出栈的次序是“先进后出”或者说“后进先出”(LIFO,Last In First Out)。拥有两种操作:入栈(PUSH)和出栈(POP)。
3.7 CPU 提供的栈机制
CPU 提供相关的指令来以栈的方式访问内存空间。说明了,我们可以将一段内存当做栈来使用。(其实我们编程在写递归的时候,总是很经常没有考虑递归基的情况就运行程序,导致内存溢出。我们通过前面所说内存被当做栈来使用,推导出:其实就是栈内存被使用了无限次,导致的内存溢出结果。)
如下所示是栈的操作:
可以看出高地址单元存放高8位,低地址单元存放低8位。
在这里,我们会疑惑!总结一下,大概是两个问题。
- CPU如何知道10000H~1000FH这段空间被当做栈来使用?
- push和pop在执行的时候,如何知道哪个单元是栈顶单元?
这里给出答案,8086CPU 中,有两个寄存器SS、IP分别是栈的段地址和偏移地址。在任意时刻,SS:IP 指向栈顶元素。
我们来看看PUSH操作的过程,如图:
反之,则是POP操作过程,如图:
我们看到,POP操作并没有将栈顶之前的值 清 0 。
问题 3.6
如果将 10000H~1000FH 这段空间当做栈,初始状态栈是空的,此时,SS=1000H,SP=?
答案显然是最高地址的下一个单元,即10010H。
3.8 栈顶超界的问题
我们知道栈顶的指向有 SS:IP 控制。但并没有控制这栈空间pop次数过多导致下溢以及push多次导致上溢的检测。这样会出现一个问题,我们脑海中的栈空间之外的数据会被栈的pop或者push操作给覆盖,从而导致一系列的错误发生。这非常严重,试想一下,如果C语言编写的一段递归程序没有递归基就运行之后,秒级的时候就会讲内存占满,从而导致RAM死机,计算机只能重启。这也是为什么VC++给程序只分配了4K空间的原因(我记得是4K,若有错误请指正)。
因此,我们在编写汇编程序的时候,需要注意我们的PUSH和POP操作不会导致上溢以及下溢。
3.9 push、pop 指令
push和pop 指令的格式可以是如下形式:
push 寄存器 ;将一个寄存器中的数据入栈
pop 寄存器 ;出栈,用一个寄存器接受出栈的数据
push 段寄存器
pop 段寄存器
push 内存单元
pop 内存单元
问题 3.7
编程,将 10000H~1000FH 这段空间当做栈,初始状态栈是空的,将 AX、BX、DS 中的数据入栈。
mov ax,1000H
mov ss,ax ;由于是段寄存器,所以需要ax来中转
mov sp,0010H ;由于栈是由高地址开始
push ax
push bx
push ds
问题 3.8
编程:
(1)将 10000H~1000FH 这段空间当作栈,初始状态栈是空的;
(2)设置 AX=001AH,BX=001BH;
(3)将 AX、BX 中的数据入栈;
(4)然后将AX、BX清零;
(5)从栈中恢复AX、BX原来的内容。
;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H;第二题答案
mov ax,001AH
mov bx,001BH;第三题答案
push ax
push bx;第四题答案
mov ax,0000H
mov bx,0000H;第五题答案
pop bx ;出栈顺序是LIFO
pop ax ;同上
问题 3.9
编程:
(1)将 10000H~1000FH 这段空间当做栈,初始状态为空;
(2)设置 AX=001AH,BX=001BH;
(3)利用栈,交换 AX 和 BX 中的数据。
;第一题答案
mov ax,1000H
mov ss,ax
mov sp,0010H;第二题答案
mov ax,001AH
mov bx,001BH;第三题答案
push ax
push bx
pop ax
pop bx
问题 3.10
如果要在 10000H 处写入字型数据 2266H,可以用以下代码完成:
mov ax,1000H
mov ds,ax
mov ax,2266H
mov [0],ax
补全下面的代码,实现功能:在 10000H 处写入字型数据 2266H 。
要求:不能使用“mov 内存单元,寄存器”这类指令。
;要求三条指令搞定
mov ax,1000H
mov ss,ax
mov sp,2H ;push是先将sp-=2后再传送数据给SS:SP内存单元中;题目的代码
mov ax,2266H
push ax
栈的综述
(1)8086CPU 提供了栈操作机制,方案如下。
- 在 SS、IP 中存放栈顶的段地址和偏移地址;
- 提供入栈和出栈指令,它们根据 SS:SP 指示的地址,按照栈的方式访问内存单元。
(2)push 指令的执行步骤:
- SP=SP-2;
- 向SS:SP指向的字单元中送入数据。
(3)pop 指令的执行步骤:
- 从 SS:SP 指向的子单元中读取数据;
- SP=SP+2。
(4)任意时刻,SS:SP 指向栈顶元素。
(5)8086CPU 只记录栈顶,栈空间的大小我们要自己管理。
(6)用栈来暂存以后需要回复的寄存器的内容时,寄存器出栈的顺序要和入栈的顺序相反。
(7)push、pop 实质上是一种内存传送指令,注意它们的灵活应用。
栈是一种非常重要的机制,一定要深入理解,灵活掌握。
3.10 栈段
在编程时,我们可以根据需要,将一组内存单元定义为一个段。我们要注意控制栈不会超界。
问题 3.11
如果将 10000H~1FFFFH 这段空间当作栈段,初始状态栈是空的,此时,SS=1000H,SP=?
答案很显然,SP= FFFF+1 = 10000H = 0000H。这是一个64K大小的栈段。
问题 3.12
一个栈最大可以设为多少?为什么?
最大可以设为64K,因为SP的范围只能是 0000H~FFFFH 之间。
段的综述
- 数据段,段地址放在DS中,偏移地址[address]。
- 代码段,段地址放在CS中,偏移地址IP。
- 栈段,段地址放在SS中,偏移地址SP。
例如一段代码,假设CS=1000H,IP=0000H:
mov ax,1000H
mov ss,ax
mov sp,0020H
mov ax,cs
mov ds,ax
mov ax,[0]
add ax,[2]
mov bx,[4]
add bx,[6]
push ax
push bx
pop ax
pop bx
这段代码给我们的信息是:在 10000H~1001FH这段内存中,既是代码段,又是栈段和数据段。这样的代码可能会出现数据发生错误,尽量让一段内存当做三者中的一种段。
检测点 3.2
(1)补全下面的程序,使其可以将 10000H~1000FH 中的 8 个字,逆序复制到 20000H~2000FH 中。逆序复制的含义如下图所示。
;题目代码
mov ax,1000H
mov ds,ax;三行代码
mov ax,2000H
mov ss,ax
mov sp,0010H;题目代码
push [0]
push [2]
push [4]
push [6]
push [8]
push [A]
push [C]
push [E]
(2)补全下面的代码,使其可以将 10000H~1000FH 中的 8 个字,逆序复制到 20000H~2000FH 中。
;题目代码
mov ax,2000H
mov ds,ax;三行代码
mov ax,1000H
mov ss,ax
mov sp,0000H;题目代码
pop [E]
pop [C]
pop [A]
pop [8]
pop [6]
pop [4]
pop [2]
pop [0]
实验 2 用机器指令和汇编指令编程
1. 预备知识:Debug 的使用
- D命令,查看内存数据。
- E命令,修改内存数据。
- A命令,输入汇编指令。
- U命令,查看汇编程序。
2. 实验任务
(1)使用 Debug,将上面的程序段写入内存,逐条执行,根据指令执行后的实际运行情况填空。
mov ax,FFFF
mov ds,ax
mov ax,2200
mov ss,ax
mov sp,0100;填空
mov ax,[0] ;我们不考虑AX与BX的值
add ax,[2]
mov bx,[4]
add bx,[6]push ax ;研究SP的变化,SP = 00FEH
push bx ;SP = 00FCH
pop ax ;SP = 00FEH
pop bx ;SP = 0100Hpush [4] ;SP = 00FEH
push [6] ;SP = 00FCH
(2)仔细观察下图的实验过程,然后分析:为什么 2000:0~2000:f 中的内容会发生改变?
我们发现指令 mov ss,ax 被执行后,下一条指令是 mov ax,3123 也就是说 一次T指令对ss操作连同sp也执行了。这变相的说明ss和sp需要连续的改变,也就是mov ss,ax之后必须是mov sp,10。
那我们从中寻找原因:如果ss执行后,不立马执行sp会发生什么情况?
百度了一下,回答是这样的,我们的 T指令 是中断指令,也就是 T指令 执行后需要把相关寄存器信息压入栈中。那么,我们就知道了,SS之后必须跟SP,否则会出现错误。执行后还需要把 T指令 相关的东西压入栈中,所以出现了一堆数据。比如:0B39 是 DS 的值等。
寄存器(内存访问)---汇编学习笔记相关推荐
- 汇编学习笔记——汇编指令
目录 汇编指令 nop指令 mov.add.sub指令 adc.sbb指令 and.or指令 移位指令 逻辑左/右移指令 循环左/右移指令 算术左/右移指令 带进位循环左/右移指令 inc指令 pus ...
- 《深入理解LINUX内存管理》学习笔记(一)
引子 为什么要写这个笔记: 1,这本书的中文版翻译了太垃圾,没法阅读.阅读英文原版,可以很好的理解作者的思路.作此笔记备忘 2,一直以来学习LINUX kernel的知识缺乏系统化,借对这本书的学习, ...
- 汇编学习笔记——伪指令
目录 伪指令 段定义 结束标记 段关联标记 数据定义 标号 offset指令 seg指令 地址标号 数据标号 代码分段 程序标识 多文件系统 字符输入 重复定义 注释 重复汇编伪指令 伪指令汇总 伪指 ...
- 汇编学习笔记:对抗反汇编实验2019092801
汇编学习笔记:对抗反汇编实验2019092801 实验描述 实验环境 实验过程 实验结论 实验描述 使用相连的jz和jnz指令跳转到紧接着jnz指令的call指令的第二个字节.call指令实际上无效. ...
- 寄存器---汇编学习笔记
第二章 寄存器 2.0 寄存器的绪论 一个典型的CPU由运算器.控制器.寄存器(CPU工作原理)等器件构成.内部总线实现 CPU 内部各个器件之间的联系,外部总线实现CPU和主板其他器件的联系. 在C ...
- 汇编语言学习-寄存器(内存访问)
内存中字的存储: 两个16进制位是一个字节! 0号单元是低地址单元,1号单元是高地址单元. 0地址单元中存放的字节型数据是多少? 注意区别:"0地址单元"指向的就是:20H 0地址 ...
- Java虚拟机(JVM)与Java内存模型(JMM)学习笔记
Java虚拟机[JVM]与Java内存模型[JMM]学习笔记 Java虚拟机(JVM) 三种JVM JVM 位置 JVM的主要组成部分及其作用 类加载器 双亲委派机制 沙箱安全机制 Java本地接口( ...
- GNU C内嵌汇编学习笔记
前文所述,只是针对汇编格式的整理,本文将使用coreboot项目代码对其进行实例化.以方便.清晰了解到如何在C语言里使用内嵌汇编的方法.同样地,网络上也有众多文章涉及到这方面,所以本文更多是归纳总结. ...
- Arm V8内存管理架构.学习笔记
目录 第1章 分级存储架构 1.1基础认识 1.1.1 从数据通路描述 1.1.2 从数据交换单位描述 1.1.3 Cache数据一致性拓扑结构 1.2 系统层内存模型 1.2.1 内存属性 1.2. ...
最新文章
- 制作initrd(2):update-initramfs和mkinitramfs脚本分析
- 一个浏览器插件,测试xpath的工具
- mysql jdbc无法连接_jdbc无法连接mysql
- staf工作笔记-扩展stax官方实例的补坑说明
- 解耦知识蒸馏,让Hinton在7年前提出的方法重回SOTA行列(CVPR 2022)
- go语言 格式化输出
- mysql中如何将几个没有关系的结果集放在一起
- [轉載]Google C++編程風格指南(四):智能指針和其他C++特性
- poj 3384 Feng Shui (Half Plane Intersection)
- atheros无线网卡驱动_5.8G无线网桥CPE,安防监控拍档高清无干扰
- Microsoft Visual Studio Team Foundation Server Express 2013 (一) 服务器端安装和配置
- 计算点、线、面等元素之间的交点、交线、封闭区域面积和闭合集(待续)
- 拓端tecdat|共享单车大数据报告
- kubernetes 集群管理平台
- SQL server中关于年月日周的添加
- UML 返回消息的虚线箭头 如何画
- 使用SDK Manager给TX2刷机且安装OpenCV3.4.0、CUDNN7.6.5、Pytorch、Miniforge(含百度云安装包)
- ce逆向修改——植物大战僵尸针对“阳光值”
- Android适配阿拉伯语、波斯语语系
- Qt QListWidget 实现播放列表效果,双击增高选中项