《到底什么是Cortex、ARMv8、arm架构、ARM指令集、soc?一文帮你梳理基础概念【科普】》
关于ARM指令用到的IDE开发环境可以参考下面这篇文章
《1. 从0开始学ARM-安装Keil MDK uVision集成开发环境》
《2. 从0开始学ARM-CPU原理,基于ARM的SOC讲解》

《3. 从0开始学ARM-ARM模式、寄存器、流水线》

五、ARM指令,移位、数据处理、BL、机器码

学习ARM,就必须要学习ARM指令,ARM指令是CPU提供给我们的接口,是我们打开CPU这个潘多拉魔盒的钥匙。

ARM指令有很多,为了让大家能快速上手,一口君整理了一些对我们最有帮助的指令。keil软件的操作,可以参考第一章。

让我们开始吧!

0.指令分类

  1. 数据处理指令
    数据处理指令可分为数据传送指令、算术逻辑运算指令和比较指令等。

  2. 数据传送指令用于在寄存器和存储器之间进行数据的双向传输。

  3. 算术逻辑运算指令完成常用的算术与逻辑的运算,该类指令不但将运算结果保存在目的寄存器中,同时更新CPSR中的相应条件标志位。

一、MOV指令

1、MOV

语法:

MOV{条件}{S}   目的寄存器,源操作数

功能:
MOV指令完成从另一个寄存器、被移位的寄存器或将一个立即数加载到目的寄存器。其中S选项决定指令的操作是否影响CPSR中条件标志位的值,当没有S时指令不更新CPSR中条件标志位的值。

指令示例:

MOV r0, #0x1 ;将立即数0x1传送到寄存器R0
MOV R1,R0  ;将寄存器R0的值传送到寄存器R1
MOV PC,R14   ;将寄存器R14的值传送到PC,常用于子程序返回
MOV R1,R0,LSL #3  ;将寄存器R0的值左移3位后传送到R1

【注:不区分大小写】

思考,为什么以下赋值出错?

 MOV R0,#0xfff


要想搞懂这个问题,我们需要了解什么是立即数。

2. 什么是立即数?

立即数是由 0-255之间的数据循环右移偶数位生成。

判断规则如下:

  1. 把数据转换成二进制形式,从低位到高位写成4位1组的形式,最高位一组不够4位的,在最高位前面补0。
  2. 数1的个数,如果大于8个肯定不是立即数,如果小于等于8进行下面步骤。
  3. 如果数据中间有连续的大于等于24个0,循环左移2的倍数,使高位全为0。
  4. 找到最高位的1,去掉前面最大偶数个0。
  5. 找到最低位的1,去掉后面最大偶数个0。
  6. 数剩下的位数,如果小于等于8位,那么这个数就是立即数,反之就不是立即数。

而例子中的数是0xfff,我们来看下他的二进制:

0000 0000 0000 0000 0000 1111 1111 1111

按照上述规则,我们最终操作结果如下:

1111 1111 1111

可以看到剩余的位数大于8个,所以该数不是立即数。
为什么立即数会有这么个限定?
我们需要从MOV这条指令的机器码来说起。

3. MOV机器码

让我们执行下面代码:

 AREA Example,CODE,READONLY    ;声明代码段ExampleENTRY ;程序入口
Start
//测试代码,添加在以下位置即可,后面不再贴完整代码                                 mov r1,#0x80000001
OVEREND

然后点击debug按钮,查看对应的机器码:

得到mov r1,#0x80000001指令的机器码是E3A01106

我们来分析这个机器码。

用ARM指令助记符表示为:

<opcode> {<cond>} {S} <Rd>, <Rn>, <shift_op2>

每个域的含义如下:

1) {<cond>}:条件码域
指令允许执行的条件编码。花括号表示此项可缺省。

ARM指令的一个重要特点是可以条件执行,每条ARM指令的条件码域包含4位条件码,共16种。几乎所有指令均根据CPSR中条件码的状态和指令条件码域的设置有条件的执行。当指令执行条件满足时,指令被执行,否则被忽略。指令条件码及其助记符后缀表示参见下表。


每种条件码可用两个字符表示,这两个字符可以作为后缀添加在指令助记符的后面和指令同时使用。

例如:
跳转指令B可以加上后缀EQ变为BEQ,表示“相等则跳转”,即当CPSR中的Z标志置位时发生跳转。

2) <opcode>:操作码域
指令编码的助记符;

3) {S} :条件码设置域

这是一个可选项,当在指令中设置{S}域时,指令执行的结果将会影响程序状态寄存器CPSR中相应的状态标志。
例如:

  ADD    R0,R1,R2;  R1与R2的和存放到R0寄存器中,不影响状态寄存器ADDS    R0,R1,R2;  执行加法的同时影响状态寄存器

指令中比较特殊的是CMP指令,它不需要加S后缀就默认地根据计算结构更改程序状态寄存器

4) <Rd>:目的操作数
ARM指令中的目的操作数总是一个寄存器。
如果与第一操作数寄存器相同,也必须要指明,不能缺省。

5) <Rn>:第一操作数
ARM指令中的第一操作数也必须是个寄存器。

6) <shift_op2>:第二操作数
在第二操作数中可以是寄存器、内存存储单元或者立即数。

如果是立即数:

bit:[11-8]表示操作数向左移动的位数/2,
bit:[7-0]表示最终的操作数

根据MOV指令格式,我们分析各个位域的值:

bite 含义
1110 Cond忽略
00 1
1101 opcode
0 s 命令不含S
0000 rn,没有源寄存器为0
0001 rd 目的结存器R0
0001 shifter
0000 0110 操作数

立即数0x80000001二进制为:

1000 0000 0000 0000 0000 0000 0000 0001

循环左移2位后得到以下结果:

00 0000 0000 0000 0000 0000 0000 0001 10

所以shifter的值为2/2=1,操作数的值为0000 0110。

二、移位操作

ARM微处理器支持数据的移位操作,移位操作在ARM指令集中不作为单独的指令使用,它只能作为指令格式中是一个字段,在汇编语言中表示为指令中的选项。移位操作包括如下6种类型,ASL和LSL是等价的,可以自由互换:

1) LSL(或ASL)逻辑(算术)左移

寻址格式:

通用寄存器,LSL(或ASL) 操作数

完成对通用寄存器中的内容进行逻辑(或算术)的左移操作,按操作数所指定的数量向左移位,低位用零来填充。其中,操作数可以是通用寄存器,也可以是立即数(0~31)。
如:

MOV    R0, R1, LSL#2     ;将R1中的内容左移两位后传送到R0中。

2) LSR逻辑右移

寻址格式:

通用寄存器,LSR 操作数

完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用零来填充。其中,操作数可以是通用寄存器,也可以是立即数(0~31)。
如:

MOV    R0, R1, LSR #2        ;将R1中的内容右移两位后传送到R0中,左端用零来填充。

3) ASR算术右移

寻址格式:

通用寄存器,ASR 操作数

完成对通用寄存器中的内容进行右移的操作,按操作数所指定的数量向右移位,左端用第31位的值来填充。其中,操作数可以是通用寄存器,也可以是立即数(0~31)。
如:

MOV    R0, R1, ASR #2        ;将R1中的内容右移两位后传送到R0中,左端用第31位的值来填充。

4) ROR循环右移

寻址格式:

通用寄存器,ROR 操作数

完成对通用寄存器中的内容进行循环右移的操作,按操作数所指定的数量向右循环移位,左端用右端移出的位来填充。其中,操作数可以是通用寄存器,也可以是立即数(0~31)。显然,当进行32位的循环右移操作时,通用寄存器中的值不改变。
如:

MOV    R0, R1, ROR #2        ;将R1中的内容循环右移两位后传送到R0中。

5) RRX带扩展的循环右移

寻址格式:

通用寄存器,RRX 操作数

完成对通用寄存器中的内容进行带扩展的循环右移的操作,按操作数所指定的数量向右循环移位,左端用进位标志位C来填充。其中,操作数可以是通用寄存器,也可以是立即数(0~31)。
如:

MOV    R0, R1, RRX #2        ;将R1中的内容进行带扩展的循环右移两位后传送到R0中。

举例

; 第二操作数 寄存器移位操作, 5种移位方式, 9种语法;逻辑左移mov r0, #0x1mov r1, r0, lsl #1    ; 移位位数1-31肯定合法mov r0, #0x2mov r1, r0, lsr #1      ; 逻辑右移mov r0, #0xffffffffmov r1, r0, asr #1     ; 算术右移符号位不变, 次高位补符号位mov r0, #0x7fffffffmov r1, r0, asr #1mov r0, #0x7fffffffmov r1, r0, ror #1    ; 循环右移mov r0, #0xffffffffmov r1, r0, rrx    ; 唯一不需要指定循环位数的移位方式;带扩展的循环右移;C标志位进入最高位,最低位进入C 标志位; 移位值可以是另一个寄存器的值低5bit, 写法如下 mov r2, #1mov r0, #0x1mov r1, r0, lsl r2    ; 移位位数1-31肯定合法mov r0, #0xffffffffmov r1, r0, asr r2      ; 算术右移符号位不变, 次高位补符号位mov r0, #0x7fffffffmov r1, r0, asr r2mov r0, #0x7fffffffmov r1, r0, ror r2    ; 循环右移

上述结果不再截图,读者可以自行拷贝到keil中进行debug,查看寄存器中值以及符号位的变化。

三、CMP比较指令

语法

CMP{条件} 操作数1,操作数2

CMP指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行比较,同时更新CPSR中条件标志位的值。该指令进行一次减法运算,但不存储结果,只更改条件标志位。cmp是做一次减法,并不保存结果,仅仅用来产生一个逻辑,体现在改变cpsr相应的condition位。

标志位表示的是操作数1与操作数2的关系(大、小、相等),
指令示例:

CMP R1,R0   ;将寄存器R1的值与寄存器R0的值相减,并根据结果设置CPSR的标志位
CMP R1,#100 ;将寄存器R1的值与立即数100相减,并根据结果设置CPSR的标志位

四、TST条件指令

语法

TST{条件}  操作数1,操作数2

TST指令用于把一个寄存器的内容和另一个寄存器的内容或立即数进行按位的与运算,并根据运算结果更新CPSR中条件标志位的值。操作数1是要测试的数据,而操作数2是一个位掩码,根据测试结果设置相应标志位。当位与结果为0时,EQ位被设置。
指令示例

   TST   R1,#%1  ;用于测试在寄存器R1中是否设置了最低位(%表示二进制数)。

比较指令和条件执行举例

例1:找出三个寄存器中数据最大的数

 mov r0, #3mov r1, #4mov r2, #5cmp r1,r0movgt r0,r1cmp r2,r0movgt r0,r2

例2:求两个数的差的绝对值

  mov r0,#9mov r1,#15cmp r0,r1beq stopsubgt r0,r0,r1sublt r1,r1,r0

带条件码的指令执行请参考本篇表格《指令的条件码》

五、数据的处理指令

ADD

ADD{条件}{S} 目的寄存器,操作数1,操作数2

ADD指令用于把两个操作数相加,并将结果存放到目的寄存器中。
操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。
指令示例:

ADD  R0,R1,R2              ; R0 = R1 + R2
ADD     R0,R1,#256            ; R0 = R1 + 256
ADD     R0,R2,R3,LSL#1         ; R0 = R2 + (R3 << 1)

ADC

注意这个指令不是射手。。。。

除了正常做加法运算之外,还要加上CPSR中的C条件标志位,如果要影响CPSR中对应位,加后缀S。

SUB

SUB指令的格式为:

  SUB{条件}{S} 目的寄存器,操作数1,操作数2

SUB指令用于把操作数1减去操作数2,并将结果存放到目的寄存器中。操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。该指令可用于有符号数或无符号数的减法运算。

如:

SUB  R0,R1,R2          ; R0 = R1 - R2
SUB     R0,R1,#256        ; R0 = R1 - 256
SUB     R0,R2,R3,LSL#1   ; R0 = R2 - (R3 << 1)

SBC

除了正常做加法运算之外,还要再减去CPSR中C条件标志位的反码 根据执行结果设置CPSR对应的标志位
AND指令的格式为:

AND{条件}{S} 目的寄存器,操作数1,操作数2

AND指令用于在两个操作数上进行逻辑与运算,并把结果放置到目的寄存器中。操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。该指令常用于屏蔽操作数1的某些位。
如:

AND  R0,R0,#3               ; 该指令保持R0的0、1位,其余位清零。

ORR

ORR指令的格式为:

  ORR{条件}{S} 目的寄存器,操作数1,操作数2

ORR指令用于在两个操作数上进行逻辑或运算,并把结果放置到目的寄存器中。操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。该指令常用于设置操作数1的某些位。
如:

ORR  R0,R0,#3               ; 该指令设置R0的0、1位,其余位保持不变。

BIC

这是一个非常实用的指令,在实际寄存器操作经常要将某些位清零,但是又不想影响其他位的值,就可以使用该命令。

BIC指令的格式为:

  BIC{条件}{S} 目的寄存器,操作数1,操作数2

BIC指令用于清除操作数1的某些位,并把结果放置到目的寄存器中。

操作数1应是一个寄存器,操作数2可以是一个寄存器,被移位的寄存器,或一个立即数。操作数2为32位的掩码,如果在掩码中设置了某一位,则清除这一位。未设置的掩码位保持不变。

如:

BIC  R0,R0,#%1011    ; 该指令清除 R0 中的位 0、1、和 3,其余的位保持不变。

数据处理指令举例

  1. 加法运算
 mov r0, #1mov r1, #2add r2, r0, r1  ; r2 = r0 + r1add r2, r0, #4add r2, r0, r1, lsl #2 ;  r2 = r0 +R1<<2; (R0 + R1*4)
  1. adc,64位加法运算的实现
 ; 2. adc  64位加法 r0, r1 =  r0, r1 + r2, r3 mov r0, #0mov r1, #0xffffffffmov r2, #0mov r3, #0x1 adds r1, r1, r3 ; r1 = r1 + r3     必须加S后缀adc r0, r0, r2   ; r0 = r0 + r2 + c   ;add  带 扩展的加法


可以对比下add和adds,没有加s的话是不会影响条件位的。

  1. 减法
; 3. sub  rd = rn - op2
mov r0, #1
sub r0, r0, #1  ; r0 = r0 - 1
  1. 64位减法
; 4. sbc  64位减法 r0, r1 =  r0, r1 - r2, r3 ; cpsr c 对于加法运算 C = 1 则代表有进位, C = 0 无进位;      对于减法运算 C = 1 则代表无借位, C = 0 有借位mov r0, #0mov r1, #0x0mov r2, #0mov r3, #0x1subs r1, r1, r3 sbc r0, r0, r2    ;sbc  带扩展的减法
  1. 位清除
 ; 5. bic   位清除 mov r0, #0xffffffffbic r0, r0, #0xff       ; and r0, r0, #0xffffff00

执行结果

六、跳转指令

跳转指令用于实现程序流程的跳转,在ARM程序中有两种方法可以实现程序流程的跳转:

  1. 使用专门的跳转指令;

  2. 直接向程序计数器PC写入跳转地址值,通过向程序计数器PC写入跳转地址值,可以实现在4GB的地址空间中的任意跳转,在跳转之前结合使用。

使用以下指令,可以保存将来的返回地址值,从而实现在4GB连续的线性地址空间的子程序调用。

  MOV LR,PC

ARM指令集中的跳转指令可以完成从当前指令向前或向后的32MB的地址空间的跳转,包括以下4条指令:

B        跳转指令
BL       带返回的跳转指令
BLX      带返回和状态切换的跳转指令thumb指令
BX       带状态切换的跳转指令thumb指令

1. B 指令

指令的格式为:

  B{条件}  目标地址

B指令是最简单的跳转指令。一旦遇到一个 B 指令,ARM 处理器将立即跳转到给定的目标地址,从那里继续执行。

   B label     程序无条件跳转到标号label处执行CMP R1 ,#0BEQ label      当CPSR寄存器中的Z条件码置位时,程序跳转到标号Label处执行。

2. BL 指令

BL 指令的格式为:

   BL{条件}  目标地址

BL是另一个跳转指令,但跳转之前,会在寄存器R14中保存PC当前值,因此,可以通过将R14 的内容重新加载到PC中,来返回到跳转指令之后的那个指令处执行。该指令是实现子程序调用的一个基本但常用的手段。

  BL label     当程序无条件跳转到标号Label处执行时,同时将当前的PC值保存到R14中

子函数要返回执行以下指令即可:

  MOV PC,LR

3. BL指令机器码

语法:

Branch :     B{<cond>} label
Branch with Link :  BL{<cond>} subroutine_label

BL机器码格式如下:

各域含义:

含义
cond 条件码
101 操作码
L 命令是否包含L
offset 指令跳转偏移量

其中offset是24个bite,最高位包含一个符号位,1个单位表示偏移一条指令,所以可以寻址±223条指令,即±8M条指令。

而一条指令是4个字节,所以最大寻址空间为±32MB的地址空间

我们来看下以下代码:

 AREA Example,CODE,READONLY  ENTRY ;程序入口
Start            MOV R0,#0     MOV R1,#10BL ADD_SUM   B OVER
ADD_SUMADD R0,R0,R1 MOV PC,LR
OVEREND


由上图所示:

  1. 第6行代码BL ADD_SUM 会跳转到第8行,即第9行的代码
  2. 第6行的指令的机器码是EB000000

根据BL的机器码我们可以得到offset的值是0x000000,也就是说该指令跳转本身,而根据我们的分析第6行代码,应该是向前跳转2条指令,按道理offset是应该是2,为什么是0呢?

因为是3级流水线,所以pc存储指令地址与正在处理指令地址之间相差8个字节,pc的地址是预取指令地址,而不是正在执行的指令的地址。

4. 如何访问全部32-bit地址空间?

可以手动设置LR寄存器,然后装载到PC中。

MOV lr, pc
LDR pc, =dest

在编译项目过程中,ARM连接器(linker)会自动为长跳转(超过32Mb范围)。

ldr下一章会详细详细讲解。

举例

子函数多重嵌套调用,如何从子函数返回?

    area first, code, readonlycode32entry
main; bl 指令, 子函数调用mov r0,#1bl child_func  mov r0,#2
stop b stop
child_funcmov r1,r0mov r2,lrmov r0, #3  ; <===  pcbl child_func_2mov r0,#4mov r0,r1mov lr,r2mov pc, lr
child_func_2 ;叶子函数mov r3,r0mov r4,lr  ; 保存直接父函数用到的所有寄存器mov r0, #5mov r0,r3mov lr,r4 ;返回到直接父函数之前,把它用到的所有寄存器内容恢复mov pc, lrend

由上述例子所示,每调用一级子函数,我们都把返回地址存入到未分组寄存器中,但是未分组寄存器毕竟是有限的,像Linux内核函数的调用层次往往很深,通用寄存器根本不够用,要想保存返回地址,就需要对数据进行压栈,那我们就要为每个模式的栈设置空间,那如何设置栈空间呢?下一篇我们继续讨论。

4. 从0开始学ARM-ARM指令,移位、数据处理、BL、机器码相关推荐

  1. 小于等于0_从0开始学ARMARM汇编指令其实很简单

    学习ARM,就必须要学习ARM指令,ARM指令是CPU提供给我们的接口,是我们打开CPU这个潘多拉魔盒的钥匙. ARM指令有很多,为了让大家能快速上手,一口君整理了一些对我们最有帮助的指令.keil软 ...

  2. 强制生成32位arm程序_3. 从0开始学ARM-ARM模式、寄存器、流水线

    关于ARM的一些基本概念,大家可以参考我之前的文章: 到底什么是Cortex.ARMv8.arm架构.ARM指令集.soc?一文帮你梳理基础概念[科普] 一口网Linux:嵌入式工程师到底要不要学习A ...

  3. arm汇编指令集_1. 从0开始学ARM安装Keil MDK uVision集成开发环境

    关于ARM的一些基本概念,大家可以参考我之前的文章:<0.到底什么是Cortex.ARMv8.arm架构.ARM指令集.soc?一文帮你梳理基础概念[科普]> 0. 如何学习arm? AR ...

  4. 2. 从0开始学ARM-CPU原理,基于ARM的SOC讲解

    关于ARM的一些基本概念,大家可以参考我之前的文章: <到底什么是Cortex.ARMv8.arm架构.ARM指令集.soc?一文帮你梳理基础概念[科普]> 关于ARM指令用到的IDE开发 ...

  5. ida pro 反汇编 Android so 库后修改 arm 汇编指令的方法总结

    1 前言 最近博主在学习Android逆向的时候,参照吾爱破解论坛的<教我兄弟学Android逆向系列课程>学习的时候,学到第8章<教我兄弟学Android逆向08 IDA爆破签名验 ...

  6. 嵌入式工程师到底要不要学习ARM汇编指令?arm学习文章汇总

    嵌入式工程师到底要不要学习ARM汇编指令? 网上搜索这个问题,答案很多,大部分的建议是不要学汇编,只要学C语言. 而一口君作为一个十几年经验的驱动工程师,个人认为,汇编语言还是需要掌握的,想要搞精.搞 ...

  7. 常用的ARM汇编指令总结

    第一次写博客,请各路大神多多关照. 本人从事软件开发相关的工作,平时主要用c语言撸代码,前段时间因工作需要,接触到了ARM架构下的汇编指令,之前学过51单片机的汇编指令,早已经还给老师了,且ARM汇编 ...

  8. 经常使用ARM汇编指令

    一面学习,一面总结,一面记录. 以下是整理在网上找到的一些资料,简单整理记录一下,方便以后查阅. ARM处理器的指令集能够分为跳转指令.数据处理指令.程序状态寄存器(PSR)处理指令.载入/存储指令. ...

  9. 【嵌入式开发】 ARM 汇编 (指令分类 | 伪指令 | 协处理器访问指令)

    作者 : 韩曙亮 博客地址 : http://blog.csdn.net/shulianghan/article/details/42408137  转载请著名出处 本博客相关文档下载 :  -- A ...

最新文章

  1. java实体属性对应mysql和SQL Server 和Oracle 数据类型对应
  2. 配置 腾讯云 SSL 证书 SSL证书实现https,环境:phpStudy下Apache环境
  3. Java Web整合开发(41) -- Forum
  4. 【SpringBoot】 启动时,修改默认配置文件名称
  5. springboot 单例_如何实现一个单例及优化
  6. Fiddler的下载安装与使用(流量抓包、手机抓包、拦截包、编辑包、重发包)
  7. selenium+python学习总结-mac
  8. Hash Table in C
  9. 下列有关计算机系统叙述正确,()下列有关计算机系统软件的叙述正确的是____
  10. python必背代码-让你的python代码优雅地道的小技巧
  11. 用例设计-常用正交表9个
  12. Hadoop大数据原理与应用
  13. Web渗透测试学习路线图
  14. NOSQL,MongoDB是什么?
  15. 【大数据】分布式机器学习平台
  16. 李少白讲摄影-不放过一切光线地坛书市新书首发圆满结束
  17. sdcard里边的东西能删除吗_sdcard是什么意思(小米sdcard文件可以删除吗)
  18. element-ui中的表格组件实现隔行换色
  19. 【J2EE实验-3】Spring MVC
  20. 懒人玩Arm-2D究竟有几种姿势?

热门文章

  1. 让user组用户登录时自动运行需要administrator权限的程序
  2. Speak2Me英语口语学习系统
  3. 奇门遁甲php,奇门遁甲入门基础步骤,不到三个月即可学会!
  4. 黑帽SEO技术最前沿在哪里你知道吗???
  5. Galerkin与深度学习结合的算法求解PDE
  6. 安防监控实现之boa服务器的移植
  7. 程序员自己专研和考研或者是进大厂,哪个方法能学到更深层次的技术? 或者什么方法可以学到深层次的技术
  8. JAVA_KEYTOOL_生成秘钥_一蓑烟雨任平生
  9. Java GUI 容器与布局:
  10. vCenter账号权限问题