有了之前mips系统架构的基础,再了解arm64就相对轻松多了。所谓体系架构,核心就是寄存器、指令集和abi(即寄存器和指令集的使用规范)。下面就分这几方面展开做的学习笔记。

目录

一、armv8概览

aarch64:

aarch32:

二、ARM64寄存器

1、ARM64通用寄存器

2、状态寄存器

2.1 条件标志位

2.2 控制位

2.3 保留位

3、ARM浮点寄存器

三、ARM64指令集

1、指令后缀

1.1    位数

1.2    S(S标识):影响CPSR里的NZCV标识位

1.3    “!”后缀

1.4  条件后缀

2、数据处理(运算)指令:

2.1  数据传送指令

2.2  移位指令

2.3   算术运算指令

2.4 逻辑运算指令

2.5 比较运算指令

2.6  乘除运算指令

3、数据加载/存储指令

4、跳转分支指令

5、程序状态寄存器的访问指令

6、协处理器指令

7、软中断指令

8、其他指令

四、使用规范ABI


一、armv8概览

ARM架构版本号从1-8。ARMv8架构支持一下两种执行状态:

aarch64:

1、提供31个64位通用寄存器(其中X30被用来做链接寄存器LR(函数返回地址))。和一个64位程序计数器PC、栈帧SPs、异常链接寄存器ELRs。
3、提供32个128-bit寄存器用于SIMD vector and scalar floating-point support.
4、仅支持指令集 A64.
5、4个异常等级 EL0 - EL3
6、Defines a number of Process state (PSTATE) elements that hold PE state. The A64 instruction set includes instructions that operate directly on various PSTATE elements.
7、Names each System register using a suffix that indicates the lowest Exception level at which the register can be accessed.

aarch32:

1、提供13个32-bit通用寄存器,和一个32-bit PC, SP, 和链接寄存器 (LR)。LR 还兼有 ELR 功能。

2、提供32个64-bit寄存器用于SIMD vector and scalar floating-point support.

3、支持两种指令集 A32 (32bit编码的定长指令集)和 T32(使用16bit和32bit编码的变长指令集)。

二、ARM64寄存器

ARM64寄存器分类:通用寄存器、浮点寄存器、状态寄存器、协处理器寄存器。本文就通用寄存器的使用来介绍。其他寄存器根据后期学习情况逐步补充。

1、ARM64通用寄存器

通用寄存器就是指用户态可以使用的寄存器。它和我们普通程序员关系最为密切。下表列举了ARM64的通用寄存器。

寄存器

描述

x0-x7

用于子程序调用时的参数传递,X0还用于返回值传递

x8-x15

临时寄存器,也叫可变寄存器,子程序使用时不需要保存。

x16-x17

子程序内部调用寄存器(IPx),使用时不需要保存,尽量不要使用

x18

平台寄存器,它的使用与平台相关,尽量不要使用。

x19-x28

临时寄存器,子程序使用时必须保存。

x29/fp

用于连接栈帧,使用时必须保存。

x30/LR

存放的是函数的返回“地址”。当ret指令执行时刻,会寻找x30寄存器保存的“地址值”!

SP

用于指向每个函数的栈顶。32位栈帧使用WSP。

XZR

零寄存器。32位零寄存器为WZR

说明: x0 - x30 是31个通用整形寄存器。每个寄存器可以存取一个64位大小的数。 当使用 x0 - x30 访问时,它就是一个64位的数。当使用 w0 - w30 访问时,访问的是这些寄存器的低32位,如图:

2、状态寄存器

ARM体系架构中有一个当前程序状态寄存器CPSR(R16??)和5个备份状态寄存器SPSRs。先关注CPSR,CPSR可以在任何工作模式下访问,用来保存ALU中的当前信息、状态等。基本格式如下:

31                                                                26                  8                                                                                                                                  0

N Z C V Q ... ... I F T M4 M3 M2 M1 M0

如上图所示,CPSR分为3部分:条件标志位NZCVQ、控制位IFTM4M3M2M1M0、保留位。

2.1 条件标志位

上图蓝色部分N,Z,C,V,Q为条件码标志位。它们内容可以根据算术或逻辑运算的结果所改变,并用来决定某条指令是否被执行。具体例子见 1.4 条件后缀   .   条件码标志的具体含义如下表:

标志位 含义
N 正负标志。N=1标识运算结果为负数
Z 零标志。Z=1标识运算结果为0
C 进位标志。加法运算结果有进位则C=1;
V 溢出标志。运算结果有溢出则V=1
Q ??

2.2 控制位

略,后期需要时补上

2.3 保留位

略,后期需要时补上

3、32 个SIMD&FP 寄存器 V0 -V31

每个寄存器根据实际使用长度,命名会有所不同。具体表示如下:

  • A 128-bit register named Q0 to Q31.

  • A 64-bit register named D0 to D31.

  • A 32-bit register named S0 to S31.

  • A 16-bit register named H0 to H31.

  • An 8-bit register named B0 to B31.

  • A 128-bit vector of elements.

  • A 64-bit vector of elements.

  • 如下图所示:

4、2 个SIMD&FP 控制寄存器 FPCR 、FPSR

  • Two SIMD and floating-point control and status registers, FPCR and FPSR.

三、Aarch64指令集

ARM64指令和其他架构,比如MIPS类似,把指令分为数据处理(运算)指令、加载与存储指令、分支指令、程序状态寄存器指令、协处理器指令和异常产生指令共6大类。其中程序状态寄存器指令为ARM特有,MIPS没有此类指令。下面分别介绍。

学习指令之前要了解一下指令后缀。

1、指令后缀

ARM中的指令可以带后缀,从而丰富该指令的功能,常用的后缀有:

1.1    位数

B(byte):功能不变,操作长度变为8位(依赖CPU位数,以下相同)

H(Halfword):功能不变,操作长度变为16位

例如:  ldr指令族:ldrb,ldrh,ldrsb ldrsh,从内存中加载指定长度的数据

1.2    S(S标识):影响CPSR里的NZCV标识位

指令中使用”S“后缀时、指令执行后程序状态寄存器的条件标志位将被刷新。相当于有符号运算。例如:

SUB    X1,X0,X3       ;X1=X0-X3  ,CPSR值不变

SUBS X1,X0,X3        ;X1=X0-X3 , 如果计算结果为负数,CPSR寄存器的N被置位

1.3    “!”后缀

指令中地址表达式含有“!”后缀时,指令执行后,基址寄存器中的地址值将会发生变化。变化的结果是 (base+offset)。例如:

LDR X3,[X0,#4]       //X3=X0+4

LDR X3,[X0,#4]!      //X3=X0+4; X0+=4;

注意: “!”不能用于寄存器PC后面

1.4  条件后缀

ARM架构中,允许在指令后面添加条件后缀来完成指令条件执行的目的。指令条件执行就是说,指令根据CPSR中条件码的状态和指令的条件域有条件的执行。当指令的执行条件满足时,指令被执行,否则指令将被忽略。例如比较下面两条指令:

ADD X4,X2,#1                    ; 无条件执行 X4=X2+1

ADDEQ  X4,X2,#1             ;添加有条件执行后缀EQ,当CPSR中的Z标志置位(之前某条CMP结果相等)时,该指令才执行。

注意:如果条件后缀和“S”标识同时出现,则S在条件后缀的后面,例如:

ADDEQS  X4,X2,#1          ;即为有条件执行X4=X2+1,结果更新条件标志位

ARM中支持的条件后缀(条件码)共16种(系统保留1种,剩下15种可用),具体标志和功能如下表:

指令码 含义
EQ Z置位 ;结果相等才执行
NE Z清零,结果不相等才执行
CS C置位,结果无符号>= 才执行
CC C清零,结果无符号< 才执行
MI N置位,结果为负数才执行
PL N清零,结果为正数或0才执行
VS V置位,结果溢出才执行
VC V清零,结果无溢出才执行
HI C置位Z清零,结果为无符号数大于才执行
LS C清零Z置位,结果为无符号数小于或等于才执行
GE N等于V,结果为有符号数大于或等于才执行
LT N不等于V,结果为有符号数小于才执行
GT Z清零且N等于V ,结果为有符号大于才执行
LE Z置位或N不等于V ,结果为有符号数小于或等于
AL 无条件执行。省略。

例如:

cmp     w0, #0     ;
cset    x0, lt          ;如果(w0 < 0),X0置1,否则X0置0

说明:指令编程风格

ARM官方风格:官方风格指令一般使用大写,例如:LDR R0,[R1],Windows中常使用这种风格。

GUN Linux风格:指令一般使用小写字母,例如:ldr r0,[r1],Linux环境中常用这种风格.

本文下面的介绍多以官方风格来编写指令。

2、数据处理(运算)指令

2.1  数据传送指令

指令 功能 格式
MOV 赋值 MOV Wd|WSP, Wn|WSP ; 32-bit
MOV Xd|SP, Xn|SP ; 64-bit
MVN 取反赋值 MVN Wd, Wm{, shift #amount} ; 32-bit
MVN Xd, Xm{, shift #amount} ; 64-bit

例如:

MOV X1,X0 ;将寄存器X0赋值给X1

MVN X1,X2 ;将寄存器X2取反后传送给寄存器X1

2.2  移位指令

指令 功能 格式
LSL 逻辑左移

LSL Wd, Wn, Wm ; 32-bit
LSL Xd, Xn, Xm ; 64-bit

LSR 逻辑右移 LSR Wd, Wn, Wm ; 32-bit
LSR Xd, Xn, Xm ; 64-bit
ASR 算术右移 ASR Wd, Wn, Wm ; 32-bit
ASR Xd, Xn, Xm ; 64-bit
ROR 循环右移 ROR Wd, Wn, Wm ; 32-bit
ROR Xd, Xn, Xm ; 64-bit

例如:

LSL     w1, w1, #1          ;将寄存器W1逻辑左移1位后,赋值给W1

MOV X0,X1,LSL#1   ;将寄存器X1左移1位后赋值给X0。

MOVS X0,X1,LSR#1  ;将寄存器X1逻辑右移1位后的值赋值给X0,如果X0结果为0,则置寄存器CPSR的N位

2.3   算术运算指令

指令 功能 格式
add

加法运算

ADD Wd|WSP, Wn|WSP, #imm{, shift} ; 32-bit

ADD Xd|SP, Xn|SP, #imm{, shift} ; 64-bit

sub 减法运算 SUB Wd|WSP, Wn|WSP, Wm{, extend {#amount}} ; 32-bit
SUB Xd|SP, Xn|SP, Rm{, extend {#amount}} ; 64-bit
rsb 反减运算  
adc 带进位的加法运算 ADC Wd, Wn, Wm ; 32-bit
ADC Xd, Xn, Xm ; 64-bit
sbc 带进位的减法运算 SBC Wd, Wn, Wm ; 32-bit
SBC Xd, Xn, Xm ; 64-bit

例如:

ADC X1,X3,X5  ;X1=X3+X5+C(CPSR中的C位)

2.4 逻辑运算指令

指令 功能 格式
and 与操作

AND Wd|WSP, Wn, #imm ; 32-bit
AND Xd|SP, Xn, #imm ; 64-bit

操作:Rd = Rn & imm ,where R is either W or X .

orr 或操作

ORR Wd|WSP, Wn, #imm ; 32-bit
ORR Xd|SP, Xn, #imm ; 64-bit

操作:Rd = Rn | imm ,where R is either W or X .

eor 异或操作

EOR Wd|WSP, Wn, #imm ; 32-bit
EOR Xd|SP, Xn, #imm ; 64-bit

操作 Rd = Rn ^ imm ,where R is either W or X

bic 位清除操作

BIC Wd, Wn, Wm{, shift #amount} ; 32-bit
BIC Xd, Xn, Xm{, shift #amount} ; 64-bit

操作:Rd = Rn AND NOT shift(Rm, amount) ,where R is either W or X .

例如:

BIC X0,X0 #9    ;这里十进制数9对应的二进制数为101 ,故实现将寄存器X0的第0位和第3位清零。

2.5 比较运算指令

指令 功能 格式
CMP 比较大小

CMP Wn|WSP, Wm{, extend {#amount}} ; 32-bit
CMP Xn|SP, Rm{, extend {#amount}} ; 64-bit

CMN 反值比较

CMN Wn|WSP, Wm{, extend {#amount}} ; 32-bit
CMN Xn|SP, Rm{, extend {#amount}} ; 64-bit

TST 按位与运算 TST Wn, #imm ; 32-bit
TST Xn, #imm ; 64-bit    即 Rn AND imm where R is either W or X .

例如:

CMP X1,#10   ;根据(R1-10)的结果更改CPSR的标志位

CMN W0,W1   ; 根据(W0+W1)的结果更改CPSR的标志位

TST X0,#3       ;X0&3 ,结果改变CPSR

2.6  乘除运算指令

指令 功能 格式
mul 乘法运算。 MUL Wd, Wn, Wm ; 32-bit
MUL Xd, Xn, Xm ; 64-bit
UMULL 64位无符号乘法 UMULL Xd, Wn, Wm  => Xd = Wn * Wm
smull 有符号乘法

SMULL Xd, Wn, Wm

等同于 SMADDL Xd, Wn, Wm, XZR .

SMADDL 有符号乘加 SMADDL Xd, Wn, Wm, Xa     =>    Xd = Xa + Wn * Wm
UDIV 无符号除法 UDIV Wd, Wn, Wm ; 32-bit
UDIV Xd, Xn, Xm ; 64-bit
SDIV 有符号除法 SDIV Wd, Wn, Wm ; 32-bit
SDIV Xd, Xn, Xm ; 64-bit

说明:ARM64中乘法,根据源操作数也分为32位64位乘法。由于64位乘法结果太大,需要放在2个64位寄存器Rdlo和寄存器Rdhi。寄存器Rdlo用于存放结果的低64位,寄存器Rdhi用于存放结果的高64位。类似于MIPS中的乘法寄存器HI和LO。

注意1:目的寄存器rd和操作数寄存器rm必须是不同的寄存器

3、数据加载/存储指令

ARM64的数据加载/存储,类似于MIPS体系架构的load/store。

指令 功能 格式
LDR 32/64位加载寄存器 LDR Wt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 32-bit
LDR Xt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 64-bit
LDRB 加载一个字节 LDRB Wt, [Xn|SP], #simm ; Post-index general registers
LDRB Wt, [Xn|SP, #simm]! ; Pre-index general registers
LDRB Wt, [Xn|SP{, #pimm}] ; Unsigned offset general registers
LDRH 加载半字 LDRH Wt, [Xn|SP], #simm ; Post-index general registers
LDRH Wt, [Xn|SP, #simm]! ; Pre-index general registers
LDRH Wt, [Xn|SP{, #pimm}] ; Unsigned offset general registers
LDRSB 加载有符号字节 LDRSB Wt, [Xn|SP], #simm ; 32-bit, Post-index
LDRSB Xt, [Xn|SP], #simm ; 64-bit, Post-index
LDRSB Wt, [Xn|SP, #simm]! ; 32-bit, Pre-index
LDRSB Xt, [Xn|SP, #simm]! ; 64-bit, Pre-index
LDRSB Wt, [Xn|SP{, #pimm}] ; 32-bit
LDRSB Xt, [Xn|SP{, #pimm}] ; 64-bit
STR 32/64位存储 STR Wt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 32-bit
STR Xt, [Xn|SP, (Wm|Xm){, extend {amount}}] ; 64-bit
STRH 半字存储 STRH Wt, [Xn|SP, (Wm|Xm){, extend {amount}}]
SWP 交换指令  

例如:

LDR X3,[X2,#0x8]  ; load memory(X2+0x8)  to X3

STR X6,[X5,X3]   ; store X6 to memory(X5+X3)

SWP X0,X1,[X2]  ;将memory(X2)数据加载到X0,同时将X1中的数据存储到memory(X2)

注意:没有找到教材中说的多寄存器加载/存储指令 LDM/STM。不知道是否为伪指令?

4、跳转分支指令

类似于MIPS架构的B/J指令。用于分支跳转和函数调用。

指令 功能 格式
B

无条件跳转,不返回

in the range ±128MB

B label
BL

跳转前把返回地址放入x30(LR)中

range ±128MB

setting the register X30 to PC+4

BL label

BR 跳转到寄存器 BR Xn
BLR

寄存器跳转。跳转前把返回地址放入x30(LR)中

长跳转range 2的64次方-1

BLR Xn
BX 跳转同时切换到ARM模式,用于异常处理的跳转
CBZ 比较Rt结果为零(Zero)则跳转

CBZ Rt, label      ; 64-bit   R为Xt或者Wt

BEQ CPSR中Z置位则跳转

BEQ label   ; UAL(A32/T32)

B.EQ label  ; A64

例如:

cmp     w0, #15     //将(w0-15)结果更新CPSR标志位
 beq     label           //如果(w0==15) ,则跳转到lable

5、程序状态寄存器的访问指令

由于程序状态寄存器不属于通用寄存器,故不能直接读取,而是要通过下面两条指令专门读取。

指令 功能 格式
MRS 读状态寄存器 MRS Xt, (systemreg|Sop0_op1_Cn_Cm_op2)
MSR 写状态寄存器

MSR pstatefield, #imm

MSR (systemreg|Sop0_op1_Cn_Cm_op2), Xt

例如:

MRS X0,SPSR    ;读SPSR的内容到X0

MSR CPSR_c,X0   ;写寄存器X0值到CPSR,仅修改CPSR的控制位域c

6、协处理器指令

略,后期需要时补上

指令 功能 格式
CDP    
LDC    
STC    
MCR    
MRC    

7、软中断指令

FIXME:SVC was called SWI in earlier versions of the A32 assembly language. SWI instructions disassemble to SVC ,
with a comment to say that this was formerly SWI .

指令 功能 格式
SVC 软件中断 SVC{cond} #imm

swi(software interrupt),在软件层模拟产生一个中断,这个中断会传送给CPU,常用于实现系统调用。类似于mips架构的syscall指令。

待确认,如何使用此指令,根据系统调用号ID来实现系统调用

8、其他指令

暂时把无法归类的指令称为其他指令吧。

指令 功能 格式
BRK ARM64的断点指令,imm标识一个不大于16位的立即数 BRK #imm   
BKPT ARM32的断点指令,imm标识一个不大于16位的立即数 BKPT #imm
clz 统计一个数的二进制位前面有几个0 CLZ{cond} Rd, Rm

断点指令BRK/BKPT可以触发SIGTRAP中断,   类似于mips架构的break指令。

缺少示例

四、使用规范ABI

略,后期需要时补上

ARMv8(aarch64)指令集特性相关推荐

  1. 汇编-ARMv8架构指令集

    1. ARMv8寄存器体系 1.1 概述 ARMv8架构继承了ARMv7与之前处理器技术的基础,除了对现有的16/32bit的Thumb2指令支持外,也向前兼容了现有的A32(ARM 32bit)指令 ...

  2. 一篇文章读懂Armv8 AArch64

    Armv8是Armv7之后的一个重要架构更新.其中一个主要的变化是引入了64的架构,即AArch64.AArch64状态只有在Armv8架构中才有.而且在AArch64状态下执行的代码只能使用A64指 ...

  3. aarch64指令集_ARMv8-AArch64简述

    ARMv8是ARM版本升级以来最大的一次改变,ARMv8的架构继承以往ARMv7与之前处理器技术的基础,除了现有的16/32bit的Thumb2指令支持外,也向前兼容现有的A32(ARM 32bit) ...

  4. aarch64指令集_AArch64应用程序级编程模型

    根据实现选择,体系结构支持多级执行特权,由从EL0到EL3的不同异常级别表示.EL0对应于最低的特权级别,通常被描述为无特权.应用层程序员模型是在EL0上执行软件的程序员模型. 系统软件决定异常级别, ...

  5. linux 内核flush,armv8(aarch64)linux内核中flush_dcache_all函数详细分析

    /* *  __flush_dcache_all() *  Flush the wholeD-cache. * Corrupted registers: x0-x7, x9-x11 */ ENTRY( ...

  6. 【汇编优化】之ARM32与AARCH64指令集优化总结

    序 前文<arm64>.<arm32>已经介绍arm,aarch64优化的一些基本知识,本文着重介绍优化过程中容易混淆的点,或需注意的点. 1. 关于指令编码长度 1.1 aa ...

  7. aarch64指令集_ARM与AARCH64指令集优化总结

    标签: 序 前文<arm64>.<arm32>已经介绍arm,aarch64优化的一些基本知识,本文着重介绍优化过程中容易混淆的点,或需注意的点. 1. 关于指令编码长度 1. ...

  8. ARMV8/ARMV9指令集概述(翻译)

    快速链接: .

  9. ARMv8/ARMv9指令集概述

    目录 下载地址 1. 首先 : 点赞.关注.评论 支持一下行不 ? 2.其次,属于装13 系列, 其实真没啥价值,拉几,不用看, 更不要有期待. 预览开始: 下载地址 ( 注意 : 下载之前,您是否完 ...

最新文章

  1. web API简介(二):客户端储存之document.cookie API
  2. 计算机网络wfq,计算机网络基础试题-a卷-信科09.doc
  3. 配置mysql读写主从_Mysql主从配置,实现读写分离
  4. 微软最强命令行工具 Windows Terminal,强势霸榜GitHub
  5. CSS基础「六」元素的显示与隐藏
  6. 苹果App Store曝出Bug 你遇到了么?
  7. android 隐藏所有 fragment,Android 隐藏Fragment
  8. 在HTML5中,用getCurrentPosition()获取用户的当前位置
  9. 《Linux编程》上机作业 ·004【文件I/O操作】
  10. SQL实战之查找所有员工入职时候的薪水情况
  11. 写博文有助于提高编程能力,因为写文章比写代码难多了
  12. plc计算机辅助编程设计方法,国产plc怎么编程
  13. ANSYS Workbench流-热-固多场耦合计算方法详解
  14. Linux下原生异步IO接口libaio介绍
  15. 幻想三国android官方版,幻想三国ol官方版下载
  16. 途家民宿VS木鸟民宿:民宿APP功能体验
  17. JAVA 通过属性名称 获取属性值、设置属性值
  18. LINUX学习基础篇(十五)软件包管理
  19. SHELL命令里面的EQ、NE、GT、LT、GE、LE分别是什么意思
  20. 安卓自定义下拉列表样式_自定义下拉列表样式

热门文章

  1. git多人协作使用命令常见错误
  2. 2018年CMA考试难度大不大?
  3. 荣耀平板v6和华为matepad pro哪个更好
  4. 爱数与云原生的故事,从这里开始
  5. SpringCloud(四)熔断+熔断监控+集群的熔断监控
  6. Attetion is all you need论文阅读笔记
  7. js前端实现语言识别(asr)与录音
  8. 很多深度学习工具中卷积操作其实都是互相关操作
  9. 产生斜体的html标签,【单选题】产生斜体字的 HTML 标签是( )。
  10. OpenCV 测量角度