Intel x87 FPU的使用基础

Intel x87 FPU专门用于执行标量浮点计算，可以对单精度浮点（32位）、双精度浮点（64位）以及扩展双精度浮点（80位）进行计算，并顺从IEEE754标准。

x87 FPU可以工作在32位兼容模式下以及64位模式下，在这两种下，FPU的数据寄存器的个数都一样，只有8个。对x87 FPU的数据寄存器的访问方式与一般的寄存器有所不同，它是栈式访问。你通过 FLD 指令把外部数据搬到x87 FPU的数据寄存器中时，那么x87 FPU会根据所搬数据的长度（32位、64位、80位）将输入数据分别对待为单精度浮点、双精度浮点和扩展双精度浮点方式，然后统一转为双精度扩展模式放到数据栈顶。因此x87 FPU的数据寄存器长度为80位，并且后续的浮点计算都是基于扩展双精度进行的。

在栈顶的数据寄存器索引为0，那么它下面一个就是1，然后是2，以此类推，到栈底则为7。数据输出到存储器时使用 FST 或 FSTP 指令，前者仅仅是根据目标存储器的长度（32位、64位、80位）将扩展双精度类型分别转为单精度、双精度、扩展双精度类型，然后输出到指定的存储器位置中。对于 FSTP 指令，除了将数据搬到外部外，还会执行推出堆栈的操作。另外，FLD 和 FST 以及 FSTP 还能搬移FPU内部寄存器的数据，FLD 的作用是将指定的FPU数据寄存器位置的数据搬移到栈顶寄存器中，而 FST 则是将栈顶寄存器的数据搬移到指定的FPU数据寄存器的位置。

这边要注意的是，由于80位（10个字节）并不是32位（4个字节）的整数倍，因此数据加载或存储双精度扩展浮点往往是用96位（12个字节）为单位进行，所以 “tbyte” 所指的就是“twelve bytes”，呵呵呵。这里可以列一下Intel汇编格式的字节、字宽指定修饰词——byte（字节，8位），word（字，16位），dword（双字，32位），qword（四字，64位），tbyte（十二字节，96位），mmword（64位，但只能用于MMX指令集中），xmmword（128位，用于SSE指令集），ymmword（256位，用于AVX和AVX2指令集），zmmword（512位，用于AVX-512指令集）。

下面是一段演示计算sin(10.05) + cos(20.05)的代码，三角函数中的参数都以弧度制表示。

/** hi.c * test* Created by Zenny Chen on 2/11/11. * Copyright 2011 GreenGames Studio. All rights reserved. **/
#include <stdio.h>void test(long double *p, long double *q)
{__asm__(".intel_syntax noprefix");__asm__("fld tbyte ptr [rdi] \n" // use double extended float -- st(0) holds 10.05"fld tbyte ptr [rsi] \n" // use double extended float -- st(0) holds 20.05, st(1) holds 10.05"fcos \n" // cos"fstp st(2) \n" // mov st(0) (i.e. cos(20.05) result) to st(2) and pop the value "fsin \n" // now st(0) holds 10.05 and does fsin"fadd st(0), st(1) \n" // add st(0) and st(1) and store the result to st(0)"fstp dword ptr [rdi] \n" // automatically truncate to single-float, write to the first arg and pop the value ); __asm__(".att_syntax");
}int main(void)
{long double a = 10.05;long double b = 20.05; // calculate: sin(10.05) + cos(20.05) = -0.2233334test(&a, &b);printf("The answer is: %f\n", *(float*)&a);
}

上述内联汇编用AT&T汇编语法格式写的话，如下表示：

.text
.align 2
.globl _asm_test_asm_test: fldt (%rdi)fldt (%rsi)fcosfstp %st(2)fsinfadd %st(1), %st(0)fstp (%rdi)ret

Intel x87 FPU的使用基础相关推荐

Intel 内部指令---AVX编程基础
AVX编程基础一.数据类型数据类型描述 __m128 包含4个float类型数字的向量 __m128d 包含2个double类型数字的向量 __m128i 包含若干个整型数字的向量 __m256 ...
X87 FPU 指令集
FPU 指令集 (1) FPU 数据传输指令集 fld 将浮点值压入寄存器栈,源操作数可以是ST(i)或内存地址 fild 从内存中读取一个有符号整型操作数,将该值转换为扩展双精度值,并将此结果加载到 ...
Intel汇编-FPU状态
# An example get the FPU status register contents # # FPU寄存器包括8个80位数据寄存器. # # 因FPU独立于主处理器,一般不使用EFLAG ...
资源 | Intel发布AI免费系列课程3部曲：机器学习基础、深度学习基础以及TensorFlow基础
翻译 | AI科技大本营(公众号ID:rgznai100) 校对 | 成龙编辑 | 明明 Intel于近期发布了三门AI系列的免费课程,分别是关于机器学习基础.深度学习基础.TensorFlow基础 ...
《翻译》Intel 64 与 IA-32 架构软件开发者手册卷1翻译
<前言> 翻译自官方的PDF版手册,可以从下述站点下载英文原版: http://www.intel.com/content/www/us/en/processors/architectur ...
图解CPU生产全过程——以intel CORE i7为例，展望CPU架构
科学Sciences导读:图解CPU生产全过程--以intel CORE i7为例,展望CPU架构.本文简介英特尔Intel x86架构.生产制造CPU的原料和准备.CPU生产制造过程,并展望CPU的 ...
【硬件设备】CPU系列之基础知识
目录概述指令集一.复杂指令集(CISC) 二.精简指令集(RISC) 三.复杂指令集与精简指令集区别 CPU的架构一.X86 CPU架构二.ARM CPU架构三.MIPS CPU架构四 ...
Intel英特尔历代经典 CPU 产品回顾
悉数历史英特尔历代经典 CPU 产品回顾从英特尔于 1971 年推出首款 4004 微处理器到现在, 英特尔处理器已经走过了 40 个年头.在告别 13 年传奇品牌奔腾之后,我们又迎来新一代酷睿 ...
RISC、CISC、 SIMD、FPU、MMX、SSE、SSEX、AVX、3D Now以及DSP、ARM的Neon简介
CPU的指令集从主流的体系结构上分为精简指令集和复杂指令集,而在普通的计算机处理器基本上是使用的复杂指令集.在计算机早期的发展过程中,CPU中的指令集是没有划分类型的,而是都将各种程序需要相配合的指令 ...

Intel x87 FPU的使用基础

Intel x87 FPU的使用基础相关推荐

最新文章

热门文章