本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念,然后是在GCC和ARMCC RVCT工具链下的具体编译参数。

VFP (vector floating-point)

从ARMv5开始,就有可选的 Vector Floating Point (VFP) 模块,当然最新的如 Cortex-A8, Cortex-A9 和 Cortex-A5 可以配置成不带VFP的模式供芯片厂商选择。VFP经过若干年的发展,有VFPv2 (一些 ARM9 / ARM11)、 VFPv3-D16(只使用16个浮点寄存器,默认为32个)和VFPv3+NEON (如大多数的Cortex-A8芯片) 。对于包含NEON的ARM芯片,NEON一般和VFP公用寄存器。

硬浮点Hard-float

编译器将代码直接编译成发射给硬件浮点协处理器(浮点运算单元FPU)去执行。FPU通常有一套额外的寄存器来完成浮点参数传递和运算。使用实际的硬件浮点运算单元FPU当然会带来性能的提升。因为往往一个浮点的函数调用需要几个或者几十个时钟周期。

软浮点 Soft-float

编译器把浮点运算转换成浮点运算的函数调用和库函数调用,没有FPU的指令调用,也没有浮点寄存器的参数传递。浮点参数的传递也是通过ARM寄存器或者堆栈完成。 现在的Linux系统默认编译选择使用hard-float,即使系统没有任何浮点处理器单元,这就会产生非法指令和异常。因而一般的系统镜像都采用软浮点以兼容没有VFP的处理器。

armel和armhf ABI在armel中,关于浮点数计算的约定有三种。以gcc为例,对应的-mfloat-abi参数值有三个:soft,softfp,hard。soft是指所有浮点运算全部在软件层实现,效率当然不高,会存在不必要的浮点到整数、整数到浮点的转换,只适合于早期没有浮点计算单元的ARM处理器;softfp是目前armel的默认设置,它将浮点计算交给FPU处理,但函数参数的传递使用通用的整型寄存器而不是FPU寄存器;hard则使用FPU浮点寄存器将函数参数传递给FPU处理。需要注意的是,在兼容性上,soft与后两者是兼容的,但softfp和hard两种模式不兼容。默认情况下,armel使用softfp,因此将hard模式的armel单独作为一个abi,称之为armhf。而使用hard模式,在每次浮点相关函数调用时,平均能节省20个CPU周期。对ARM这样每个周期都很重要的体系结构来说,这样的提升无疑是巨大的。在完全不改变源码和配置的情况下,在一些应用程序上,使用armhf能得到20%——25%的性能提升。对一些严重依赖于浮点运算的程序,更是可以达到300%的性能提升。

Soft-float和hard-float的编译选项

在CodeSourcery gcc的编译参数上,使用-mfloat-abi=name来指定浮点运算处理方式。-mfpu=name来指定浮点协处理的类型。可选类型如fpa,fpe2,fpe3,maverick,vfp,vfpv3,vfpv3-fp16,vfpv3-d16,vfpv3-d16-fp16,vfpv3xd,vfpv3xd-fp16,neon,neon-fp16,vfpv4,vfpv4-d16,fpv4-sp-d16,neon-vfpv4等。使用-mfloat-abi=hard (等价于-mhard-float) -mfpu=vfp来选择编译成硬浮点。使用-mfloat-abi=softfp就能兼容带VFP的硬件以及soft-float的软件实现,运行时的连接器ld.so会在执行浮点运算时对于运算单元的选择,是直接的硬件调用还是库函数调用,是执行/lib还是/lib/vfp下的libm。-mfloat-abi=soft (等价于-msoft-float)直接调用软浮点实现库。

在ARM RVCT工具链下,定义fpu模式:

? --fpu softvfp

? --fpu softvfp+vfpv2

? --fpu softvfp+vfpv3

? --fpu softvfp+vfpv_fp16

? --fpu softvfp+vfpv_d16

? --fpu softvfp+vfpv_d16_fp16.

定义浮点运算类型

--fpmode ieee_full : 所有单精度float和双精度double的精度都要和IEEE标准一致,具体的模式可以在运行时动态指定;

--fpmode ieee_fixed : 舍入到最接近的实现的IEEE标准,不带不精确的异常;

--fpmode ieee_no_fenv :舍入到最接近的实现的IEEE标准,不带异常;

--fpmode std :非规格数flush到0、舍入到最接近的实现的IEEE标准,不带异常;

--fpmode fast : 更积极的优化,可能会有一点精度损失。

一个浮点软链接实现的汇编例子

IMPORT __softfp_cos

BL __softfp_cos

ARMCC fplib浮点运算库

__aeabi_dadd 浮点double类型数据的加法,__aeabi_fdiv 单精度浮点除法。

附录:常见的芯片和VFP配置

Partial reference of SoC and supported ISAs

SoC

architecture

VFP

SIMD

Notes

Freescale

iMX5x

armv7

Cortex-A8; NEON only reliable in Tape-Out 3 or above

Nvidia

Tegra2

armv7

none

Marvell

Dove

armv7

iwMMXt

Qualcomm

Snapdragon

armv7

Qualcomm "Scorpion" core

Reference

本文介绍了ARM代码编译时的软浮点(soft-float)和硬浮点(hard-float)的编译以及链接实现时的不同。从VFP浮点单元的引入到软浮点(soft-float)和硬浮点(hard-float)的概念,然后是在GCC和ARMCC RVCT工具链下的具体编译参数。

arm-linux-gcc 硬浮点,ARMCC和GCC编译ARM代码的软浮点和硬浮点问题 【转】相关推荐

  1. 安卓模拟器 arm linux,让x86的android模拟器能模拟arm架构系统

    原标题:让x86的android模拟器能模拟arm架构系统 网上介绍共计三种模拟器比较常用,分别是bluestacks.andy和Genymotion,前者支持ARM架构,中者支持远程控制,后者启动速 ...

  2. ARM Linux 3.x的设备树(Device Tree)【转】

    转自:http://blog.csdn.net/21cnbao/article/details/8457546 版权声明:本文为博主原创文章,未经博主允许不得转载. 目录(?)[-] ARM Devi ...

  3. ARM Linux 3.x的设备树(Device Tree)

    宋宝华 Barry Song <21cnbao@gmail.com> 1.    ARM Device Tree起源 Linus Torvalds在2011年3月17日的ARM Linux ...

  4. ARM Linux 3.x的设备树

    2019独角兽企业重金招聘Python工程师标准>>> 转自:http://blog.csdn.net/21cnbao/article/details/8457546 本文部分案例和 ...

  5. ARM Linux设备树

    1.ARM设备树起源 在过去的ARM Linux中,arch/arm/plat-xxx和arch/arm/mach-xxx中充斥着大量的垃圾代码,很多代码只是在描述板级细节,而这些板级细节对于内核来讲 ...

  6. dtb文件linux位置,dtb文件的由来与ARM Linux 3.x的设备树(Device Tree)

    1. ARM Device Tree起源 Linus Torvalds在2011年3月17日的ARM Linux邮件列表宣称"this whole ARM thing is a f*ckin ...

  7. ARM Linux 内核 panic 之cache 一致性 ——cci-400 cache一致互联

    ARM Linux 内核 panic 之cache 一致性 --cci-400 cache一致互联 CCI-400 集合了互联和一致性功能,有 2 个 ACE slave 接口和 3 个 ACE-Li ...

  8. arm linux的ASID (Address Space ID)

    http://blog.163.com/awaken_ing/blog/static/1206131972015112011286335 平台:ARM Versatile Express for Co ...

  9. 第四十一期-ARM Linux内核的系统调用(1)

    作者:罗宇哲,中国科学院软件研究所智能软件研究中心 上一期中我们介绍了工作队列相关的关键函数,这一期我们将介绍ARM Linux内核中的系统调用. 一.ARM Linux内核中的系统调用 在ARM L ...

最新文章

  1. c语言考试经典编程题目及答案,经典练习C语言编程的题目及答案整理
  2. pandas dataframe与series
  3. Quartus 13.1安装心得
  4. Ubuntu 16.04使用root 帐号开启 SSH 登录
  5. 01-gt;选中UITableViewCell后,Cell中的UILabel的背景颜色变成透明色
  6. Android Sdk 国内镜像下载地址
  7. 高炉计算机控制,一高炉计算机控制系统升级.pdf
  8. 前端系统化学习【JS篇】:(四-3)基本数据类型之Boolean篇
  9. Element UI el-table 表格多选的使用
  10. (十八)密度聚类DBSCAN
  11. c# textbox和listbox多行显示
  12. 智能戒指,一个新鲜智能穿戴产物
  13. libgsm.a relocation R_X86_64_PC32 can not be used when making a shared object; recompile with -fPIC
  14. PHP运行的环境安装
  15. 如何把一张照片的像素提高_简单操作,让一张模糊的照片秒变清晰
  16. html字体颜色渐变色,css颜色渐变实例:css3文字颜色渐变的实现方法
  17. c语言char类型怎么输出,c语言中char类型数组的输出问题--输出时为何需要符?...
  18. QA问答系统中的深度学习技术实现
  19. 死锁避免——银行家算法
  20. Project Management

热门文章

  1. android 引用非 android 工程,Unity3D调用android方法(非插件方式)
  2. wordpress html页面缓存 cdn,WordPress 下老旧又高效的本地缓存插件 cos-html-cache
  3. python股票网格交易法详解_股票最全“低买高卖”网格交易大法,值得收藏!
  4. 字体选择_十分钟带你掌握精准选择字体的方法!
  5. ios 点生成线路 百度地图_iOS SDK | 百度地图API SDK
  6. python box2d模拟平抛运动_论述如何基于Box2D模拟星球重力效果
  7. 完全相同的4个小矩形如图所示放置_分享 | 你想知道的100个桥梁知识点!
  8. oracle数据库编程实验2答案,Oracle数据库-作业2-答案
  9. 腾讯视频下载位置_腾讯视频怎么下视频到手机
  10. android rxjava2 简书,RXJava2学习