在编译uboot的时候碰到硬浮点和软浮点的问题,找了一点相关资料,转一篇文字留作备忘。

#######################################################################
本文转自http://blog.csdn.net/yuanyou/article/details/6410326
#######################################################################

1、名字解释:

ABI,application binary interface (ABI),应用程序二进制接口。

2、编译版本问题:

GCC 4.0 为分界线
4.0版本以下,由于采用OABI接口,其对浮点的支持不太好
4.0版本以上,采用了新的EABI接口,其对软浮点和硬浮点的支持都比较好。

考虑在4.0版本以下时,其支持的ARM内核大多数没有硬浮点,所以可以分析资料比较少,
现在重点关注4.0版本以上。以下所述都是针对4.0版本以上的。

3、编译器相关的参数:

-mfloat-abi=soft 使用这个参数时,其将调用软浮点库(softfloat lib)来支持对浮点的运算,GCC编译器已经有这个库了,一般在libgcc里面。这时根本不会使用任何浮点指令,而是采用常用的指令来模拟浮点运算。 但使用的ARM芯片不支持硬浮点时,可以考虑使用这个参数。在使用这个参数时,连接时一般会出现下面的提示:
undefined reference to `__aeabi_fdiv’
或者类似的提示,主要因为一般情况下连接器没有去主动寻找软浮点库,这时使用将libgcc库加入即可。

-mfloat-abi=softfp
-mfloat-abi=hard
这两个参数都用来产生硬浮点指令,至于产生哪里类型的硬浮点指令,需要由-mfpu=xxx参数来指令。这两个参数不同的地方是:
-mfloat-abi=softfp生成的代码采用兼容软浮点调用接口(即使用-mfloat-abi=soft时的调用接口),这样带来的好处是:兼 容性和灵活性。库可以采用-mfloat-abi=soft编译,而关键的应用程序可以采用-mfloat-abi=softfp来编译。特别是在库由第 三方发布的情况下。
-mfloat-abi=hard生成的代码采用硬浮点(FPU)调用接口。这样要求所有库和应用程序必须采用这同一个参数来编译,否则连接时会出现接口不兼容错误。

-mfpu=vfp
-mfpu=fpa

前面已经讲述了,-mfpu参数就是用来指定要产生哪种硬浮点指令。常见的有vfp,fpa等。

4、编译器使用时要注意的地方:

a.确认编译器默认是使用哪种参数来处理浮点操作的。写一个简单的浮点数程序:

#include <stdio.h>
int main(void)
{double d1 = 10.3;double d2 = 2.0;double dret = d1/d2;dret++;printf("result :%f",dret);return 0;
}

然后使用

arm-linux-gcc -c main.c -o main.o

再使用

arm-linux-objdump -d main.o

然后观察产生的指令,从而确定默认使用的是软浮点还是硬浮点。(确认的过程,看个人。晃一眼,里面如果有不熟悉指令,那可能就是硬浮点指令了)

b.确认编译器所带的库使用哪种参数来编译的。
c.确认所使用的芯片是否支持硬浮点,如果支持,是哪种类型的浮点指令。如果1,2与使用的芯片相冲突,这时就要考虑另寻编译器了。

这三点确认以后,我们在写自己的应用程序时,就会知道该怎样使用这些参数了。

5、Linux相关问题:

这里涉及两个问题:

问题1:使用的ARM芯片不支持硬浮点

在配置ARM Linux内核时,应该都会看到这样的配置:

menu "Floating point emulation"
comment "At least one emulation must be selected"
config FPE_NWFPE
...

这个是用来配置在内核里面模拟浮点处理器。

这个配置有什么作用呢?估计很少有人能够知道。其实它是这样的:

当使用的ARM芯片不支持硬浮点,而又采用了-mfpu=fpa -mfloat-abi=softfp/hard来编译应用程序。现在应该知道,采用这样的参数是要参数fpa硬浮点指令。但是使用的ARM芯片不支持硬浮点,这时这个配置就起作用了。因为使用了fpa硬浮点指令,但使用的ARM芯片不支持硬浮点,这样当程序运行到fpa硬浮点指令,会出现指令异常,便会 陷入到内核里,这时这个模拟浮点处理器就来模拟这些浮点指令。现在应该清楚了,其作用了吧。但是现在有了更好的办法,前面已经讲过了,采用 -mfloat-abi=soft参数来编译应用程序,这样效率会快得多。想想从用户态切换到内核态,以及由此产生的cache和TLB表的损失。所以可 以考虑将这个配置抛弃了。

问题2:使用的ARM芯片支持硬浮点

一般ARM芯片支持硬浮点,都是采用协处理器方式的。与ARM内核本身一样,协处理器也有自己的寄存器。这样当多个进程同时涉及浮点运算时,会怎样?所以Linux内核为了支持硬浮点,也要做一些工作的。
内核配置:

config VFP
bool "VFP-format floating point maths"
depends on CPU_V6 || CPU_ARM926T || CPU_V7 || CPU_FEROCEON

如果使用的ARM芯片支持硬浮点,同时在应用程序里面使用了硬浮点,那么内核可能需要做一些工作。。上面这个配置是针对vfp硬浮点处理器的;如果是其他 硬浮点处理,需要参考相关的资料,来确认要做哪些功能。如果可以确保所有时候,可以确保只有一个进程使用硬浮点处理器,那可以不需要考虑对硬浮点相关寄存 器的保存和切换,问题是可以确认吗?

对于浮点运算,针对ARM芯片应该尽量避免。如果无法避免,那就需要综合考虑到底使用哪种方式?如何去操作?性能如何?都需要考虑,去实验测试是最好的。

ARM GCC浮点相关总结相关推荐

  1. [ARM] [基础][编译]ARM的浮点功能历史分类和对应的编译选项

    前言:ARM编译的时候有很多编译选项和浮点功能相关,要真正理解这些编译选项的选择,不仅仅要了解ARM的体系构建的基础知识,可能还需要了解一下ARM的历史.之后,真对这些再考虑到ARM编译选项就比较好理 ...

  2. ARM GCC Inline Assembler Cookbook

    http://www.ethernut.de/en/documents/arm-inline-asm.html  (原文链接) ARM GCC Inline Assembler Cookbook Ab ...

  3. boost::random模块使用多精度类型测试所有与浮点相关的生成器和分布的测试程序

    boost::random模块使用多精度类型测试所有与浮点相关的生成器和分布的测试程序 实现功能 C++实现代码 实现功能 boost::random模块使用多精度类型测试所有与浮点相关的生成器和分布 ...

  4. armgcc交叉编译的文件无法运行_从0开始搭建基于ARM GCC的软件系统02——使用ARM GCC编译SDK

    本文以STM32L4VGT6为例,因为手上只有这么一块开发板.其它IC处理方法应该类似. 一.准备工作 1.打开官网https://www.st.com/content/st_com/en.html, ...

  5. SOM-TL5728 AM5728双核ARM Cortex-A15 +浮点双核DSP C66x处理器设计的工业级核心板

    创龙SOM-TL5728是一款基于TI Sitara系列AM5728双核ARM Cortex-A15 +浮点双核DSP C66x处理器设计的高端异构多核SoC工业级核心板.通过工业级高速B2B连接器引 ...

  6. 在windows上配置VScode支持ARM GCC开发环境

    简单有效的在windows上,配置VS Code,以支持GCC开发环境.没有什么花里胡哨的. 需要用到的工具 Visual Studio Code :编辑工具 ARM GCC :            ...

  7. WSL构建nRF5 SDK + ARM GCC开发环境 – RTT打印调试日志

    陈拓 2022/07/28-2022/11/04 1. 概述 在<WSL构建nRF5 SDK + ARM GCC开发环境> https://zhuanlan.zhihu.com/p/544 ...

  8. ARM GCC汇编伪指令

    转载,原文地址:http://blog.chinaunix.net/uid-20626696-id-199009.html word expression就是在当前位置放一个word型的值,这个值就是 ...

  9. linux arm gcc 内联汇编参考手册

    关于本文档 GNU C 编译器为 ARM 精简指令系统处理器提供了在 C 代码中内嵌汇编的功能.这种非常酷的特性提供了一些 C 代码没有的功能,比如手工优化软件关键代码.使用相关的处理器指令. 本文假 ...

  10. gcc 编译相关CFLAGS LDFLAGS LIB

    CFLAGS 表示用于 C 编译器的选项, CXXFLAGS 表示用于 C++ 编译器的选项. 这两个变量实际上涵盖了编译和汇编两个步骤. CFLAGS: 指定头文件(.h文件)的路径,如:CFLAG ...

最新文章

  1. 叛逆的仔:不听老板的话,还要用行动给老板来个响亮耳光!
  2. java groovy jar包_如何将jar包包含在groovy脚本中?
  3. 从Internet上抓取指定URL的源码的方案
  4. libxxx.so- text relocations问题的终极解决方案
  5. 解决类似/usr/lib64/libstdc++.so.6:version `GLIBCXX_3.4.21` not found的问题
  6. 猎鹰spacex_我如何重新创建SpaceX仪表板UI
  7. [react] props.children.map和js的map有什么区别?为什么优先选择react的?
  8. 数学中的一朵“奇葩”——四元数
  9. 解决EasyDSS、EasyNVR流媒体RTMP、HLS(m3u8)、HTTP-FLV播放提示H5播放错误的问题
  10. 极客大学架构师训练营 系统架构 分布式数据库 数据分片 业务分库 CAP ACID BASE 第11课 听课总结
  11. Android Netd
  12. UI设计初学者教程:色彩基础知识
  13. 直接管理和维护计算机系统的程序称为,全国2008年04月自学考试计算机原理试题及答案.doc...
  14. 一年多推行每日构建的经验总结
  15. Android 自定义表格显示数据
  16. Windows自带的“QQ”
  17. 浅谈DSD音频 是发展趋势还是厂商噱头
  18. 【DD应用系统源码】软件库源码
  19. Python求解非线性方程
  20. Ubuntu 22.04换清华源

热门文章

  1. 代码炼金术·02集·卓越程序员磨刀不误砍柴工--快速学习能力
  2. Google chrome浏览器快捷方式
  3. win10系统更新后打开chrome浏览器几秒后自动闪退
  4. python写android抢票软件,如何用python写一个简单的12306抢票软件
  5. 企业怎么发国际短信?为什么要发国际短信?
  6. JS重点整理之JS原型链彻底搞清楚
  7. 网站死链接检测查询工具
  8. 6款反垃圾邮件产品横向比较测试
  9. 电脑计算机丢失msvcp140.dll,电脑缺少msvcp140.dll怎么办
  10. 【Python】从堆糖爬取图片Demo