浮点数float累加误差解决方式总结
首先是float累加产生误差的原因,该部分转自:http://blog.csdn.net/zhrh0096/article/details/38589067
1. 浮点数IEEE 754表示方法
要搞清楚float累加为什么会产生误差,必须先大致理解float在机器里怎么存储的,具体的表示参考[1] 和 [2], 这里只介绍一下组成
由上图可知(摘在[2]), 浮点数由: 符号位 + 指数位 + 尾数部分, 三部分组成。由于机器中都是由二进制存储的,那么一个10进制的小数如何表示成二进制。例如: 8.25转成二进制为1000.01, 这是因为 1000.01 = 1*2^3 + 0*2^2 + 0*2^1 + 0*2^0 + 0*2^-1 + 2*2^-2 = 1000.01.
(2)float的有效位数是6-7位,这是为什么呢?因为位数部分只有23位,所以最小的精度为1*2^-23 在10^-6和10^-7之间,接近10^-7,[3]中也有解释
那么为什么float累加会产生误差呢,主要原因在于两个浮点数累加的过程。
2. 两个浮点数相加的过程
两浮点数X,Y进行加减运算时,必须按以下几步执行(可参考 [4] 中插图):
(1)对阶,使两数的小数点位置对齐,小的阶码向大的阶码看齐。
(2)尾数求和,将对阶后的两尾数按定点加减运算规则求和(差)。
(3)规格化,为增加有效数字的位数,提高运算精度,必须将求和(差)后的尾数规格化。
(4)舍入,为提高精度,要考虑尾数右移时丢失的数值位。
(5)判断结果,即判断结果是否溢出。
关键就在与对阶这一步骤,由于float的有效位数只有7位有效数字,如果一个大数和一个小数相加时,会产生很大的误差,因为尾数得截掉好多位。例如:
123 + 0.00023456 = 1.23*10^2 + 0.000002 * 10^2 = 123.0002
那么此时就会产生0.00003456的误差,如果累加多次,则误差就会进一步加大。
解决方式有几种,但都不是最佳方式,参考:http://bbs.csdn.net/topics/390549664
3.解决方法
方法一
Kahan summation算法
https://en.wikipedia.org/wiki/Kahan_summation_algorithm
function KahanSum(input)var sum = 0.0var c = 0.0 // A running compensation for lost low-order bits.for i = 1 to input.length dovar y = input[i] - c // So far, so good: c is zero.var t = sum + y // Alas, sum is big, y small, so low-order digits of y are lost.c = (t - sum) - y // (t - sum) cancels the high-order part of y; subtracting y recovers negative (low part of y)sum = t // Algebraically, c should always be zero. Beware overly-aggressive optimizing compilers!next i // Next time around, the lost low part will be added to y in a fresh attempt.return sum
伪代码如上
解决方法就是把多余的误差部分算出来(c),再在下一次循环减去这个误差
方法二
int main()
{
float f = 0.1;
float sum = 0;
sum+=add(f,4000000);
cout<<sum<<endl;
return 0;
}float add(float f,int count)
{if(count==1)return f;elsereturn add(f,count/2)+add(f,count-count/2);
}
二分法递归计算加法,这样会没有误差,但是函数调用消耗大(尤其是多次)
方法三
使用double,精度更高,但是本来是没有必要用这么高精度的
方法四
ieee浮点数,为了规格化,精度每超过2的整数次幂,精度要下降一位,
你的f是0.1,float位数是23,当sum足够大的时候,会出现 sum+f==sum 的情况,这个是ieee标准,
和C++没关系,事实上编译器应该已经做了浮点精度调整了,你这结果误差算小的了.
避免这种误差的方法就是浮点数,永远不要让一个很大的数去加上一个很小的数.不知你这段代码的目的是
什么,但如果你改成这样,误差会小很多:
float f = 0.1;
float sum = 0;
for( i=0; i<100; i++)
{
int sumEachBig=0;
for(....k<400....)
{
int sumEachSmall=0;
for(....j<100.....)sumEachSmall += f;sumEachBig+=sumEachSmall;}sum += sumEachBig;}
来自manzi11的回答。多次用多次循环,小循环的计算结果加上大循环的运算结果
by wolf96 2017/7/10
浮点数float累加误差解决方式总结相关推荐
- 浮点数在计算机中存储方式float,double)---转
C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= ...
- 22.25在计算机中如何储存,浮点数在计算机中存储方式
C语言和C#语言中,对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit,我们在声明一个变量float f= ...
- python 浮点数精度丢失_javascript解决小数的加减乘除精度丢失的方案
原因:js按照2进制来处理小数的加减乘除,在arg1的基础上 将arg2的精度进行扩展或逆扩展匹配,所以会出现如下情况. javascript(js)的小数点加减乘除问题,是一个js的bug如0.3* ...
- java浮点数误差_浮点数运算的误差
浮点数运算的误差 在 JavaScript 中整数和浮点数都属于number 数据类型,所有数字都是使用64位浮点数形式储存,遵循IEEE-754双精度标准存储,即便整数也是如此. 所以我们在打印 1 ...
- c语言对浮点数的处理默认是double吗,C语言中浮点数float和double输出的问题
C语言中浮点数float和double输出的问题 关注:260 答案:6 信息版本:手机版 解决时间 2019-01-12 07:33 斑駁影 2019-01-11 09:20 #includev ...
- 常见浏览器兼容性问题与解决方式
所谓的浏览器兼容性问题,是指由于不同的浏览器对同一段代码有不同的解析,造成页面显示效果不统一的情况.在大多数情况下,我们的需求是,不管用户用什么浏览器来查看我们的站点或者登陆我们的系统,都应该是统一的 ...
- 【MyBatis】sql列名与实体类属性名不同的解决方式
sql列名与Java实体类属性名不同的解决方式 例如: 数据库 CREATE TABLE orders(order_id INT PRIMARY KEY AUTO_INCREMENT,order_no ...
- CSM中一些常见问题的解决方式
CSM中一些常见问题的解决方式 抖动 摄像机在每帧移动或者旋转时,会产生较严重的抖动问题.抖动我们可以分为平移抖动和缩放抖动. 平移抖动: 我们在平移摄像机时会产生的抖动: 我们关闭PCF,并减小深度 ...
- 优雅的嵌套滑动解决方式-NestedScroll
优雅的嵌套滑动解决方式-NestedScroll 嵌套滑动相信大家一定经常遇到,最烦人的就是我们有两层view,它们都能在同一个方向上滑动,这时候滑动的判断就是个头疼的问题.不过这也还好说,毕竟只要根 ...
- 深入理解C++浮点数(float、double)类型数据比较、相等判断
深入理解C++浮点数(float.double)类型数据比较.相等判断 浮点数在内存中的存储机制和整型数不同,其有舍入误差,在计算机中用近似表示任意某个实数.具体的说,这个实数由一个整数或定点数(即尾 ...
最新文章
- 深度学习100例 | 第27天-卷积神经网络(CNN):艺术作品识别
- 多文件编程 【多文件编程】(26)
- uvalive 4795 Paperweight
- spark standalone集群安装及spark on yarn
- ubuntu开启mysql日志记录
- Android开发入门之学习笔记(三):程序窗口的布局
- 一个迷你ASP.NET Core框架的实现(下)
- logback 配置详解
- echart vue 图表大小_vue中echarts图表大小适应窗口大小且不需要刷新案例
- mysql5和8怎么同时安装_WINDOWS服务器同时安装多个版本的MYSQL的方法,MQYSQL5和MQYSQL8的共存。...
- VGG16的10折交叉验证实现cifar10的分类(keras实现)
- 机器学习 --- 4. 大内密探HMM(隐马尔可夫)围捕赌场老千(转)
- python queue的用法_PYTHON多进程用法之四(Queue)
- 四叉树数据编码结构在电子狗中的应用
- 概率论与数理统计(6):数理统计的基本概念
- 秦曾昌人工智能课程---1、机器学习中的数学基础
- springcloud微服务
- 南航数据分析与挖掘课设1(下)——基于多元线性回归模型,ARIMA序列的中国GDP增长影响因素研究及预测(R语言代码附录)
- XSS之xss-labs-level17
- 如何清除PDF中的水印?PDF删除水印的方法
热门文章
- 任泉自曝在Star VC年薪100万 今年重点投资互联网金融
- Android11 手动屏幕亮度调节流程代码追踪;
- 【U8】凭证上修改使用自定义项科目的辅助信息
- Arduino驱动HDC1080测量温湿度
- FPGA 驱动HDC1080温湿度模块
- 《智能商业》读后感作文5000字
- 从一到无穷大--读后感
- 一对一语音视频直播双端原生APP源码/thinkphp后台源码/社交交友语音视频聊天即时通信APP源码
- MAC m1 node vue ui 编译项目时报错:node_modules/.bin/vue-cli-service: Permission denied 解决
- Autoleaders控制组——叶睿 第三次任务