Kahan's summation Formula

保持精度的小trick：Kahan's summation Formula

由于最近用GPU编程，涉及到了float数组，就不得不涉及精度问题。在 CPU 上进行计算时，我们使用 double（即 64 bits 浮点数）来累进计算过程，而在 GPU 上则只能用 float（32 bits 浮点数）。在累加大量数字的时候，由于累加结果很快会变大，因此后面的数字很容易被舍去过多的位数。对于双精度如C中double以及Fortran中real(kind = 8)，一般运算的精度足以保持，但是单精度数组，在大量操作后极易出现“大数吃小数”等不稳定现象。在不能使用更高精度数组的前提下，可以用一个小技巧来保持精度：Kahan求和。

function KahanSum(input)
var sum = 0.0
var c = 0.0 //A running compensation for lost low-order bits.
for i = 1 to input.length do
y = input[i] - c //So far, so good: c is zero.
t = sum + y //Alas, sum is big, y small, so low-order digits of y are lost.
c = (t - sum) - y //(t - sum) recovers the high-order part of y; subtracting y recovers -(low part of y)
sum = t //Algebraically, c should always be zero. Beware eagerly optimising compilers!
//Next time around, the lost low part will be added to y in a fresh attempt.
return sum

见下面一段Fortran代码：

program main
implicit none
    integer, parameter:: N = 1000000
    integer i
    real(kind = 4), parameter:: ELEMENT = 0.001
    real(kind = 4) s, eps, y, t

write (*, "('Theoretical value: ', F10.5)") N*ELEMENT

s = 0.0
    do i = 1, N
        s = s+ELEMENT
    enddo
    write (*, "('Naive method value: ', F10.5)") s

s = 0.0
    eps = 0.0
    do i = 1, N
        y = ELEMENT-eps
        t = s+y
        eps = (t-s)-y
        s = t
    enddo
    write (*, "('Kahan method value: ',F10.5)") s

stop
end

运行结果为：

Theoretical value: 1000.00006
Naive method value: 991.14154
Kahan method value: 1000.00006

对于N个0.001，普通方法累加到991左右就已经丢失精度了。可以看到用“Kahan method”能够得到近乎于理论的精度数值。分析一下他的原理。我们发现，如果没有精度损失，eps永远为0，y就是ELEMENT=0.001。一旦在 i 到了某个数值出现了大数吃小数的情形时，不妨激进的设小数部分全部被截断，则如s = 991.0000时，由于eps之前为0，则y=0.0010.之后t=s+y，得到的就是“吃掉”的结果，如991.0000，绝对误差达0.001.此时：eps=(t-s)-y=(991.0000-991.0000)-0.0010=-0.001，可见eps起了保存“损失位”的作用。此时s=t=991.0000.下个循环：y = 0.001--0.001=0.002，t = s+y=991.0000，eps=-0.002，如此反复，这样足够多循环后，eps足可以复现大的校正值，从而保证结果的高精度。当eps足够大时候，(t-s)-y=0,从而使eps重新为0，继续起保存损失的作用。

Kahan's summation Formula相关推荐

Kahan's Summation Formula原理—它是如何处理大数吃小数的
Kahan's Summation Formula原理-它是如何避免大数吃小数的 Kahan求和公式原理: 首先,这个算法就是用来求和的,求a1+a2+a3+...为什么不直接相加呢,而要用Kahan ...
深入浅出CUDA编程
标签: cuda编程threadfloatconflictexpress 2010-12-10 13:29 44960人阅读评论(7) 收藏举报 CUDA 是 NVIDIA 的 GPGPU 模型, ...
深入浅出谈CUDA（二）
前面介绍的计算平方和的程序,似乎没有什么实用价值.所以我们的第二个 CUDA 程序,要做一个确实有(某些)实用价值的程序,也就是进行矩阵乘法.而且,这次我们会使用浮点数. 虽然矩阵乘法有点老套,不过因 ...
bookmarks_2021_9_28
书签栏通讯 s7-1200与s7-200smart通讯-工业支持中心-西门子中国 IO_device S7-1200PROFINET通信 ET 200SP 安装视频 - ID: 95886218 - ...
CUDA: 矩阵乘法优化
矩阵乘法是有实用价值的程序,我们会使用浮点数. 虽然矩阵乘法有点老套,不过因为它相当简单,而且也可以用来介绍一些有关 CUDA 的有趣性质. 矩阵乘法为了单纯起见,我们这里以方形的矩阵为例子.基本上 ...
CUDA 深入浅出谈[转]
CUDA 深入浅出谈 "CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要 ...
CUDA 深入浅出谈
CUDA 深入浅出谈 "CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要 ...
CUDA编程深入浅出，案列讲解
CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构." ...
矩阵乘法——CUDA 优化记录
CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构." ...

Kahan's summation Formula

保持精度的小trick：Kahan's summation Formula

Kahan's summation Formula相关推荐

最新文章

热门文章