在编写代码的过程中,算术溢出是一件让人十分头疼的事。因此在代码中检测是否溢出是一件很有必要的事,那么该如何检测算术运算中的溢出呢?

以C语言中的算术乘法为例,可以使用以下的代码检测是否有溢出:

//判断a与b的乘积是否溢出,是返回-1,否返回0
int overflow(int a,int b)
{int temp=a*b;temp/=b;return temp==a?0:-1;
}

在函数中,首先计算a与b的乘积temp,然后再计算temp除以b。如果得到的结果是a的话,那么就没有溢出,否则运算过程中发生了溢出。诚然,该函数可以有效地检测算术乘法是否溢出,但是对于CPU来说,除法的开销相对于加法、移位等操作来说是非常大的,因此我们应该尝试避免。

在这里,我们尝试使用汇编语言来判断算术运算中的溢出。

首先,让我们来了解一些背景知识。

  • CPU中维护着一组条件码,描述了最近的算术运算或逻辑运算的属性。常见的有:

    • CF(carry flag) 进位标志。最近的操作使最高位产生了进位。
    • ZF(zero flag)零标志。最近的操作得到的结果为0。
    • SF(sign flag)符号标志。最近操作得到的结果为负数。
    • OF(overflow flag)溢出标志。最近操作得到的结果导致一个补码溢出。
  • 汇编语言中SET指令根据条件码的组合,将一个字节设置为0或1。
指令 同义指令 效果 设置条件
sete D setz D ← ZF Equal / zero
setne D setnz D ← ~ZF Not equal / not zero
sets D D ← SF Negative
setns D D ← ~SF Nonnegative
setg D setnle D ← ~(SF ^ OF) & ~ZF Greater (signed >)
setge D setnl D ← ~(SF ^ OF) Greater or equal (signed >=)
setl D setnge D ← SF ^ OF Less (signed <)
setle D setng D ← (SF ^ OF) | ZF Less or equal (signed <=)
seta D setnbe D ← ~CF & ~ZF Above (unsigned >)
setae D setnb D ← ~CF Above or equal (unsigned >=)
setb D setnae D ← CF Below (unsigned <)
setbe D setna D ← CF | ZF Below or equal (unsigned <=)

在这里,我们的目标是读取到OF这个标志位。但是在上表中,并不能单独地把OF标志位存到寄存器中。仔细观察后可以发现,上表中可以设置SF^OF(setl)和SF(sets)这两个标志位,而(SF^OF)^SF=OF!因此,我们只需要将使用setl和sets指令设置两个寄存器的值,然后再将这两个寄存器中的值异或就可以得到OF标志位的值。

话不多说,让我们开始吧!
首先编写SignedOverflow.c文件:

int SignedOverflow(int a,int b)
{return a*b;
}

使用gcc -Og -S SignedOverflow.c命令产生的汇编文件如下:

 .file   "SignedOverflow.c".text.globl SignedOverflow.def  SignedOverflow; .scl    2;  .type   32; .endef.seh_proc SignedOverflow
SignedOverflow:.seh_endprologuemovl %ecx, %eaximull %edx, %eaxret.seh_endproc.ident "GCC: (x86_64-posix-seh-rev0, Built by MinGW-W64 project) 7.3.0"

然后我们在此基础上实现检测溢出的函数:

 .file   "SignedOverflow.c".text.globl SignedOverflow.def  SignedOverflow; .scl    2;  .type   32; .endef.seh_proc SignedOverflow
SignedOverflow:.seh_endprologuemovl %ecx, %eaximull %edx, %eax          ;计算%edx与%ecx的乘积sets %r10b               ;设置%r10b寄存器的值为SFsetl    %r11b               ;设置%r11b寄存器的值为SF^OFxorb %r10b, %r11b        ;异或%r10b与%r11b,得到OF,结果存在%r11b中movl    $0,   %eax          ;将返回值置为0movl    $-1,   %r10d         ;将%r10d的值置为-1testb     %r11b,  %r11b       ;测试%r11b(OF)cmovne    %r10d, %eax         ;如果%r11b不为0,将返回值置为-1ret                         ;函数返回.seh_endproc.ident  "GCC: (x86_64-posix-seh-rev0, Built by MinGW-W64 project) 7.3.0"

编写完成后,使用gcc -Og -c SignedOverflow.s生成SignedOverflow.o目标文件。

再编写测试函数main.c:

#include <stdio.h>//判断a与b的乘积是否溢出,是返回-1,否返回0
int SignedOverflow(int a,int b);int main()
{int a=0x7FFFFFFF,b=2,ans;ans=SignedOverflow(a,b);            //预期结果为溢出printf("%d\n",ans);a=0x3FFFFFFF,b=2;ans=SignedOverflow(a,b);            //预期结果为不溢出printf("%d\n",ans);return 0;
}

使用gcc -Og main.c SignedOverflow.o得到可执行文件a.exe。执行a.exe得到结果:

-1
0

大功告成!

如何更快地判断算术运算有没有溢出?相关推荐

  1. 使用Python,dlib中新型、更快、更小的5点面部标志检测器检测人脸、眼睛、鼻子

    这篇博客将介绍一个新的dlib面部标志检测器--5点人脸标志模型,它比原始版本更快(提高了8-10%),效率更高,模型更小(降低了10倍). 该5点面部标志检测器被认为是最初随dlib库一起分发的68 ...

  2. 用什么tricks能让模型训练得更快?先了解下这个问题的第一性原理

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨Horace He 来源丨机器之心 编辑丨极市平台 导读 深度 ...

  3. 如何写出让 CPU 跑得更快的代码?

    作者 | 小林coding 来源 | 小林coding(ID:CodingLin) 前言 代码都是由 CPU 跑起来的,我们代码写的好与坏就决定了 CPU 的执行效率,特别是在编写计算密集型的程序,更 ...

  4. 如何让网站打开更快第三弹--开启压缩篇

    什么是压缩? 大家还记得我们第一次接触winzip软件吗?非常神奇,一个文件,经过winzip压缩后,大小可以压缩成原来的30%左右.记得当年,很多文件,都是压缩后才可以放到自己的软盘中. 而对于网站 ...

  5. 自动驾驶年度激辩:载货比载人更快,商业化应成为评价指标 | MEET2021

    编辑部 整理自 MEET 2021 量子位 报道 | 公众号 QbitAI "载人场景下,国内公开道路Robobus一定比Robotaxi更快落地." "关于运人和运货, ...

  6. 新型序列化类库MessagePack,比JSON更快、更小的格式

    MessagePack 是个什么东东?先来看一段官方的解释: MessagePack is an efficient binary serialization format. It lets you ...

  7. 面试必问!有没有比读写锁更快的锁?

    面试三连 面试官:了解锁吗? 小明:了解,还经常用过. 面试官:说说synchronized和lock的区别吧 小明:synchronized是可重入锁,由于lock是一个接口,重入性取决于实现,sy ...

  8. 如何更快的发现新APP,不会错过新的趋势

    现在发现APP会有一些比价好的渠道国内的话主要就是用好Next,但是Next还是会让你很有局限性,这个时候能用好Product Hunt是很重要的.Product 开放了一些API,可以让你更快的知道 ...

  9. (十)更快的排序算法(归并、快排、基数)

    目标 1) 使用下列方法将一个数组按升序排序:归并排序.快速排序和基数排序 2) 评估排序的效率,讨论不同的方法的相对效率 目录 9.1 归并排序 9.1.1 归并数组 9.1.2 递归归并排序 9. ...

最新文章

  1. Hibernate基本原理(一)
  2. ExtJS2.0实用简明教程 - Column列布局
  3. 窗口分析函数_7_生成指定的分组序号
  4. Meterpreter重要命令与使用
  5. SVN 集中式版本管理工具
  6. Angular Universal 学习笔记
  7. 20165212 预备作业3 Linux安装及学习
  8. cuSPARSE库:(十一)cusparseCreateSolveAnalysisInfo()
  9. while (n-- > 0) 的用法
  10. mysql 类似 oracle connect by_mysql实现层级查询,相似oracle里的connect by prior
  11. 线性代数 动手学深度学习 pytorch
  12. 计算机一级安装的软件要钱吗,电脑没装这5个软件,基本算是废了
  13. 威纶通触摸屏的自由口通讯
  14. 视频教程-10分钟搞定 php+H5手机网页微信支付 在线视频教程(含源代码)-微信开发
  15. windows7微软官方_Microsoft Windows 7 | 第1部分
  16. 修改bash中PS1命令提示符的颜色
  17. MessageBox英文显示OK/Cancel(适用于中英文界面)
  18. 对LMAX架构以及Event Sourcing模式的一些新思考和问题的记录
  19. gridview发布后,编辑改为edit 原因是未安装 dotNetFx40LP_Full_x86_x64zh-Hans中文语言包...
  20. java 静态导入_JAVA静态导入(import static)详解

热门文章

  1. 如何将自己更改的代码上传至远程仓库
  2. 有思科账号和思科学院账号后,登陆仍然提示“Sorry, we can’t find…”.【解决Cisco Packet Tracer登陆问题】
  3. 获取新浪微博开发时的MD5签名
  4. php推送示例mip,WordPress文章页如何自动推送提交MIP/AMP页面 | 小灰灰博客
  5. HP 5200n 恢复工厂模式解决IP可ping通但无法打印故障
  6. jdk的下载/安装/配置
  7. cpp和hpp的区别(转载)
  8. Android权限规整
  9. 解决IE11不能打开网页问题
  10. 23种设计模式——责任链模式