阿里程序员工作小技巧:理解CPU分支预测,提高代码效率
技术传播的价值,不仅仅体现在通过商业化产品和开源项目来缩短我们构建应用的路径,加速业务的上线速率,体现也会在优秀程序员在工作效率提升,产品性能优化和用户体验改善等小技巧方面的分享,以提高我们的工作能力。
本文来自阿里巴巴中间件技术团队的程序员断岭,他是阿里微服务开源项目Dubbo的项目组成员,也是Java线上诊断开源项目Arthas的负责人。
一 、基础概念
a. Dubbo: 是一款高性能、轻量级的开源Java RPC框架,提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现;
b. ChannelEventRunnable: Dubbo 里所有网络事件的回调接口;
c. JMH:即Java Microbenchmark Harness,是专门用于代码微基准测试的工具套件。在性能优化的过程中,可以使用JMH对优化的结果进行量化的分析。
二、需求缘起:
在Stack Overflow上有一个非常著名的问题:为什么处理有序数组要比非有序数组快?从问题的结论来看,是分支预测对代码运行效率的提升起到了非常重要的作用。
现今的CPU是都支持分支预测(branch prediction)和指令流水线(instruction pipeline),这俩的结合可以极大的提高CPU的工作效率,从而提高代码执行效率。但这仅适用于简单的if跳转,但对于Switch跳转,CPU则没有太好的解决办法,因为Switch本质上是据索引,是从地址数组里取地址再跳转。
三、思考和方案假设
要提高代码执行效率,一个重要的实现原则就是尽量避免CPU把流水线清空,从Stack Overflow上的讨论结果来看,通过提高分支预测的成功率,是可以降低CPU对流水线清空的概率。那么,除了在硬件层面,是否可以考虑代码层面帮CPU把判断提前,来提高代码执行效率呢?
四、方案验证
在Dubbo的ChannelEventRunnable里有一个Switch来判断channel state。当一个channel建立起来之后,超过99.9%的情况,它的state都是ChannelState.RECEIVED,我们可以考虑,把这个判断提前。
以下通过JMH来验证,把判断提前后是否就可以提高代码执行效率。
public class TestBenchMarks {\tpublic enum ChannelState {\t\tCONNECTED, DISCONNECTED, SENT, RECEIVED, CAUGHT\t}\t@State(Scope.Benchmark)\tpublic static class ExecutionPlan {\t\t@Param({ \u0026quot;1000000\u0026quot; })\t\tpublic int size;\t\tpublic ChannelState[] states = null;\t\t@Setup\t\tpublic void setUp() {\t\t\tChannelState[] values = ChannelState.values();\t\t\tstates = new ChannelState[size];\t\t\tRandom random = new Random(new Date().getTime());\t\t\tfor (int i = 0; i \u0026lt; size; i++) {\t\t\t\tint nextInt = random.nextInt(1000000);\t\t\t\tif (nextInt \u0026gt; 100) {\t\t\t\t\tstates[i] = ChannelState.RECEIVED;\t\t\t\t} else {\t\t\t\t\tstates[i] = values[nextInt % values.length];\t\t\t\t}\t\t\t}\t\t}\t}\t@Fork(value = 5)\t@Benchmark\t@BenchmarkMode(Mode.Throughput)\tpublic void benchSiwtch(ExecutionPlan plan, Blackhole bh) {\t\tint result = 0;\t\tfor (int i = 0; i \u0026lt; plan.size; ++i) {\t\t\tswitch (plan.states[i]) {\t\t\tcase CONNECTED:\t\t\t\tresult += ChannelState.CONNECTED.ordinal();\t\t\t\tbreak;\t\t\tcase DISCONNECTED:\t\t\t\tresult += ChannelState.DISCONNECTED.ordinal();\t\t\t\tbreak;\t\t\tcase SENT:\t\t\t\tresult += ChannelState.SENT.ordinal();\t\t\t\tbreak;\t\t\tcase RECEIVED:\t\t\t\tresult += ChannelState.RECEIVED.ordinal();\t\t\t\tbreak;\t\t\tcase CAUGHT:\t\t\t\tresult += ChannelState.CAUGHT.ordinal();\t\t\t\tbreak;\t\t\t}\t\t}\t\tbh.consume(result);\t}\t@Fork(value = 5)\t@Benchmark\t@BenchmarkMode(Mode.Throughput)\tpublic void benchIfAndSwitch(ExecutionPlan plan, Blackhole bh) {\t\tint result = 0;\t\tfor (int i = 0; i \u0026lt; plan.size; ++i) {\t\t\tChannelState state = plan.states[i];\t\t\tif (state == ChannelState.RECEIVED) {\t\t\t\tresult += ChannelState.RECEIVED.ordinal();\t\t\t} else {\t\t\t\tswitch (state) {\t\t\t\tcase CONNECTED:\t\t\t\t\tresult += ChannelState.CONNECTED.ordinal();\t\t\t\t\tbreak;\t\t\t\tcase SENT:\t\t\t\t\tresult += ChannelState.SENT.ordinal();\t\t\t\t\tbreak;\t\t\t\tcase DISCONNECTED:\t\t\t\t\tresult += ChannelState.DISCONNECTED.ordinal();\t\t\t\t\tbreak;\t\t\t\tcase CAUGHT:\t\t\t\t\tresult += ChannelState.CAUGHT.ordinal();\t\t\t\t\tbreak;\t\t\t\t}\t\t\t}\t\t}\t\tbh.consume(result);\t}}
验证说明:
- benchSiwtch里是纯Switch判断;
- benchIfAndSwitch里用一个如果提前判断状态是否
ChannelState.RECEIVED
。
基准测试结果是:
Result \u0026quot;io.github.hengyunabc.jmh.TestBenchMarks.benchSiwtch\u0026quot;: 576.745 ±(99.9%) 6.806 ops/s [Average] (min, avg, max) = (490.348, 576.745, 618.360), stdev = 20.066 CI (99.9%): [569.939, 583.550] (assumes normal distribution)# Run complete. Total time: 00:06:48Benchmark (size) Mode Cnt Score Error UnitsTestBenchMarks.benchIfAndSwitch 1000000 thrpt 100 1535.867 ± 61.212 ops/sTestBenchMarks.benchSiwtch 1000000 thrpt 100 576.745 ± 6.806 ops/s
可以看到,提前if判断提高了近3倍的代码效率,这种技巧可以放在性能要求严格的地方。。
五、总结
- 开关对于CPU来说难以做分支预测。
- 某些Switch条件如果概率比较高,可以在代码层设置提前if判断,充分利用CPU的分支预测机制。
查看原文链接:阿里程序员工作小技巧| 理解CPU分支预测,提高代码效率
阿里程序员工作小技巧:理解CPU分支预测,提高代码效率相关推荐
- 阿里程序员工作小技巧 | 理解CPU分支预测,提高代码效率
技术传播的价值,不仅仅体现在通过商业化产品和开源项目来缩短我们构建应用的路径,加速业务的上线速率,也会体现在优秀程序员在工作效率提升.产品性能优化和用户体验改善等小技巧方面的分享,以提高我们的工作能力 ...
- 五年程序员工作小结技巧
因每样事物都具其特色,每个人都有其个性,故而每种工作都有其技巧,每件事情都有其方法. 程序员的工作亦是如此,假如不能抓住事物的本质去对待问题,恐事倍功半,徒劳无功. 回想起初,刚接手单片机上,简单的点 ...
- 转载-一个中科大差生的8年程序员工作总结 - 陈小房的文章 - 知乎
作者:陈小房 链接:https://zhuanlan.zhihu.com/p/343098771 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 今年终于从大菊花厂离 ...
- 美团专家:35岁是程序员工作的终点?
点击"开发者技术前线",选择"星标????" 在看|星标|留言, 真爱 来自:美团点评技术博客 地址:https://tech.meituan.com/stu ...
- 一个中科大差生的 8 年程序员工作总结
关注.星标公众号,直达精彩内容 之前分享过一些大佬的程序人生,不少读者留言说喜欢看这类文章,因为多多少少都会对自己有一定的启发,而且也快过春节了,相信大家也没有心思看技术文章了,哈哈. 这个星期我又发 ...
- 程序员工作中沟通能力重要吗
大家都知道,一个IT程序员在工作中技术能力,知识积累很重要,很多人不解,我把工作做好了,功能开发出来了,网站搭建好了就可以了啊,为什么还需要沟通能力呢,今天,小编就给大家介绍下程序员工作中沟通能力重要 ...
- 程序员工作经验谈之商贸平台
程序员工作经验谈 1.怎样顺利找到工作,并稳稳当当坐下来呢? ①如何通过面试? 答:态度要积极,要听话.积极并且有热情. 表达能力要良好,能够流利介绍个人情况,例如工作情况,为何离职等. 专业基础要扎 ...
- 程序员工作五年之后,我转行成为公务员,分享一下切身体会
程序员工作了五年之后,我参加了公务员考试,如今我已经在新的岗位工作中有两年了.我想分享一下我这两年的感受.这是兴哥粉丝小罗的一段真实的经历,大家一起听一下他的自述. 首先,适应期在第一年,第二年我完全 ...
- 程序员工作不稳定?你以为的稳定工作,其实都是高风险职业
你一定听到过别人这样的议论: "程序员工作太不稳定,天天总跳槽,而且年龄越大越不吃香...." 今天笔者来带大家算一笔账,看看他们口中稳定的职业,和"程序员"不 ...
最新文章
- 「它将改变一切」,AI「诺奖级」里程碑!DeepMind 破解蛋白质分子折叠问题
- UESTC 电子科大专题训练 数据结构 J
- 女大学生两块钱成功进外企
- windows mysql备份与恢复_windows下Mysql自动备份与恢复说明
- python 模块定义_在python中定义私有模块函数
- Tomcat JVM参数配置和自启动配置
- C#——WebApi 接口参数传参详解
- rtx2060为什么叫智商卡_作为世界上智商最低的狗种之一,中华田园犬是否“名副其实”?...
- idou老师教你学Istio12 : Istio 实现流量镜像
- 如何按照滑环的原理来自制简易导电滑环
- 【python数据结构】多维数组
- “区块链”将彻底改变人类社会文明,颠覆世界最强大的企业
- RMQ倍增,附赠有趣小故事一发
- 移动通信基础(14)均衡
- ConnectBot的使用
- 我才23岁,我要去追太阳了
- 0x80073712_Win10更新提示0x80073712错误代码解决方法
- android手机应用程序开发,Android手机应用程序开发标准
- 虹软:中小企业该如何拥抱 AI
- 一篇讲autoconf/automake的好文章