先看再点赞,给自己一点思考的时间,微信搜索【沉默王二】关注这个有颜值却假装靠才华苟且的程序员。
本文 GitHub github.com/itwanger 已收录,里面还有我精心为你准备的一线大厂面试题。

今天周日,没什么重要的事情要做,于是我早早的就醒来了。看了一会渡边淳一的书,内心逐渐感到平静——心情不佳的时候,书好像是最好的药物。心情平静了,就需要做一些更有意义的事情——逛技术网站,学习精进。

Stack Overflow 是我最喜欢逛的一个网站,它是我 Chrome 浏览器的第一个书签。里面有很多很多经典的问题,其中一些回答,剖析得深入我心。就比如说这个:“为什么处理排序后的数组比没有排序的快?”

毫无疑问,直观印象里,排序后的数组处理起来就是要比没有排序的快,甚至不需要理由,就好像我们知道“夏天吃冰激凌就是爽,冬天穿羽绒服就是暖和”一样。

但本着“知其然知其所以然”的态度,我们确实需要去搞清楚到底是为什么?

来看一段 Java 代码:

/*** @author 沉默王二,一枚有趣的程序员*/
public class SortArrayFasterDemo {public static void main(String[] args) {// 声明数组int arraySize = 32768;int data[] = new int[arraySize];Random rnd = new Random(0);for (int c = 0; c < arraySize; ++c) {data[c] = rnd.nextInt() % 256;}// !!! 排序后,比没有排序要快Arrays.sort(data);// 测试long start = System.nanoTime();long sum = 0;for (int i = 0; i < 100000; ++i){// 循环for (int c = 0; c < arraySize; ++c){if (data[c] >= 128) {sum += data[c];}}}System.out.println((System.nanoTime() - start) / 1000000000.0);System.out.println("sum = " + sum);}
}

这段代码非常简单,我来解释一下:

  • 声明一个指定长度(32768)的数组。
  • 声明一个 Random 随机数对象,种子是 0;rnd.nextInt() % 256 将会产生一个余数,余数的绝对值在 0 到 256 之间,包括 0,不包括 256,可能是负数;使用余数对数组进行填充。
  • 使用 Arrays.sort() 进行排序。
  • 通过 for 循环嵌套计算数组累加后的结果,并通过 System.nanoTime() 计算前后的时间差,精确到纳秒级。

我本机的环境是 Mac OS,内存 16 GB,CPU Intel Core i7,IDE 用的是 IntelliJ IDEA,排序后和未排序后的结果如下:

排序后:2.811633398
未排序:9.41434346

时间差还是很明显的,对吧?未排序的时候,等待结果的时候让我有一种担心:什么时候结束啊?不会结束不了吧?

读者朋友们有没有玩过火炬之光啊?一款非常经典的单机游戏,每一个场景都有一副地图,地图上有很多分支,但只有一个分支可以通往下一关;在没有刷图之前,地图是模糊的,玩家并不知道哪一条分支是正确的。

如果侥幸跑的是一条正确的分支,那么很快就能到达下一关;否则就要往回跑,寻找正确的那条分支,需要花费更多的时间,但同时也会收获更多的经验和声望。

作为一名玩过火炬之光很久的老玩家,几乎每一幅地图我都刷过很多次,刷的次数多了,地图差不多就刻进了我的脑袋,即便是一开始地图是模糊的,我也能凭借经验和直觉找到最正确的那条分支,就省了很多折返跑的时间。

读者朋友们应该注意到了,上面的代码中有一个 if 分支——if (data[c] >= 128),也就是说,如果数组中的值大于等于 128,则对其进行累加,否则跳过。

那这个代码中的分支就好像火炬之光中的地图分支,如果处理器能够像我一样提前预判,那累加的操作就会快很多,对吧?

处理器的内部结构我是不懂的,但它应该和我的大脑是类似的,遇到 if 分支的时候也需要停下来,猜一猜,到底要不要继续,如果每次都猜对,那显然就不需要折返跑,浪费时间。

这就是传说中的分支预测!

我需要刷很多次图才能正确地预测地图上的路线,处理器需要排序才能提高判断的准确率

计算机发展了这么多年,已经变得非常非常聪明,对于条件的预测通常能达到 90% 以上的命中率。但是,如果分支是不可预测的,那处理器也无能为力啊,对不对?

排序后花费的时间少,未排序花费的时间多,罪魁祸首就在 if 语句上。

if (data[c] >= 128) {sum += data[c];
}

数组中的值是均匀分布的(-255 到 255 之间),至于是怎么均匀分布的,我们暂且不管,反正由 Random 类负责。

为了方便讲解,我们暂时忽略掉负数的那一部分,从 0 到 255 说起。

来看经过排序后的数据:

data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...= NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT

N 是小于 128 的,将会被 if 条件过滤掉;T 是将要累加到 sum 中的值。

再来看未排序的数据:

data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...= TTNTTTTNTNNTTTN ...

完全没有办法预测。

对比过后,就能发现,排序后的数据在遇到分支预测的时候,能够轻松地过滤掉 50% 的数据,对吧?是有规律可循的。

那假如说不想排序,又想节省时间,有没有办法呢?

如果你直接问我的话,我肯定毫无办法,两手一摊,一副无奈脸。不过,Stack Overflow 以上帝视角给出了答案。

把:

if (data[c] >= 128) {sum += data[c];
}

更换为:

int t = (data[c] - 128) >> 31;
sum += ~t & data[c];

通过位运算消除了 if 分支(并不完全等同),但我测试了一下,计算后的 sum 结果是相同的。

/*** @author 沉默王二,一枚有趣的程序员*/
public class SortArrayFasterDemo {public static void main(String[] args) {// 声明数组int arraySize = 32768;int data[] = new int[arraySize];Random rnd = new Random();for (int c = 0; c < arraySize; ++c) {data[c] = rnd.nextInt() % 256;}// 测试long start = System.nanoTime();long sum = 0;for (int i = 0; i < 100000; ++i){// 循环for (int c = 0; c < arraySize; ++c){if (data[c] >= 128) {sum += data[c];}}}System.out.println((System.nanoTime() - start) / 1000000000.0);System.out.println("sum = " + sum);// 测试long start1 = System.nanoTime();long sum1 = 0;for (int i = 0; i < 100000; ++i){// 循环for (int c = 0; c < arraySize; ++c){int t = (data[c] - 128) >> 31;sum1 += ~t & data[c];}}System.out.println((System.nanoTime() - start1) / 1000000000.0);System.out.println("sum1 = " + sum1);}
}

输出结果如下所示:

8.734795196
sum = 156871800000
1.596423307
sum1 = 156871800000

数组累加后的结果是相同的,但时间上仍然差得非常多,这说明时间确实耗在分支预测上——如果数组没有排序的话。

最后,不得不说一句,大神级程序员不愧是大神级程序员,懂得位运算的程序员就是屌。

建议还在读大学的读者朋友多读一读《计算机操作系统原理》这种涉及到底层的书,对成为一名优秀的程序员很有帮助。毕竟大学期间,学习时间充分,社会压力小,能够做到心无旁骛,加油!


我是沉默王二,一枚有颜值却假装靠才华苟且的程序员。关注即可提升学习效率,别忘了三连啊,点赞、收藏、留言,我不挑,奥利给

注:如果文章有任何问题,欢迎毫不留情地指正。

如果你觉得文章对你有些帮助,欢迎微信搜索「沉默王二」第一时间阅读;本文 GitHub github.com/itwanger 已收录,欢迎 star。

c++数组排序_为什么?为什么?Java处理排序后的数组比没有排序的快?想过没有?相关推荐

  1. 【java】java 分支预测 Java处理排序后的数组比没有排序的快

    1.概述 今天周日,没什么重要的事情要做,于是我早早的就醒来了.看了一会渡边淳一的书,内心逐渐感到平静--心情不佳的时候,书好像是最好的药物.心情平静了,就需要做一些更有意义的事情--逛技术网站,学习 ...

  2. 为什么?为什么?Java处理排序后的数组比没有排序的快?想过没有?

    先看再点赞,给自己一点思考的时间,微信搜索[沉默王二]关注这个有颜值却假装靠才华苟且的程序员. 本文 GitHub github.com/itwanger 已收录,里面还有我精心为你准备的一线大厂面试 ...

  3. js排序数组并返回排序后原数组的索引排序

    背景:最近一朋友面试,二面机试题,题目大意是: 从百度天气的一个api取得天气数据,前端展示天气数据,穿衣指数,点击温度栏进行一个升温降温排序,以及不排序 接口地址:http://api.map.ba ...

  4. java中按字母排序_如何在Java中按字母顺序对字符串进行排序

    使用toCharArray()方法 该类的toCharArray()方法将字符串转换为字符数组并返回它. 按字母顺序对字符串值进行排序获取所需的字符串. 使用toCharArray()方法将给定的字符 ...

  5. 输出素数和排序后的数组和杨辉三角

    输出素数 package 实验包; import java.util.*; public class found_prime_number {  ;  public static void main( ...

  6. 9.11排序与查找(三)——给定一个排序后的数组,包括n个整数,但这个数组已被旋转过多次,找出数组中的某个元素...

    /**  * 功能:给定一个排序后的数组.包括n个整数.但这个数组已被旋转过多次,次数不详.找出数组中的某个元素.  * 能够假定数组元素原先是按从小到大的顺序排列的.  */ /*** 思路:数组被 ...

  7. 给定一个排序后的数组,包含n个整数,但这个数组已被旋转过多次,找出数组中的某个元素...

    2019独角兽企业重金招聘Python工程师标准>>> /** * 功能:给定一个排序后的数组,包含n个整数,但这个数组已被旋转过多次,次数不详.找出数组中的某个元素. * 可以假定 ...

  8. JSK-22 排序后的数组删除重复数字【入门】

    排序后的数组删除重复数字 给定升序排序的数组,如果数组有 2 个或 2 个以上相同的数字,去掉他们,直到剩下 2 个为止. 例如: 数组 A[]=[1,1,1,2,2,3] 你的算法需要返回新数组的长 ...

  9. 【韩老师零基础30天学会Java 09】Math Arrays 数组拷贝 自然排序 System BigDecimal 银行家算法舍入 日期类LocalDateTime转换 String翻转

    Math abs绝对值 pow求幂 ceil向上取整 floor向下取整 round四舍五入 sqrt求开方 random求随机数 思考: 请写出获取a-b之间的一个随机整数,a,b均为整数?2-7 ...

  10. javascript数组之数组排序:数组按照字符顺序排序,反转数组,数字排序,比值函数,随机排序,查找最大最小数组值,自制找数组最高最低值办法,排序对象数组

    1.数组排序 sort() sort() 方法以字母顺序对数组进行排序 var fruits = ["Banana", "Orange", "Appl ...

最新文章

  1. LeetCode刷题记录9——58. Length of Last Word(easy)
  2. 以太网控制芯片DM9000在2440裸机上终于能正确接收数据了(源代码工程已经上传)...
  3. [笔记].关于在Quartus II 11.0无法正常使用SignalTap的解决方法
  4. 机器学习中的有监督学习,无监督学习,半监督学习
  5. 算法提高课-图论-单源最短路的建图方式-AcWing 1127. 香甜的黄油:spfa最短路
  6. (chap3 Http报文内的http信息) HTTP报文格式
  7. pulsar配置文件常用配置项
  8. android api 打开慢,为什么下了android 4.1 的SDK后在本地用浏览器看api说明文档时,浏览器打开api的html文件很慢?试了好几款浏览器都一样。为什么?...
  9. 『C#基础』C#导出Excel
  10. python练手经典100例-【Python精华】100个Python练手小程序
  11. [软件开发] 基于Qt开发的一款免费取色器软件 - TakeColor
  12. 计算机无法访问桌面,桌面无法显示_电脑桌面显示:无法访问,你可能没有权限使用网络......
  13. 程序员夏天格子衫,那么冬天穿什么?答案扎心了哈哈哈哈!
  14. Pycharm放大缩小,快捷键控制
  15. 体素转换为点云(VRN)
  16. WPF入门第六篇 WPF的Binding
  17. 2014年10月23日(账本软件)
  18. 文字转语音:CyberBukit TTS for php 1.2.3
  19. Unity中OnTriggerEnter2D 和OnCollisionEnter2D 的使用情形及容易掉的坑
  20. autojs做小游戏-连连看

热门文章

  1. javascript美术馆
  2. 微软工程师主讲的SqlServer2005视频教程
  3. java_十进制数转换为二进制,八进制,十六进制数的算法
  4. 也谈zabbix性能优化
  5. 让ssh跳转支持ipv6
  6. 用好binutils之gporf
  7. 百度云 api java_java实现百度云文字识别接口代码
  8. 微信小程序电商实战-购物车(上)
  9. hadoop使用mapreduce统计词频_Hadoop自带WordCount进行词频统计(mapreduce)
  10. 对于JavaScript产生闭包的个人理解