java8流分组 性能

在此JAX Magazine的预览预览中,JAX伦敦发言人Angelika Langer为使用Java流的任何人回答了最重要的问题:它们真的更快吗?

Java 8是JDK收集框架的主要补充,即流​​API。 与集合相似,流表示元素序列。 集合支持对单个元素起作用的操作,例如add()remove()contains() 。 相反,流具有批量操作,例如forEach()filter()map()reduce() ,它们访问序列中的所有元素。 Java流的概念受到功能性编程语言的启发,其中相应的抽象通常称为序列,该序列也具有filter-map-reduce操作。 由于这种相似性,Java 8(至少在某种程度上)除了一直支持的面向对象范例之外,还允许一种功能性的编程风格。

也许与普遍的看法相反,Java编程语言的设计人员没有扩展Java及其JDK来允许Java中的功能编程,也没有将Java变成“目标与功能”混合编程语言。 发明Java流的实际动机是性能,或者更准确地说,是使并行性更易于软件开发人员访问(请参见Lambda州的Brian Goetz )。 考虑到硬件的发展方式,这个目标对我来说很有意义。 我们的硬件今天有数十个cpu内核,将来可能还会有数百个。 为了有效利用硬件功能,从而达到最新的执行性能,我们必须并行化。 毕竟–在多核平台上运行单个线程有什么意义? 同时,多线程编程被认为是困难且容易出错的,这是正确的。 流有两种形式(顺序流和并行流),旨在隐藏运行多个线程的复杂性。 并行流使魔术,毫不费力地以每个Java开发人员都可以访问的方式并行执行批量操作变得极为容易。

并行流操作是否比顺序操作快? 听到Angelika Langer在2015年JAX伦敦上的演讲。

因此,让我们谈谈性能。 Java 8流有多快? 一个普遍的期望是流操作的并行执行比仅单个线程的顺序执行要快。 是真的吗 流会提高性能吗?

为了回答有关性能的问题,我们必须进行衡量,即运行一个微基准测试。 标杆管理也很困难且容易出错。 您需要执行适当的预热,注意各种失真的影响,从虚拟机的JIT编译器应用的优化(消除死代码是臭名昭著的)到硬件优化(例如增加一个内核的cpu频率),其他核心处于闲置状态)。 通常,必须以一粒盐作为基准结果。 每个基准都是实验。 其结果取决于上下文。 永远不要相信在您的硬件环境中尚未产生的基准数据。 这样说,让我们尝试一下。

将流与循环进行比较

首先,我们想了解流的批量操作与常规的传统for-比较。 首先出于性能考虑是否值得使用流?

我们将用于基准测试的序列是一个int-数组,其中填充了500,000个随机整数值。 在此数组中,我们将搜索最大值。

这是带有for-循环的传统解决方案:

int[] a = ints;
int e = ints.length;
int m = Integer.MIN_VALUE;
for(int i=0; i < e; i++)   if(a[i] > m) m = a[i];

这是使用顺序IntStream的解决方案:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

我们在具有适当预热功能的过时硬件(双核,无动态超频)上进行了测量,并得出了中途可靠的基准数据。 这是在特定情况下的结果:

int-array, for-loop : 0.36 ms
int-array, seq. stream: 5.35 ms

结果令人震惊:旧的for-循环比顺序流快15倍。 真令人失望! 多年的开发工作花费在为Java 8构建流上,然后进行此?!?!? 可是等等! 在得出流非常慢的结论之前,让我们看看如果用ArrayList <Integer>替换int- array会发生什么。

这是for-循环:

int m = Integer.MIN_VALUE;
for (int i : myList)if (i>m) m=i;

这是基于流的解决方案:

int m = myList.stream().reduce(Integer.MIN_VALUE, Math::max);

结果如下:

ArrayList, for-loop : 6.55 ms
ArrayList, seq. stream: 8.33 ms

同样, for-循环比顺序流操作要快,但是ArrayList上的差异不如在阵列上那么重要。

让我们考虑一下。 为什么结果相差这么大? 有几个方面需要考虑。

首先,访问数组元素非常快。 这是基于索引的内存访问,没有任何开销。 换句话说,这是简单的底层存储访问。 另一方面,通过迭代器访问集合中的元素(例如ArrayList),并且迭代器不可避免地增加了开销。 另外,对集合元素进行装箱和拆箱会产生开销,而int数组则使用普通原始类型int。 本质上,对于该ArrayList测量通过迭代和拳击开销而对于INT-阵列附图示出的优点是支配for-环路。

其次,我们是否曾认真地期望过流会比普通的for-loop更快? 编译器在优化循环方面拥有40多年的经验,虚拟机的JIT编译器尤其适合以与我们的基准测试相同的步伐来优化阵列上的for-循环。 另一方面,流是Java的最新扩展,并且JIT编译器(尚未)尚未对其执行任何特别复杂的优化。

第三,我们必须记住,一旦掌握了序列元素,我们就不会做太多事情。 我们花了很多精力来尝试访问元素,然后对它做得很少。 我们只比较两个整数,在JIT编译之后,它们几乎不止一个汇编指令。 因此,我们的基准测试说明了元素访问的成本–不一定是典型情况。 如果应用于序列中每个元素的功能是CPU密集型的,则性能指标将发生重大变化。 您会发现,如果功能受CPU的限制很大,则for循环流和顺序流之间将不再有可测量的差异。

加入我们的伦敦JAX – Java和软件创新者大会。 使用以下代码可享受10%的折扣:MP_JCG10

从这个基准实验得出的最终结论不是流总是比循环慢。 是的,流有时比循环慢,但它们也可以同样快。 这取决于情况。 带回家的要点是顺序流不会比循环快。 如果使用顺序流,则出于性能原因,请不要这样做; 之所以这样做,是因为您喜欢函数式编程风格。

那么,性能改进流是在哪里发明的呢? 到目前为止,我们仅将循环与流进行了比较。 并行化如何? 流的点是易于并行化,以实现更好的性能。

比较顺序流与并行流

作为第二个实验,我们想弄清楚顺序流与并行流在性能方面的比较。 并行流操作是否比顺序操作快?

我们使用填充500,000个整数值的同一int-数组。 这是顺序流操作:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

这是并行流操作:

int m = Arrays.stream(ints).parallel().reduce(Integer.MIN_VALUE, Math::max);

我们的期望是并行执行应该比顺序执行更快。 由于测量是在双核平台上进行的,因此并行执行最多可以是顺序执行的两倍。 理想情况下,顺序/并行性能之比应为2.0。自然地,并行执行确实会引入一些开销,用于拆分问题,创建子任务,在多个线程中运行子任务,收集其部分结果以及产生总体结果。 该比率将小于2.0,但应该接近。

这些是实际的基准测试结果:

sequential parallel seq./par.
int-array 5.35 ms    3.35 ms  1.60

通过我们的基准进行的现实检查得出的比率(顺序/并行)仅为1.6而不是2.0,这说明了并行执行涉及的开销量以及(在此特定平台上)如何(好坏)得到超额补偿。

您可能会倾向于概括这些数字并得出结论,并行流始终比顺序流快,也许不如人们希望的那样快(在双核硬件上),但是至少更快。 但是,事实并非如此。 同样,有许多方面有助于并行流操作的性能。

其中之一是流源的可拆分性。 数组可以很好地拆分; 它只需要一个索引计算就可以找出中间元素并将数组分成两半。 没有开销,因此几乎没有拆分成本。 与数组相比,集合拆分的难易程度如何? 拆分二叉树或链表需要什么? 在某些情况下,对于不同类型的集合,您将观察到截然不同的性能结果。

另一个方面是有状态性。 一些流操作保持状态。 一个示例是distinct()操作。 这是一个中间操作,可消除输入序列中的重复项,即,它返回具有不同元素的输出序列。 为了确定下一个元素是否重复,该操作必须与它已经遇到的所有元素进行比较。 为此,它维护某种数据结构作为其状态。 如果在并行流上调用distinct() ,则其状态将被多个工作线程并发访问,这需要某种形式的协调或同步,这会增加开销,从而减慢并行执行的速度,最大程度地降低了并行执行的程度。比顺序执行慢。

考虑到这一点,可以公平地说,流的性能模型并非微不足道。 幼稚地期望并行流操作总是比顺序流操作快。 性能提升(如果有的话)取决于许多因素,我在上面简要提到了其中的一些因素。 如果您熟悉流的内部工作原理,则可以对并行流操作的性能做出明智的猜测。 但是,您需要进行大量基准测试,以便针对给定的上下文确定并行进行是否值得。 实际上,在某些情况下,并行执行要比顺序执行慢,并且在所有情况下盲目使用并行流可能会适得其反。

实现是:是的,并行流操作易于使用,并且通常比顺序操作运行得更快,但是不要指望奇迹。 另外,不要猜测; 相反,要进行很多基准测试。

这是《 JAX杂志》的先睹为快–在此处注册以获取更多免费的开发人员提示,趋势和教程。

翻译自: https://www.javacodegeeks.com/2015/07/java-performance-tutorial-how-fast-are-the-java-8-streams.html

java8流分组 性能

java8流分组 性能_Java性能教程– Java 8流有多快?相关推荐

  1. Java性能教程– Java 8流有多快?

    在此JAX Magazine的预览预览中,JAX伦敦发言人Angelika Langer为使用Java流的任何人回答了最重要的问题:它们真的更快吗? Java 8是JDK收集框架的主要新增功能,即流A ...

  2. java io流 教程_Java基础教程:IO流与文件基础

    Java:IO流与文件基础 说明: 本章内容将会持续更新,大家可以关注一下并给我提供建议,谢谢啦. 走进流 什么是流 流:指的是从源到目的地的字节的有序序列. 在Java中,可以从其中读取一个字节序列 ...

  3. java8 foreach 异常_错误处理 – 在java 8流foreach中抛出异常

    我正在使用 java 8流,我不能在流的foreach中抛出异常. stream.forEach(m -> { try { if (isInitial) { isInitial = false; ...

  4. Java读取文件流用什么对象_使用Java IO流实现对文本文件的读写过程中,通常需要处理下列( )异常。_学小易找答案...

    [论述题]请根据第一次平时作业的选题,结合第二次课内容,自拟一个论文提纲. [单选题]在 switch ( expression )语句中, expression 的数据类型不能是 ( ) [单选题] ...

  5. java视频教程千峰_java基础教程-Java开发入门视频教程-千锋教育视频资源库

    第1节 - Java由来及语言特点 点击播放 第2节 - Java的执行机制及第一个应用程序 点击播放 第3节 - 类的阐述及Package相关 点击播放 第4节 - Java的编码规范 点击播放 第 ...

  6. java final 变量 回收_java入门教程-Java中final,finally,finalize三个关键字的区别

    final 当这个关键字修饰一个类时,意味着他不能派生出新的子类,也就是说不能被继承,因此一个类不能被同时声明为abstract和final.当final修饰变量或者方法时,可以保证他们在使用中不会被 ...

  7. java回车后自动从一个文本框切换到另一个_Java实用教程-Java基本语法-Java程序的构成...

    Java源程序逻辑构成分为两大部分:程序头包的引用和类的定义. 1.程序头包的引用 主要是指引用JDK软件包自带的包,也可以是自己定义的类.引用之后程序体中就可以自由应用包中的类的方法和属性等. 2. ...

  8. Java IO流学习总结七:Commons IO 2.5-FileUtils

    Java IO流学习总结七:Commons IO 2.5-FileUtils 转载请标明出处:http://blog.csdn.net/zhaoyanjun6/article/details/5497 ...

  9. Java IO流学习总结六:ByteArrayInputStream、ByteArrayOutputStream

    Java IO流学习总结六:ByteArrayInputStream.ByteArrayOutputStream 转载请标明出处:http://blog.csdn.net/zhaoyanjun6/ar ...

最新文章

  1. postfix邮箱服务
  2. 过来人的肺腑之言,攻读CV和ML硕士给我带来了什么?
  3. 浅谈三维点云中的几何语义
  4. 鹅厂机器狗,站起来了!
  5. O_RDWR, O_CREAT等open函数标志位在哪里定义?
  6. nginx+php+mysql+haproxy+keepalived+NFS,搭建wordpress
  7. 【编辑器】CSDN-markdown
  8. Linux操作系统 和 Windows操作系统 的区别
  9. java getselectedrow_Java JTable.getSelectedRow方法代碼示例
  10. python提取html表格_python html提取表格数据库数据库
  11. 气体传感器的市场状况及主要厂商
  12. 我的编程之路:「懒惰」是程序员最大的美德
  13. Cordova各种事件
  14. 996程序员入职一年多,同事涨了4千他没涨,跟领导提涨薪,回复愣了
  15. Docker下载镜像及运行容器
  16. 轨道交通建设水准数据的处理流程及说明
  17. 引入tiptap之后直接报错Duplicate use of selection JSON ID cell
  18. 好用app开屏广告组件XHLaunchAd -支持静态/动态图片广告/mp4视频广告
  19. openMVS:极线校正Fusiello
  20. django-Vue搭建博客:前言

热门文章

  1. P3311-[SDOI2014]数数【AC自动机,dp】
  2. P2408- 不同子串个数【SA】
  3. 学习手记(2018.9.15~2018.11.10)——备战NOIP2018
  4. 图论复习——dfs树,点双,边双,强连通分量
  5. codeforces D.MADMAX 动态规划、记忆化搜索
  6. 全文搜索!收藏这篇Solr ElasticSearch 长文就可以搞定
  7. 你必须掌握的 21 个 Java 核心技术
  8. 你还在Java8中使用循环语句吗?
  9. Oracle入门(五F)之11g show spparameter 命令的使用
  10. Mybatis入门程序增删改查操作