在此JAX Magazine的预览预览中,JAX伦敦发言人Angelika Langer为使用Java流的任何人回答了最重要的问题:它们真的更快吗?

Java 8是JDK收集框架的主要新增功能,即流API。 与集合相似,流表示元素序列。 集合支持对单个元素起作用的操作,例如add()remove()contains() 。 相反,流具有批量操作,例如forEach()filter()map()reduce() ,它们访问序列中的所有元素。 Java流的概念受功能编程语言的启发,其中相应的抽象通常称为序列,该序列也具有filter-map-reduce操作。 由于这种相似性,Java 8(至少在某种程度上)除了其一直支持的面向对象范例之外,还允许一种函数式编程样式。

也许与普遍的看法相反,Java编程语言的设计人员没有扩展Java及其JDK来允许Java中的功能编程,也没有将Java变成“目标与功能”混合编程语言。 发明Java流的真正动机是性能,或者更确切地说,是使并行性更易于软件开发人员访问(请参见Lambda州的Brian Goetz )。 考虑到硬件的发展方式,这个目标对我来说很有意义。 我们的硬件今天有数十个cpu内核,将来可能还会有数百个。 为了有效利用硬件功能,从而达到最新的执行性能,我们必须并行化。 毕竟–在多核平台上运行单个线程有什么意义? 同时,多线程编程被认为是困难且容易出错的,这是正确的。 流有两种形式(顺序流和并行流),旨在隐藏运行多个线程的复杂性。 并行流使魔术般,轻松地并且以每个Java开发人员都可以访问的方式并行执行批量操作变得极为容易。

并行流操作是否比顺序操作快? 听到Angelika Langer在2015年JAX伦敦上的演讲。

因此,我们来谈谈性能。 Java 8流有多快? 一个普遍的期望是流操作的并行执行比仅单个线程的顺序执行要快。 是真的吗 流会提高性能吗?

为了回答有关性能的问题,我们必须进行衡量,即运行一个微基准测试。 标杆管理也很困难且容易出错。 您需要执行适当的预热,注意各种失真的影响,从虚拟机的JIT编译器应用的优化(消除臭名昭著的死代码)到硬件优化(例如,如果增加一个内核的cpu频率,则应注意)其他核心处于闲置状态)。 通常,必须以一粒盐作为基准结果。 每个基准都是实验。 其结果取决于上下文。 永远不要相信在硬件环境中尚未产生的基准数据。 这样说,让我们尝试一下。

将流与循环进行比较

首先,我们想了解流的批量操作与常规的传统for-比较。 首先出于性能考虑是否值得使用流?

我们将用于基准测试的序列是一个int-数组,其中填充了500,000个随机整数值。 在此数组中,我们将搜索最大值。

这是带有for-循环的传统解决方案:

int[] a = ints;
int e = ints.length;
int m = Integer.MIN_VALUE;
for(int i=0; i < e; i++)   if(a[i] > m) m = a[i];

这是使用顺序IntStream的解决方案:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

我们在具有适当预热功能的过时硬件(双核,无动态超频)上进行了测量,并得出了中途可靠的基准数据。 这是在特定情况下的结果:

int-array, for-loop : 0.36 ms
int-array, seq. stream: 5.35 ms

结果令人震惊:旧的for-循环比顺序流快15倍。 真令人失望! 多年的开发工作花费在为Java 8构建流上,然后进行此?!?!? 可是等等! 在得出流非常慢的结论之前,让我们看看如果用ArrayList <Integer>替换int- array会发生什么。

这是for-循环:

int m = Integer.MIN_VALUE;
for (int i : myList)if (i>m) m=i;

这是基于流的解决方案:

int m = myList.stream().reduce(Integer.MIN_VALUE, Math::max);

结果如下:

ArrayList, for-loop : 6.55 ms
ArrayList, seq. stream: 8.33 ms

同样, for-循环比顺序流操作要快,但是ArrayList上的差异不如在阵列上那么重要。

让我们考虑一下。 为什么结果相差这么大? 有几个方面需要考虑。

首先,访问数组元素非常快。 这是基于索引的内存访问,没有任何开销。 换句话说,这是简单的底层存储访问。 另一方面,通过迭代器访问集合中的元素(例如ArrayList),并且迭代器不可避免地增加了开销。 另外,对集合元素进行装箱和拆箱会产生开销,而int数组则使用普通原始类型int。 本质上,对于该ArrayList测量通过迭代和拳击开销而对于INT-阵列附图示出的优点是支配for-环路。

其次,我们是否曾认真地期望过流会比普通的for-loop更快? 编译器在优化循环方面拥有40多年的经验,虚拟机的JIT编译器尤其易于以与我们的基准测试相同的步伐来优化阵列上的for-循环。 另一方面,流是Java的最新添加,并且JIT编译器(尚未)尚未对其执行任何特别复杂的优化。

第三,我们必须记住,一旦掌握了序列元素,我们就不会做太多事情。 我们花了很多精力来尝试访问元素,然后对它进行的工作并不多。 我们只比较两个整数,在JIT编译后,它们几乎不止一个汇编指令。 因此,我们的基准测试说明了元素访问的成本–不一定是典型情况。 如果应用于序列中每个元素的功能是CPU密集型的,则性能指标将发生重大变化。 您会发现,如果功能受CPU的限制很大,则for循环流和顺序流之间将不再有可测量的差异。

加入我们的JAX伦敦-Java和软件创新者大会。 使用以下代码可享受10%的折扣:MP_JCG10

从该基准实验得出的最终结论并非并非流总是比循环慢。 是的,流有时比循环慢,但它们也可以同样快。 这要视情况而定。 带回家的要点是顺序流不会比循环快。 如果使用顺序流,则出于性能原因,请不要这样做; 之所以这样做,是因为您喜欢函数式编程风格。

那么,性能改进流是在哪里发明的呢? 到目前为止,我们仅将循环与流进行了比较。 并行化如何? 流的点是易于并行化,以实现更好的性能。

比较顺序流与并行流

作为第二个实验,我们想弄清楚顺序流与并行流在性能方面的比较。 并行流操作是否比顺序操作快?

我们使用填充500,000个整数值的同一int-数组。 这是顺序流操作:

int m = Arrays.stream(ints).reduce(Integer.MIN_VALUE, Math::max);

这是并行流操作:

int m = Arrays.stream(ints).parallel().reduce(Integer.MIN_VALUE, Math::max);

我们的期望是并行执行应该比顺序执行更快。 由于测量是在双核平台上进行的,因此并行执行最多可以是顺序执行的两倍。 理想情况下,顺序/并行性能之比应为2.0。自然地,并行执行确实会引入一些开销,用于拆分问题,创建子任务,在多个线程中运行子任务,收集其部分结果以及产生总体结果。 该比率将小于2.0,但应该接近。

这些是实际的基准测试结果:

sequential parallel seq./par.
int-array 5.35 ms    3.35 ms  1.60

通过我们的基准进行的现实检查得出的比率(顺序/并行)仅为1.6而不是2.0,这说明了并行执行涉及的开销量以及(在此特定平台上)如何(好坏)得到超额补偿。

您可能会倾向于概括这些数字并得出结论,并行流始终比顺序流快,也许不如人们希望的那样快(在双核硬件上),但是至少更快。 但是,事实并非如此。 同样,有许多方面有助于并行流操作的性能。

其中之一是流源的可拆分性。 数组可以很好地拆分; 只需进行索引计算就可以找出中间元素并将数组拆分为两半。 没有开销,因此几乎没有拆分成本。 与数组相比,集合拆分的难易程度如何? 拆分二叉树或链表需要什么? 在某些情况下,对于不同类型的集合,您将观察到截然不同的性能结果。

另一个方面是有状态性。 一些流操作保持状态。 一个示例是distinct()操作。 这是一个中间操作,可消除输入序列中的重复项,即它返回具有不同元素的输出序列。 为了确定下一个元素是否重复,操作必须与它已经遇到的所有元素进行比较。 为此,它维护某种数据结构作为其状态。 如果在并行流上调用distinct() ,则其状态将被多个工作线程并发访问,这需要某种形式的协调或同步,这会增加开销,从而减慢并行执行的速度,最大程度地降低了并行执行的程度。比顺序执行慢。

考虑到这一点,可以公平地说,流的性能模型并非微不足道。 幼稚地期望并行流操作总是比顺序流操作快。 性能提升(如果有的话)取决于许多因素,我在上文中简要提到了其中的一些因素。 如果您熟悉流的内部工作原理,则可以对并行流操作的性能做出明智的猜测。 但是,您需要进行大量基准测试,以便针对给定的上下文确定并行进行是否值得。 实际上,在某些情况下,并行执行要比顺序执行慢,并且在所有情况下盲目使用并行流可能会适得其反。

实现是:是的,并行流操作易于使用,并且通常比顺序操作运行得更快,但是不要指望奇迹。 另外,不要猜测; 相反,要进行很多基准测试。

这是《 JAX杂志》的先睹为快–在此处注册以获取更多免费的开发人员提示,趋势和教程。

翻译自: https://www.javacodegeeks.com/2015/07/java-performance-tutorial-how-fast-are-the-java-8-streams.html

Java性能教程– Java 8流有多快?相关推荐

  1. java awt 教程,Java AWT教程

    Java AWT教程 Java AWT(抽象窗口工具包)是一种API,用于使用Java开发GUI或基于窗口的应用程序. Java AWT组件是平台相关的,即,组件是根据操作系统视图显示的. AWT是重 ...

  2. java8流分组 性能_Java性能教程– Java 8流有多快?

    java8流分组 性能 在此JAX Magazine的预览预览中,JAX伦敦发言人Angelika Langer为使用Java流的任何人回答了最重要的问题:它们真的更快吗? Java 8是JDK收集框 ...

  3. Java官方教程Java Tutorial

    概述 The Java Tutorials have been written for JDK 8. Examples and practices described in this page don ...

  4. java原理教程,java基础之运行原理(一),java基础运行原理

    java基础之运行原理(一),java基础运行原理 java的核心配置:JDK JDK主要包括三个部分 1.Jre:java的运行环境 2.Java的工具:java的编译器(java.c.exe). ...

  5. IT兄弟连 Java语法教程 Java平台的版本划分

    自从Sun公司推出Java以来,就力图使之无所不能.Java发展至今,按应用范围划分为3个版本,即Java SE.Java EE和Java ME,也就是SunOne(Open Net Environm ...

  6. java awt 教程,Java AWT教程介绍

    本文概述 Java AWT(抽象窗口工具包)是一种API, 用于使用Java开发GUI或基于窗口的应用程序. Java AWT组件是依赖于平台的, 即, 根据操作系统的视图显示组件. AWT是重量级的 ...

  7. Java基础教程:IO流与文件基础

    Java:IO流与文件基础 说明: 本章内容将会持续更新,大家可以关注一下并给我提供建议,谢谢啦. 走进流 什么是流 流:从源到目的地的字节的有序序列. 在Java中,可以从其中读取一个字节序列的对象 ...

  8. 诺基亚手机java性能排行,JAVA性能测试_诺基亚 5320XM_手机其它OS-中关村在线

    性能测试: 我们将诺基亚XpressMusic机型中上一款S60--5700和5320的性能进行一个比较,并选择了额外的参照物,也就是三款S60 v3.2机型N78.6220 classic和6210 ...

  9. Java语法教程-Java开发环境安装JDK

    因为我们要开发Java程序,所以必须在我们的计算机中安装Sun(Oracle)公司提供给我们的JDK.目前最新版本的JDK是JDK10,但是我们以学习JDK8为主,所以我们要安装的版本是JDK8.安装 ...

最新文章

  1. php csv,php csv操作类代码
  2. Visual Studio2019 应用程序无法正常启动0xc000007b
  3. TCP/IP协议的深入分析
  4. 如何实现从wgs-84到beijing54的坐标转换
  5. 转:微服务架构:BFF和网关是如何演化出来的?(这篇文章相当棒)
  6. macOS安装Telnet
  7. 【李宏毅2020 ML/DL】P59 Unsupervised Learning - Auto-encoder
  8. 总结(6)--- python基础知识点小结(细全)
  9. Atitit.隔行换色  变色 css3 结构性伪类选择器
  10. (一)Redfish简介
  11. 淘宝数据魔方技术架构解析
  12. 视频教程-达芬奇DAVINCI 14 影视调色大师全套零基础学习到调色综合案例实战视频教程-其他
  13. (转贴)汉字转拼音缩写
  14. 计算机考研四大名著,2018考研英语翻译每日一句:四大名著
  15. ISO 18184纺织品抗病毒活性的测定
  16. Filament旋转3D文件
  17. Golang 开发之Cobra初探
  18. 如何提升会议体验感和氛围感?
  19. django3.2连接虚拟机里的openGauss
  20. 【zotero】从知网万方维普WOS等数据库上导出格式引文-引文格式到zotero中

热门文章

  1. 使用layui弹框实现添加时,当添加成功之后如何进行关闭当前窗口刷新父页面的数据
  2. java中input表单中的type=date返回类型【切记】
  3. 二分查找非递归方式实现
  4. mybatis的$和#详解分析
  5. redis-java客户端jedis测试
  6. java记录类型_Java中的记录类型
  7. vaadin 10+_Vaadin 10+作为CUBA UI的未来
  8. 不停机与停机更新_Istio的零停机滚动更新
  9. java技术专家学习路线图_向Java最佳专家的全球专家学习Java
  10. 弱投影模型_通过投影增强数据模型