>>号外:关注“Java精选”公众号,回复“2021面试题”,领取免费资料!“Java精选面试题”小程序,3000+ 道面试题在线刷,最新、最全 Java 面试题!

Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型:Stream<T> 代表对象引用流,此外还有一系列特化流,如 IntStream,LongStream,DoubleStream等。

Java 8 引入的的Stream主要用于取代部分Collection的操作,每个流代表一个值序列,流提供一系列常用的聚集操作,可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构;

stream 的操作种类

①中间操作

  • 当数据源中的数据上了流水线后,这个过程对数据进行的所有操作都称为“中间操作”;

  • 中间操作仍然会返回一个流对象,因此多个中间操作可以串连起来形成一个流水线;

  • stream 提供了多种类型的中间操作,如 filter、distinct、map、sorted 等等;

②终端操作

  • 当所有的中间操作完成后,若要将数据从流水线上拿下来,则需要执行终端操作;

  • stream 对于终端操作,可以直接提供一个中间操作的结果,或者将结果转换为特定的 collection、array、String 等;

stream 的特点

①只能遍历一次:

数据流的从一头获取数据源,在流水线上依次对元素进行操作,当元素通过流水线,便无法再对其进行操作,可以重新在数据源获取一个新的数据流进行操作;

②采用内部迭代的方式:

对Collection进行处理,一般会使用 Iterator 遍历器的遍历方式,这是一种外部迭代;

而对于处理Stream,只要申明处理方式,处理过程由流对象自行完成,这是一种内部迭代,对于大量数据的迭代处理中,内部迭代比外部迭代要更加高效;

stream 相对于 Collection 的优点

  • 无存储: 流并不存储值;流的元素源自数据源(可能是某个数据结构、生成函数或I/O通道等等),通过一系列计算步骤得到;

  • 函数式风格: 对流的操作会产生一个结果,但流的数据源不会被修改;

  • 惰性求值: 多数流操作(包括过滤、映射、排序以及去重)都可以以惰性方式实现。这使得我们可以用一遍遍历完成整个流水线操作,并可以用短路操作提供更高效的实现;

  • 无需上界: 不少问题都可以被表达为无限流(infinite stream):用户不停地读取流直到满意的结果出现为止(比如说,枚举 完美数 这个操作可以被表达为在所有整数上进行过滤);集合是有限的,但流可以表达为无线流;

  • 代码简练: 对于一些collection的迭代处理操作,使用 stream 编写可以十分简洁,如果使用传统的 collection 迭代操作,代码可能十分啰嗦,可读性也会比较糟糕;

stream 和 iterator 迭代的效率比较

先说结论:

  • 传统 iterator (for-loop) 比 stream(JDK8) 迭代性能要高,尤其在小数据量的情况下;

  • 在多核情景下,对于大数据量的处理,parallel stream 可以有比 iterator 更高的迭代处理效率;

我分别对一个随机数列 List (数量从 10 到 10000000)进行映射、过滤、排序、规约统计、字符串转化场景下,对使用 stream 和 iterator 实现的运行效率进行了统计,测试代码 基准。

测试环境如下:

System:Ubuntu 16.04 xenialCPU:Intel Core i7-8550URAM:16GBJDK version:1.8.0_151JVM:HotSpot(TM) 64-Bit Server VM (build 25.151-b12, mixed mode)JVM Settings:-Xms1024m-Xmx6144m-XX:MaxMetaspaceSize=512m-XX:ReservedCodeCacheSize=1024m-XX:+UseConcMarkSweepGC-XX:SoftRefLRUPolicyMSPerMB=100

1. 映射处理测试

把一个随机数列(List<Integer>)中的每一个元素自增1后,重新组装为一个新的 List<Integer>,测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

//stream
List<Integer> result = list.stream()
.mapToInt(x -> x)
.map(x -> ++x)
.boxed()
.collect(Collectors.toCollection(ArrayList::new));
//iterator
List<Integer> result = new ArrayList<>();
for(Integer e : list){result.add(++e);
}
//parallel stream
List<Integer> result = list.parallelStream()
.mapToInt(x -> x)
.map(x -> ++x)
.boxed()
.collect(Collectors.toCollection(ArrayList::new));

2. 过滤处理测试

取出一个随机数列(List<Integer>)中的大于 200 的元素,并组装为一个新的 List<Integer>,测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

//stream
List<Integer> result = list.stream()
.mapToInt(x -> x)
.filter(x -> x > 200)
.boxed()
.collect(Collectors.toCollection(ArrayList::new));
//iterator
List<Integer> result = new ArrayList<>(list.size());
for(Integer e : list){if(e > 200){result.add(e);}
}
//parallel stream
List<Integer> result = list.parallelStream()
.mapToInt(x -> x)
.filter(x -> x > 200)
.boxed()
.collect(Collectors.toCollection(ArrayList::new));

3. 自然排序测试

对一个随机数列(List<Integer>)进行自然排序,并组装为一个新的 List<Integer>,iterator 使用的是 Collections # sort API(使用归并排序算法实现),测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

//stream
List<Integer> result = list.stream()
.mapToInt(x->x)
.sorted()
.boxed()
.collect(Collectors.toCollection(ArrayList::new));
//iterator
List<Integer> result = new ArrayList<>(list);
Collections.sort(result);
//parallel stream
List<Integer> result = list.parallelStream()
.mapToInt(x->x)
.sorted()
.boxed()
.collect(Collectors.toCollection(ArrayList::new));

4. 归约统计测试

获取一个随机数列(List<Integer>)的最大值,测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

//stream
int max = list.stream()
.mapToInt(x -> x)
.max()
.getAsInt();
//iterator
int max = -1;
for(Integer e : list){if(e > max){max = e;}
}
//parallel stream
int max = list.parallelStream()
.mapToInt(x -> x)
.max()
.getAsInt();

5. 字符串拼接测试

获取一个随机数列(List<Integer>)各个元素使用“,”分隔的字符串,测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

  //stream
String result = list.stream().map(String::valueOf).collect(Collectors.joining(","));
//iterator
StringBuilder builder = new StringBuilder();
for(Integer e : list){builder.append(e).append(",");
}
String result = builder.length() == 0 ? "" : builder.substring(0,builder.length() - 1);
//parallel stream
String result = list.stream().map(String::valueOf).collect(Collectors.joining(","));

6. 混合操作测试

对一个随机数列(List<Integer>)进行去空值,除重,映射,过滤,并组装为一个新的 List<Integer>,测试的随机数列容量从 10 - 10000000,跑10次取平均时间;

//stream
List<Integer> result = list.stream()
.filter(Objects::nonNull)
.mapToInt(x -> x + 1)
.filter(x -> x > 200)
.distinct()
.boxed()
.collect(Collectors.toCollection(ArrayList::new));
//iterator
HashSet<Integer> set  = new HashSet<>(list.size());
for(Integer e : list){if(e != null && e > 200){set.add(e + 1);}
}
List<Integer> result = new ArrayList<>(set);
//parallel stream
List<Integer> result = list.parallelStream()
.filter(Objects::nonNull)
.mapToInt(x -> x + 1)
.filter(x -> x > 200)
.distinct()
.boxed()
.collect(Collectors.toCollection(ArrayList::new));

实验结果总结

从以上的实验来看,可以总结处以下几点:

  • 在少低数据量的处理场景中(size<=1000),stream 的处理效率是不如传统的 iterator 外部迭代器处理速度快的,但是实际上这些处理任务本身运行时间都低于毫秒,这点效率的差距对普通业务几乎没有影响,反而 stream 可以使得代码更加简洁;

  • 在大数据量(szie>10000)时,stream 的处理效率会高于 iterator,特别是使用了并行流,在cpu恰好将线程分配到多个核心的条件下(当然parallel stream 底层使用的是 JVM 的 ForkJoinPool,这东西分配线程本身就很玄学),可以达到一个很高的运行效率,然而实际普通业务一般不会有需要迭代高于10000次的计算;

  • Parallel Stream 受引 CPU 环境影响很大,当没分配到多个cpu核心时,加上引用 forkJoinPool 的开销,运行效率可能还不如普通的 Stream;

使用 Stream 的建议

  • 简单的迭代逻辑,可以直接使用 iterator,对于有多步处理的迭代逻辑,可以使用 stream,损失一点几乎没有的效率,换来代码的高可读性是值得的;

  • 单核 cpu 环境,不推荐使用 parallel stream,在多核 cpu 且有大数据量的条件下,推荐使用 paralle stream;

  • stream 中含有装箱类型,在进行中间操作之前,最好转成对应的数值流,减少由于频繁的拆箱、装箱造成的性能损失;

作者:Al_assad

blog.csdn.net/Al_assad/article/details/82356606

往期精选  点击标题可跳转

Spring 中毒太深,离开 Spring 居然连最基本的接口都不会写了!

Spring Boot 线程池的使用心得,你真会用吗?

从原理到实践彻底搞懂 Java 日志系统,再也不迷茫了!

如何设计 QQ、微信、微博、Github 等第三方账号登陆 ?(附表设计)

【源码解读】JDK1.8 中 ConcurrentHashMap 不支持空键值对源码剖析

为什么要代码重构?如何重构?常见重构技巧,值得收藏!

面试官问:为什么 Java 线程没有 Running 状态?一下被问懵!

SpringBoot + Mybatis + Druid + PageHelper 实现多数据源并分页(附源码)

Intellij IDEA 中的各种调试代码技巧,轻松定位 Bug 问题(涵盖超全面)

MyBatis 真坑!Integer 类型赋值 0 ,当 != '' 时无法通过判断执行 SQL 语句

面试官问:Spring Boot 中实现通用 Auth 认证,有哪几种方式?

点个赞,就知道你“在看”!

你了解 JDK 8 Stream 数据流效率吗?千万级数据量性能如何?相关推荐

  1. JDK 8 Stream 数据流效率怎么样?

    欢迎关注方志朋的博客,回复"666"获面试宝典 Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型:Str ...

  2. 后端技术:JDK 8 Stream 数据流效率测试

    Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型:Stream<T> 代表对象引用流,此外还有一系列特化流,如 ...

  3. 了解JDK8 Stream数据流效率吗?千万级数据量性能如何?

    Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型:Stream<T> 代表对象引用流,此外还有一系列特化流,如 ...

  4. JDK8 Stream 数据流效率分析

    JDK8 Stream 数据流效率分析 Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.util.stream (这个包里有若干流类型: Stream<T> ...

  5. rocketmq教程教程,JDK8 Stream 数据流效率分析

    ①只能遍历一次: 数据流的从一头获取数据源,在流水线上依次对元素进行操作,当元素通过流水线,便无法再对其进行操作,可以重新在数据源获取一个新的数据流进行操作: ②采用内部迭代的方式: 对Collect ...

  6. Java 8 Stream 数据流效率分析

    来源:https://blog.csdn.net/Al_assad/article/details/82356606 Stream 是Java SE 8类库中新增的关键抽象,它被定义于 java.ut ...

  7. JDK8 Stream 数据流效率分析,Java开发你需要了解的那些事

    此外还有一系列特化流,如 IntStream,LongStream,DoubleStream等 ),Java 8 引入的的Stream主要用于取代部分Collection的操作,每个流代表一个值序列, ...

  8. 13万字详细分析JDK中Stream的实现原理

    前提 Stream是JDK1.8中首次引入的,距今已经过去了接近8年时间(JDK1.8正式版是2013年底发布的).Stream的引入一方面极大地简化了某些开发场景,另一方面也可能降低了编码的可读性( ...

  9. Java8 Stream 数据流,大数据量下的性能效率怎么样?

    今日推荐程序猿惯用口头禅,你被击中了吗? 常见代码重构技巧(非常实用) B站,牛啊. 程序员缺乏经验的 7 种表现 2021年4月程序员工资统计:平均14596元,南京程序员收入挤进一线. 来源:bl ...

  10. jdk 8 Stream介绍

    函数式编程-Stream流 概述 //查询未成年作家的评分在70以上的书籍 作家和书籍可能出现重复,需要进行去重 List bookList = new ArrayList<>(); Se ...

最新文章

  1. jQuery - 当当网我的订单页
  2. double java 坑,Java中四则运算的那些坑
  3. Portainer 安装与使用
  4. 【无线通信】基于matlab无线传感网络WSN仿真【含Matlab源码 1237期】
  5. 就我不坑2 nyoj(简单模拟)
  6. PHP响应式营销型万能H5建站系统源码
  7. 哒哒租车系统(慕课网学习)
  8. vue.js之minix
  9. 外接显示器屏幕亮度调到最低还是太亮
  10. 前端利器CodePen和JSRUN了解一下
  11. KNIME 学习、下载
  12. 视频变速怎么做?手把手教会你
  13. SVN教程 服务端/客户端
  14. 怎样推广棋牌游戏 省钱又有效
  15. Android Paint 绘制空心渐变圆角矩形
  16. 易基因|一种全新的检测DNA羟甲基化的技术:ACE-Seq
  17. linux使用jq时提示error: split is not defined
  18. 数据治理周周谈(三):数据质量管理
  19. ossec日志文件的安装
  20. 【Java|golang】2437. 有效时间的数目

热门文章

  1. 点餐APP 冲刺一总结
  2. a轮b轮c轮天使轮区别是什么?
  3. MATLAB 中的randn函数
  4. Requirement already satisfied问题
  5. Linux增加root目录容量,Linux(manjaro)增加根目录磁盘空间
  6. 一篇文章让你看懂信息安全领域的巨鳄(小白必看)
  7. 百度搜索引擎排名规则有哪些呢?
  8. inet addr(网络地址)、bcast(广播地址)、mask(子网掩码)
  9. Linux系统清空回收站
  10. go 合并excel