Stream

什么是Stream？

Java8最值得学习的特性就是Lambda表达式和Stream API，如果有python或者javascript的语言基础，对理解Lambda表达式有很大帮助，因为Java正在将自己变的更高（Sha）级（Gua），更人性化。--------可以这么说lambda表达式其实就是实现SAM接口的语法糖。

Java8中，Collection新增了两个流方法。分别是Stream()和parallelStream()

Java8中添加了一个新的接口类Stream，相当于高级的Iteratpr。它可以通过Lambda表达式对集合进行大批量数据操作。或者各种非常便利，高效的聚合数据操作。

为什么要使用Stream？

总结一下本人最常用的场景。在工作中我们经常需要操作数据库。往往会出现一个方法中就需要对一个表的数据进行多次访问。例如我一个方法要做三次数据库操作。一次要计算总条数（count），一次要查询数据（select *），一次要对某些数据查询并进行累加（sum）等等。

三次都操作数据库不是不可以。但是过于频繁的访问数据库，无疑会增加网络传输的消耗，也会增加MySQL服务器的压力。那么，我们的目就转移到了，如何在减少与数据库访问的情况下完成这些业务逻辑。

此时，我们可以用将要查询的数据全部从数据库中获取到一个集合中，在这个集合中，根据不同的条件，过滤出我们想要的数据。如何高效的用代码在集合中过滤出我们想要的数据呢？

Java8之前，我们通常是通过for循环或者Iterator迭代来重排序合并数据，又或者通过重新定义Collections.sorts的Comparator方法来实现。这两种方式对于大数据量系统来说，效率并不是很理想。

Stream的聚合操作与数据库SQL的聚合操作sorted，filter，map等类似。我们在应用层就可以高效地实现类似数据库SQL的聚合操作了。而在数据操作方面，Stream不仅可以通过串行的方式实现数据操作，还可以通过并行的方式处理大批量数据，提高数据的处理效率。

Stream简单例子之筛选查询

如果我们需要从一个list中根据某个条件筛选查询，不使用Stream的方式如下：

需要6行代码完成。

使用Stream改进后：

Stream操作API

官方将Stream中的操作分为两大类：终结操作和中间操作。

中间操作会返回一个新的流，一个流可以后面跟随零个或多个中间操作。其目的主要是打开流，做出某种程度的数据映射/过滤，然后返回一个新的流，交给下一个流操作使用。这类操作都是惰性化的（lazy），也就是说，仅仅调用到这个类，还没有开始流的遍历（其实就是给接下来的终结操作先加入条件）。而真正的流遍历是在终结操作开始的时候才真正开始执行。

中间操作又可以分为无状态（Stateless）与有状态（Stateful）操作。无状态是指元素的处理不受之前元素的影响。有状态是指该操作需要在之前的操作的基础上继续执行。

终结操作是指返回最终的结果。一个流只能有一个终结操作。当这个操作执行后，这个流就被用”光”了，无法再被操作。所以这必定是这个流的最后一个操作。终结操作才会开始进行流的遍历，并且生成结果。

终结操作又可以分为短路与非短路。

短路是指遇到某些符合条件的元素就可以得到最终结果。

非短路是指必须处理完所有元素才能得到最终结果。操作分类详情如下：

因为Stream操作类型非常多，总结一下常用的：

1. mapToXXX():将流中的原本类型的元素挨个加工变为XXX类型元素，常搭配sum()使用。

2. filter():对流中的元素进行遍历筛选，流下符合条件的数据组成新的流。

3. limit():返回指定数量的流元素。返回的是Stream里前n个元素。

4. skip():将指定数量的元素从流程排除，剩下的元素组成新的流并返回。

5. sorted():将流中的元素按自然排序进行排序。

6. distinct():将流中的元素去重后输出。

7. map():将流中的元素进行再次加工形成一个新的流（常用的有整个流留的小写转大写,以及List<Object>转其中某个元素List<Integer>）

8. peek():与map类似，但与map的区别是它相当于在操作的时候生成一个新的流，并且该操作不会影响到原本流的执行结果。因此基本用于debug。

9. collect():就整个流进行集合转换（转为list,set,map等）

Stream的底层实现

Stream操作叠加

一个Stream的各个操作是由处理管道组装。并统一完成数据处理的。

我们知道Stream有中间操作和终结操作，那么对于一个写好的Stream处理代码来说，中间操作是通过AbstractPipeline生成了一个中间操作Sink链表。当我们调用终结操作时，会生成一个最终的ReducingSink。通过这个ReducingSink触发之前的中间操作，从最后一个ReducingSink开始，递归产生一个Sink链。因此说Stream是惰性化的。如下图所示：