转载自 使用Java 8 Stream像操作SQL一样处理数据(上)

几乎每个Java应用都要创建和处理集合。集合对于很多编程任务来说是一个很基本的需求。举个例子,在银行交易系统中你需要创建一个集合来存储用户的交易请求,然后你需要遍历整个集合才能找到这个客户这段时间总共花费了多少金额。尽管集合非常重要,但是在java中对集合的操作并不完美。

首先,对一个集合处理的模式应该像执行SQL语言操作一样可以进行比如查询(一行交易中最大的一笔)、分组(用于消费日常用品总金额)这样的操作。大多数据库也是可以有明确的相关操作指令,比如"SELECT id, MAX(value) from transactions"SQL查询语句可以让你找到所有交易中最大的一笔交易和其ID。

正如你所看到的,我们不需要去实现怎样计算最大值(比如循环和变量跟踪得到最大值)。我们只需要表达我们期待什么。那么为什么我们不能实现与数据库查询方式相似的方式来设计实现集合呢?

其次,我们应该怎么有效处理很大数据量的集合呢?要加速处理的理想方式是采用多核架构CPU,但是编写并行代码很难而且会出错。

Java 8 将能够完美解决这这个问题!Stream的设计可以让你通过陈述式的方式来处理数据。stream还能让你不写多线程代码也是可以使用多核架构。听起来很棒不是吗?这将是这系列文章将要探索的主要内容。

在我们探索我们怎么样使用stream之前,我们先看一个使用Java 8 Stream的新的编程模式。我们需要找出所有银行交易中类型是grocery的,并且以交易金额的降序的方式返回交易ID。在Java 7中我们需要这样实现:

在Java 8中这样就可以实现:

下图展示了Java 8的实现代码,首先,我们使用stream()函数从一个交易明细列表中获取一个stream对象。接下来是一些操作(filter,sorted,map,collect)连接在一起形成了一个管道,管道可以被看做是类似数据库查询数据的一种方式。

Stream 模型

那么怎么处理并行代码呢?在Java8中非常简单:只需要使用parallelStream()取代stream()就可以了,如下面所示,Stream API将在内部将你的查询条件分解应用到多核上。

你可以把stream看做是一种对集合数据提高效能、提供像SQL操作一样的抽象概念,这个像SQL一样的操作可以使用lambda表达式表示。

在这一系列关于Java 8 Stream文章的结尾,你将会使用Stream API写类似于上述代码来实现强大的查询功能。

开始使用Stream

我们先以一些理论作为开始。stream的定义是什么?一个简单的定义是:"对一个源中的一系列元素进行聚合操作。"把概念拆分一下:

一系列元素:Stream对一组有特定类型的元素提供了一个接口。但是Stream并不真正存储元素,元素根据需求被计算出结果。

源:Stream可以处理任何一种数据提供源,比如结合、数组,或者I/O资源。

聚合操作:Stream支持类似SQL一样的操作,常规的操作都是函数式编程语言,比如filter,map,reduce,find,match,sorted,等等。

Stream操作还具备两个基本特性使它与集合操作不同:

管道:许多Stream操作会返回一个stream对象本身。这就允许所有操作可以连接起来形成一个更大的管道。这就就可以进行特定的优化了,比如懒加载和短回路,我们将在下面介绍。

内部迭代:和集合的显式迭代(外部迭代)相比,Stream操作不需要我们手动进行迭代。

让我们再次看一下之前的代码的一些细节:

stream模型细节

我们首先通过stream()函数从一个交易列表中获取一个Stream对象。这个数据源是一个交易的列表,将会为Stream提供一系列元素。接下来,我们对Stream对象应用一些列的聚合操:filter(通过给定一个谓词来过滤元素),sorted(通过给定一个比较器实现排序),和map(用于提取信息)。除了collect其他操作都会返回Stream,这样就可以形成一个管道将它们连接起来,我们可以把这个链看做是一个对源的查询条件。

在collect被调用之前其实什么实质性的东西都都没有被调用。 collect被调用后将会开始处理管道,最终返回结果(结果是一个list)。

在我们探讨stream的各种操作前,我们还是看一个stream和collection的概念层面的不同之处吧。

Stream VS Collection

Collection和Stream都对一些列元素提供了一些接口。他们的不同之处是:Collection是和数据相关的,Stream是和计算相关的。

想一下存在DVD中的电影,这是一个collection,因为他包含了所有的数据结构。然而网络上的电影是一种流数据。流媒体播放器只需要在用户观看前先下载一些帧就可以观看了,不必全都下载下来。

简单点说,Collection是一个内存中的数据结构,Collection包括数据结构中的所有值——每个Collection中的元素在它被添加到集合中之前已经被计算出来了。相反,Stream是一种当需要的时候才会被计算的数据结构。

使用Collection接口需要用户做迭代(比如使用foreach),这种方式叫外部迭代。相反,Stream使用的是内部迭代——它会自己为你做好迭代,并且帮助做好排序。你只需要提供一个函数说明你想要干什么。下面代码使用Collection做外部迭代:

下面代码使用Stream做内部迭代

使用Stream处理数据

Stream 接口定义了许多操作,可以被分为两类。

filter,sorted,和map,这些可以连接起来形成一个管道的操作

collect,可以关闭管道返回结果的操作

可以被连接起来的操作叫做中间操作。你可以把他们连接起来,因为他们返回都类型都是Stream。关闭管道的操作叫做终结操作。他们可以从管道中产生一个结果,比如一个List,一个Integer,甚至一个void。

中间操作其实不执行任何处理直到一个终结操作被调用;他们很“懒”。因为终结操作通常可以被合并,并且被终结操作一次性执行。

上面的代码会计算集合中的前两个偶数,执行结果如下:

这是因为limit(2)使用了短回路;我们只需要处理stream的一部分,然后并返回结果。这就像要计算一个很大的Boollean表达式:只要一个表达式返回false,我们就可以断定这个表达式将会返回false而不需要计算所有。这里limit操作返回一个大小为2的stream。还有就是filter操作和map操作合并起来一起传给给了stream。

总结一下我们现已经已经学到的东西:Stream的操作包括如下三个东西:

一个需要进行数据查询的数据源(比如一个collection)

一连串组成管道的中间操作

一个执行管道并产生结果的终结操作

Stream提供的操作可分为如下四类:

过滤:有如下几种可以过滤操作

filter(Predicate):使用一个谓词java.util.function.Predicate作为参数,返回一个满足谓词条件的stream。

distinct:返回一个没有重复元素的stream(根据equals的实现)

limit(n): 返回一个不超过给定长度的stream

skip(n): 返回一个忽略前n个的stream

查找和匹配:一个通常的数据处理模式是判断一些元素是否满足给定的属性。可以使用 anyMatch, allMatch, 和 noneMatch 操作来帮助你实现。他们都需要一个predicate作为参数,并且返回一个boolean作为作为结果(因此他们是终结操作)。比如,你可以使用allMatch来检车在Stream中的所有元素是否有一个值大于100,像下面代码中表示的那样。

另外,Stream提供了findFirst和findAny,可以从Stream中获取任意元素。它们可以和Stream的其他操作连接在一起,比如filter。findFirst和findAny都返回一个Optional对象,像下面这样:

Optional类可以存放一个存在或者不存在的值。在下面代码中,findAny可能没有返回一个交易类型是grocery类的信息。Optional存在好多方法检测元素是否存在。比如,如果一个交易信息存在,我们可以使用相关函数处理optional对象。

映射:Stream支持map方法,map使用一个函数作为一个参数,你可以使用map从Stream的一个元素中提取信息。在下面的例子中,我们返回列表中每个单词的长度。

你可以定制更加复杂的查询,比如“交易中最大值的id”或者“计算交易金额总和”。这种处理需要使用reduce操作,reduce可以将一个操作应用到每个元素上,知道输出结果。reduce也经常被叫做折叠操作,因为你可以看到这种操作像把一个长的纸张(你的stream)不停地折叠直到想成一个小方格,这就是折叠操作。

看一下一个例子:

列表中的每个元素使用加号都迭代地进行了结合,从而产生了结果。我们本质上是“减少”了集合中的数据,最终变成了一个数。上面的代码有两个参数:初始值和结合list中元素的操作符“+”

当使用Stream的reduce方法时,我们可以使用下面的代码将集合中的数字元素加起来。reduce方法有两个参数:

初始值,这里是0。

一个将连个数相加返回一个新值的BinaryOperator

reduce方法本质上抽象了重复的模式。其他查询比如“计算产品”或者“计算最大值”是reduce方法的常规使用场景。

数值型Stream

你已经看到了你可以使用reduce方法来计算一个Integer的Stream了。然而,我们却执行了很多次的开箱操作去重复地把一个Integer对象添加到另一个上。如果我们调用sum方法岂不是很好?像下面代码那样,这样代码的意图也更加明确。

在Java 8 中引入了三种原始的特定数值型Stream接口来解决这个问题,它们是IntStream, DoubleStream, 和 LongStream。它们各自可以数值型Stream变成一个int、double、long。

可以使用mapToInt, mapToDouble, and mapToLong将通用Stream转化成一个数值型Stream,我们可以将上面代码改成下面代码。当然你可以使用通用Stream类型取代数值型Stream,然后使用开箱操作。

数值类型Stream的另一个用途就是获取一个区间的数。比如你可能想要生成1到100之前的所有数。Java 8在IntStream, DoubleStream, 和 LongStream 中引入了两个静态方法来帮助生成一个区间,它们是range 和 rangeClosed.

这两个方法以区间开始的数为第一个参数,以区间结束的数为第二个参数。但是range的区间是开区间的,rangeClosed是闭区间的。下面是一个使用rangeClosed返回10到30之间的奇数的stream。

创建Stream

有几种方式可以创建Stream。你已经知道了可以从一个集合中获取一个Stream,还你使用过数值类型Stream。你可以使用数值、数组或者文件创建一个Stream。另外,你甚至可以使用一个函数生成一个无穷尽的Stream。

通过数值或者数组创建Stream可以很直接:对于数值是要使用静态方法Stream .of,对于数组使用静态方法Arrays.stream ,像下面代码这样:

你可以使用Files.lines静态方法将一个文件转化为一个Stream。比如,下面代码计算一个文件的行数。

无穷Stream

到现在为止你知道了Stream元素是根据需求产生的。有两个静态方法Stream.iterate和Stream.generate可以让你从从一个函数中创建一个Stream,因为元素是根据需求计出来的,这两个方法可以一直产生元素。这也是我们叫无穷Stream的原因:Stream没有一个固定的大小,但是它和从固定大小的集合中创建的stream是一样的。

下面代码是一个使用iterate创建了包含一个10的倍数的Stream。iterate的第一个参数是初始值,第二个至是用于产生每个元素的lambda表达式(类型是UnaryOperator)。

我们可以使用limit操作将一个无穷的Stream转化为一个大小固定的stream,像下面这样:

总结

Java 8引入了Stream API,这可以让你实现复杂的数据查询处理。在这片文章中,我们已经看到了Stream支持很多操作,比如filter、mpa,reduce和iterate,这些操作可以方便我们写简洁的代码和实现复杂的数据处理查询。这和Java 8之前使用的集合有很大的不同。Stream有很多好处。首先,Stream API使用了注入懒加载和短回路的技术优化了数据处理查询。第二,Stream可以自动地并行运行,充分使用多核架构。在下一篇文章中,我们将探讨更多高级操作,比如flatMap和collect。

使用Java 8 Stream像操作SQL一样处理数据(上)相关推荐

  1. java 8 Stream中操作类型和peek的使用

    文章目录 简介 中间操作和终止操作 peek 结论 java 8 Stream中操作类型和peek的使用 简介 java 8 stream作为流式操作有两种操作类型,中间操作和终止操作.这两种有什么区 ...

  2. Java 8 Stream中间操作(方法)示例

    Java 8 Streams中间操作的完整指南. 所有内置Stream API中间操作(方法)的列表以及示例. 1.概述 在本教程中,我们将学习什么是 Java 8 Stream 中的中间操作 . 所 ...

  3. java 映射施舍呢,黑猴子的家:Java 8 - Stream 中间操作(映射)

    1.概念 多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理!而在终止操作时一次性全部处理,称为"惰性求值". 2.映射 3.map ...

  4. JAVA的stream流操作详细解析

    java的stram流操作 为什么需要 Stream 流与集合的区别 对比:原始集合操作与Stream集合操作 (过滤/映射/扁平化/遍历/排序/去重/跳过/截断的应用) 流的组成 流操作的分类 流的 ...

  5. 吃透JAVA的Stream流操作,多年实践总结

    在JAVA中,涉及到对数组.Collection等集合类中的元素进行操作的时候,通常会通过循环的方式进行逐个处理,或者使用Stream的方式进行处理. 例如,现在有这么一个需求: 从给定句子中返回单词 ...

  6. java jdk8 Stream流操作学习

    Stream流有一些特性: Stream流不是一种数据结构,不保存数据,它只是在原数据集上定义了一组操作. 这些操作是惰性的,即每当访问到流中的一个元素,才会在此元素上执行这一系列操作. Stream ...

  7. JAVA 8 Stream 常用操作

    Stream 常用操作 allMatch 使用给定的 Predicate 检查 Stream 中的所有元素,全部都通过检测则返回 true,否则 false . System.out.println( ...

  8. 【小家java】Stream流操作的有状态 vs 无状态

    相关阅读 [小家java]java5新特性(简述十大新特性) 重要一跃 [小家java]java6新特性(简述十大新特性) 鸡肋升级 [小家java]java7新特性(简述八大新特性) 不温不火 [小 ...

  9. (Java数据库编程基础操作)Statement实现数据查询操作

    Statement实现数据查询操作 在整个数据库的开发过程之中数据的查询操作是最复杂的,因为查询会牵扯到各种复杂查询的管理,例如:多表查询.子查询.统计查询.集合操作等等,但是从现代的开发来讲,对于数 ...

最新文章

  1. java 访问线程_java线程简介(共享对数据的访问)
  2. ES6.X,你必须知道的API和相关技巧
  3. echarts字变大_在echarts中如何调整lable的字体大小?
  4. python如何为饼图添加标题_python – Matplotlib子图标题,图标题格式
  5. 机器人总动员拟人后_WALL·E 机器人总动员——又是一部让名字耽误的高分电影...
  6. Spark Streaming 和 Flink 的对比以及详细描述,图文对比、代码
  7. Python办公自动化(八)|使用Python转换PDF,Word/Excel/PPT/md/HTML都能转
  8. ubuntu 卸载python_如何在各种环境下正确安装python——Linux
  9. 数字后端概念——cut metal
  10. 叶俊:从佛说法制的十大好处谈到企业的制度与人情
  11. 你真的了解前端模块化吗?
  12. C++游戏game | 井字棋游戏坤坤版(配资源+视频)【赋源码,双人对战】
  13. 解密:顺丰是一家什么样的公司
  14. sublime text3安装python插件和flake8_Sublime Text环境配置(Python、Latex、Markdown)及常见问题汇总...
  15. Android 为摄像头增加闪光灯
  16. Flask入门(4):CBV和FBV
  17. MySQL 调用 Java 程序
  18. C语言学习《经典C语言程序100例》day 2
  19. SAP GUI 730 windows 免费下载
  20. Matlab学习笔记——fitlm

热门文章

  1. [设计模式]命令模式
  2. Hash-table(用除法散列法实现)
  3. Jin Ge Jin Qu hao UVA - 12563 (劲歌金曲)01背包,求装入的东西最多(相同多时价值大)
  4. android elevation 白色,Android Elevation
  5. python二维散点分布图_深入理解皮尔逊相关系数amp;python代码
  6. 1847 奇怪的数学题(杜教筛 + Min_25 + 第二类斯特林数)
  7. cf1552F. Telepanting
  8. Hopping Rabbit
  9. A Hard Problem
  10. CF896E Welcome home,Chtholly/[Ynoi2018]五彩斑斓的世界(并查集+第二分块)