java spliterator,Java 8 之Stream Spliterator
定义
用于遍历和分割“源”元素的对象。
数据源
Spliterator的元素来源可能是一个数组,一个集合,一个IO通道,一个生成函数。
处理数据源的方式
Spliterator可以单独或顺序地批量地遍历元素。
Spliterator也可以将其部分元素作为另一个Spliterator进行分区,为了并行化操作。使用不能拆分或以非常不平衡或低效的方式进行拆分Spliterator的操作不太可能从并行中获益。遍历和分解流出的元素;每个Spliterator只对单个批量计算有用。
特征 characteristics
Spliterator 还声明了 一组关于它的结构和源的特征(characteristics),包含以下以下几种:
ORDERED int 型 值为16 既定的顺序,Spliterator保证拆分和遍历时是按照这一顺序。
DISTINCT int型 值为1 表示元素都不是重复的,对于每一对元素{ x, y},{ !x.equals(y)}。例如,这适用于基于{@link Set}的Spliterator。
SORTED int型 值为4 表示元素顺序按照预定义的顺序,可以通过getComparator 获取排序器,若返回null ,则是按自然排序。
SIZED int型 值为64 表示在遍历分隔之前 estimateSize() 返回的值代表一个有限的大小,在没有修改结构源的情况下,代表了一个完整遍历时所遇到的元素数量的精确计数。
NONNULL init型 值为256 表示数据源保证元素不会为空
IMMUTABLE int 型 值为1024 表示在遍历的过程中不能添加、替换、删除元素
CONCURRENT int型 值为4096 表示元素可以被多个线程安全并发得修改而不需要外部的同步。
SUBSIZED int型 值为16384 表示trySplit()返回的结果都是SIZED和SUBSIZED
Tips
一个late-binding Spliterator 在第一次遍历、分隔或者查询任何估计的大小时绑定 ,而不是在创建的时候绑定。
非后期绑定的Spliterator在构建或在任何方法的第一次调用时绑定到数据源。在绑定之前对源进行的修改将在遍历Spliterator时反映出来,在绑定源之后,发现 structural interference应立即抛出ConcurrentModificationException 异常,这称为快速失败。
Spliterator的批量遍历方法({@link # forEachRemaining()})可以在遍历完所有元素之后优化遍历并检查 structural interference,而不是检查每个元素并立即失败。
Spliterator 提供估计剩余多少元素的方法,即estimateSize()方法,理想情况下,正如在characteristics SIZED反应的那样,这个值会与成功遍历所遇到的数量完全一致。但是,即使不知道确切的值,估计值对于在数据源上执行的操作来说仍然是有用的,例如帮助确定是进一步分割还是按顺序遍历其余的元素。
并行的实现
尽管在并行算法中有明显的实用功能,但spliterator并不向我们期望的那样是线程安全的;相反,使用spliterator的并行算法的实现应该确保spliterator一次只使用一个线程。这个通常很容易通过 串行线程封闭 来实现:通常使用递归分解这个经典的并行算法。调用{@link #trySplit()}的线程可以将返回的Spliterator传递给另一个线程,而这个线程又可以遍历或进一步拆分这个Spliterator。如果两个或多个线程在同一个Spliterator上同时操作,则不定义分割和遍历的行为。如果原始线程将一个spliterator传递给另一个线程进行处理,那么最好是在使用{@link #tryAdvance(Consumer) tryAdvance()}的任何元素之前进行切换,因为某些保证(例如{@link #estimateSize()}对于{@code size}spliterator的精度)只有在遍历开始之前才有效。
Spliterator分割图.png
Spliterator通过支持分割和单元素迭代,除了支持串行遍历,还支持高效的并行遍历。另外,Spliterator 不像Iterator设计的那样设计两个方法hasNext 判断是否有元素和next() 返回元素进行消费,Spliterator 设计一个tryAdvance方法,消费元素,如果有就消费并返回true,如果没有则返回false,不需要两个独立的方法。
对于可变源,如果在Spliterator绑定到其数据源和遍历结束之间对源进行结构上的干扰(添加、替换或删除元素),可能会出现随机和不确定的影响。
对于structurally interfered 可以有一下几个方法避免:
数据源为java.util包的CopyOnWriteArrayList ,它是不可变的,数据源为该类实例的Spliterator同样会将characteristics声明为IMMUTABLE
数据源为java.util包的ConcurrentHashMap, 数据源为该类实例的Spliterator会将特性(characteristics) 声明为CONCURRENT。
可变的数据源会提供一个 late-binding 和快速失败的Spliterator。
这里有一个类(除了当做例子之外,它不是一个非常有用的类),它维护一个数组,其中实际数据保存在偶数位置,而不相关的标记数据保存在奇数位置。它的Spliterator会忽略标记数据。
/**
* @Author unyielding
* @date 2018/7/26 0026 19:48
* @desc 一个类(除了当做例子之外,它不是一个非常有用的类),
* 它维护一个数组, 其中实际数据保存在偶数位置,而不相关的标记数据保存在奇数位置。
* 它的Spliterator会忽略标记数据。
*/
public class TaggedArray {
private final Object[] elements;//创建后,不可变的
/**
* 构造方法
*
* @param data 实际数据
* @param tags 标记数据
*/
TaggedArray(T[] data, Object[] tags) {
int size = data.length;
//保证实际数据数组和标记数据数组的大小相同
if (tags.length != size) throw new IllegalArgumentException();
this.elements = new Object[2 * size];
//初始化elements 数组
for (int i = 0, j = 0; i < size; ++i) {
elements[j++] = data[i];
elements[j++] = tags[i];
}
}
public Spliterator spliterator() {
return new TaggedArraySpliterator<>(elements, 0, elements.length);
}
static class TaggedArraySpliterator implements Spliterator {
private final Object[] array;
private int origin; //当前索引,在分割或者遍历时使用
private final int fence;//最大的下标加一
TaggedArraySpliterator(Object[] array, int origin, int fence) {
this.array = array;
this.origin = origin;
this.fence = fence;
}
/**
* 批量遍历
* @param action 消费函数 {@link Consumer} 的子类,可以通过lambda表达式表示
*/
@Override
public void forEachRemaining(Consumer super T> action) {
for (; origin < fence; origin += 2) {
action.accept((T) array[origin]);
}
}
/**
* 处理单个元素
* @param action 消费函数 {@link Consumer} 的子类,可以通过lambda表达式表示
* @return 如果有元素消费就返回true,如果没有就直接返回false
*/
@Override
public boolean tryAdvance(Consumer super T> action) {
if (origin < fence) {
action.accept((T) array[origin]);
origin += 2;
return true;
}
return false;
}
/**
* 分割数据源
* @return 返回分割后生成的Spliterator
*/
@Override
public Spliterator trySplit() {
int lo = origin;
int mid = ((lo + fence) >> 1) & 1;//强制中点数为偶数
if (lo < mid) {
origin = mid;//重置Spliterator的 当前下标
return new TaggedArraySpliterator<>(array, lo, mid);
}//太小不需要拆分
return null;
}
/**
* 估计剩余还有多少元素
* @return 剩余还有多少元素
*/
@Override
public long estimateSize() {
return (long) ((fence - origin) / 2);
}
/**
* 获取特征值 用户可以根据 特征值 ,
* 用户可以根据 配置更好的控制和优化它的使用
* @return
*/
@Override
public int characteristics() {
return ORDERED | IMMUTABLE | SIZED | SUBSIZED;
}
}
/**
* 并行遍历
* @param a 一个{@link TaggedArray} 实例
* @param action
* @param 每个元素的值
*/
static void parEach(TaggedArray a, Consumer action) {
Spliterator spliterator = a.spliterator();
long targetBatchSize = spliterator.estimateSize()
/ (ForkJoinPool.getCommonPoolParallelism() * 8);
new ParEach<>(null, spliterator, action, targetBatchSize).invoke();
}
}
并行计算器 ,其实就是继承CountedCompleter 一个可以放到forlk/join 线程池里的类
/**
* 并行计算器
* @param 元素的类型
*/
static class ParEach extends CountedCompleter {
final Spliterator spliterator;
final Consumer action;
final long targetBatchSize;
ParEach(ParEach parent, Spliterator spliterator,
Consumer action, long targetBatchSize) {
super(parent);
this.spliterator = spliterator;
this.action = action;
this.targetBatchSize = targetBatchSize;
}
@Override
public void compute() {
Spliterator sub;
while (spliterator.estimateSize() > targetBatchSize
&& (sub = spliterator.trySplit()) != null) {
addToPendingCount(1);
new ParEach<>(this, sub, action, targetBatchSize).fork();
}
spliterator.forEachRemaining(action);
propagateCompletion();
}
}
java spliterator,Java 8 之Stream Spliterator相关推荐
- 跟我学 Java 8 新特性之 Stream 流(七)流与迭代器,流系列大结局
转载自 跟我学 Java 8 新特性之 Stream 流(七)流与迭代器,流系列大结局 恭喜你们,马上就要学完Java8 Stream流的一整系列了,其实我相信Stream流对很多使用Java的同 ...
- 跟我学 Java 8 新特性之 Stream 流(二)关键知识点
转载自 跟我学 Java 8 新特性之 Stream 流(二)关键知识点 我们的第一篇文章,主要是通过一个Demo,让大家体验了一下使用流API的那种酣畅淋漓的感觉.如果你没有实践,我还是再次呼吁 ...
- 【java】函数式接口和Stream
函数式接口和Stream 函数式接口和Stream 1. 函数式接口 1.1 函数式接口概述 1.2 常用函数式接口 1.3 比较器函数式接口 1.4 消费函数式接口 Consumer 1.5 生产者 ...
- 操作canal,报错:Caused by: java.io.IOException: end of stream when reading header
报错:Caused by: java.io.IOException: end of stream when reading header 解决: canal连不上,报错:原因端口变更配置文件(cana ...
- Atitit 实现java的linq 以及与stream api的比较
Atitit 实现java的linq 以及与stream api的比较 1.1. Linq 和stream api的关系,以及主要优缺点1 1.2. Linq 与stream api的适用场景1 1. ...
- 跟我学 Java 8 新特性之 Stream 流(六)收集
转载自 跟我学 Java 8 新特性之 Stream 流(六)收集 我们前面的五篇文章基本都是在说将一个集合转成一个流,然后对流进行操作,其实这种操作是最多的,但有时候我们也是需要从流中收集起一些 ...
- 跟我学 Java 8 新特性之 Stream 流基础体验
转载自 跟我学 Java 8 新特性之 Stream 流基础体验 Java8新增的功能中,要数lambda表达式和流API最为重要了.这篇文章主要介绍流API的基础,也是流API系列的第一篇文章, ...
- 跟我学 Java 8 新特性之 Stream 流(三)缩减操作
转载自 跟我学 Java 8 新特性之 Stream 流(三)缩减操作 和前面两篇文章一起服用,效果会更佳.通过对流API的基础体验Demo和关键知识点的讲解,相信大家对流API都有一定的认识了, ...
- 跟我学 Java 8 新特性之 Stream 流(四)并行流
转载自 跟我学 Java 8 新特性之 Stream 流(四)并行流 随着对流API认识的慢慢深入,本章我们要讨论的知识点是流API里面的并行流了. 在开始讨论并行流之前,我先引发一下大家的思考, ...
- 跟我学 Java 8 新特性之 Stream 流(五)映射
转载自 跟我学 Java 8 新特性之 Stream 流(五)映射 经过了前面四篇文章的学习,相信大家对Stream流已经是相当的熟悉了,同时也掌握了一些高级功能了,如果你之前有阅读过集合框架的基 ...
最新文章
- CMS:文章管理之模型和Store
- ASP.NET MVC Model绑定(二)
- 【UIKit】UITableView.02
- PHP多维数组转为一维数组的方法实例
- ccs7调试linux,【图片】【吧主帖】在LINUX(ubuntu)系统下装CCSv6方法(原创)【dsp吧】_百度贴吧...
- iis7php怎么301重定向,iis7/8设置网站301重定向的方法
- 如何完全的卸载MySQL数据库?
- cocos2d-x 使用BMFont生成中文字体并应用
- 计算机控制面板设置命令,进入开始---设置--控制面板--声音和音频设备命令
- 用continue计算100以内奇数和_一分钟明白break和continue
- 44、Search contract
- 易基因|ChIP-seq等实验揭示CHD6转录激活前列腺癌通路的关键功能 | 肿瘤耐药研究
- Kryo官方文档学习笔记
- 【QA】集成高德地图SDK闪退问题
- 白告王旋的前端开发笔记——性能优化
- Ubcoin市场:加密货币-商品交易平台
- 四阶行列式如何降阶_四阶行列式用降阶法怎么计算 我要计算过程
- java freemind_java环境变量的应用:为Freemind配置Java环境
- 布局数据存储,中国电子云意在何为?
- python语法格式
热门文章
- linux timerfd系列函数总结:timerfd.h
- CUDA:使用nvprof工具计时
- Java之AOP解释
- idea 改变输出语句的颜色 工具类
- 建立一个lstm_基于LSTM的双色球预测(一)
- c语言学习-利用函数指针的方法,求任意给出两个整数的x和y的和、差。
- OpenShift 4 之Istio-Tutorial (9) 访问限流
- .NET DateTime,一个关于最佳实践和时间旅行的故事
- 微软发布首版基于 Chromium 79 的 Edge 浏览器
- python 享元模式_设计模式-创建型模式,python享元模式 、python单例模式(7)