非线程安全集合类(这里的集合指容器Collection,非Set)的迭代器结合了及时失败机制,但仍然是不安全的。这种不安全表现在许多方面:

  1. 并发修改“通常”导致及时失败
  2. 单线程修改也可能导致及时失败的“误报”
  3. 迭代器会“丢失”某些并发修改行为,让及时失败失效

如果不了解其不安全之处就随意使用,就像给程序埋下了地雷,随时可能引爆,却不可预知。
ArrayList是一个常用的非线程安全集合,下面以基于ArrayList讲解几种代表情况。

及时失败

及时失败也叫快速失败,fast-fail。
“及时失败”的迭代器并不是一种完备的处理机制,而只是“善意地”捕获并发错误,因此只能作为并发问题的预警指示器。它们采用的实现方式是,将计数器的变化与容器关联起来:如果在迭代期间计数器被修改,那么hasNext或next将抛出ConcurrentModificationException。然而,这种检查是在没有同步的情况下进行的,因此可能会看到失效的计数器,而迭代器可能并没有意识到已经发生了修改。这是一种设计上的权衡,从而降低并发修改操作的检测代码对程序性能带来的影响。

然而,及时失败机制十分简洁(简单&清晰),同时对集合的性能影响十分小,所以大部分非线程安全的集合类仍然使用这种机制来进行“善意”的提醒。

几种非线程安全的代表情况

并发修改“通常”导致及时失败

“通常”是因为及时失败的“善意”性质,它很多时候会给我们提醒,但有时候也不会给出提醒,有时候甚至给出某种意义上的错误提醒。这一小节针对正常的情况,这是我们考察一个机制是否值得“采纳并完善”的根本属性。

构造下列程序:

…
private Collection users = new ArrayList(); // 所以应使用CopyOnWriteArrayList
…
users.add(new User("张三",28));
users.add(new User("李四",25));
users.add(new User("王五",31));
…
public void run() {Iterator itrUsers = users.iterator();while(itrUsers.hasNext()){System.out.println("aaaa");User user = (User)itrUsers.next();if(“张三”.equals(user.getName())){ // 在迭代过程中修改集合itrUsers.remove();} else { // 正常输出System.out.println(user);}}
}
…

忽略细节,假设有多个线程在同时执行run方法,操作users集合。这时,“通常”会导致及时失败。这里的异常可能从next或remove方法中抛出(当然这里是从next,因为next先执行):

private class Itr implements Iterator<E> {
…public boolean hasNext() {return cursor != size;}public E next() {checkForComodification();int i = cursor;if (i >= size)throw new NoSuchElementException();Object[] elementData = ArrayList.this.elementData;if (i >= elementData.length)throw new ConcurrentModificationException();cursor = i + 1;return (E) elementData[lastRet = i];}public void remove() { // 迭代器的remove方法if (lastRet < 0)throw new IllegalStateException();checkForComodification();try {ArrayList.this.remove(lastRet); // 集合的remove方法cursor = lastRet;lastRet = -1;expectedModCount = modCount;} catch (IndexOutOfBoundsException ex) {throw new ConcurrentModificationException();}}
…
}

实际检查并抛出异常的是checkForComodification方法:

private class Itr implements Iterator<E> {
…
int expectedModCount = modCount;…final void checkForComodification() {if (modCount != expectedModCount)throw new ConcurrentModificationException();}…
}

modCount是当前集合的版本号,每次修改(增删改)集合都会加 1;expectedModCount是当前迭代器的版本号,在迭代器实例化时初始化为modCount,只有remove方法正常执行(不抛出异常)才可以修改这个值,与modCount保持同步。

因此,如果在线程A正常迭代的过程中,线程B修改了users集合,modCount就会发生变化,这时,线程B的expectedModCount能够与modCount保持同步,线程A的expectedModCount却发现自己与modCount不再同步,从而抛出ConcurrentModificationException异常。

扯远些:
对于线程安全的集合类而言,我们不希望任何失败。但对于非线程安全的类,有人认为“应该在假设线程安全的情况下使用”,所以及时失败机制完全没有必要;有人认为“集合类的状态太多(所有非线程安全域的状态数量的乘积),并发使用时应该给出错误提醒,否则很难排查并发问题”,所以及时失败机制很有必要。这个问题见仁见智,个人支持后者观点。

所以,这种及时失败的检查是不完备的。

单线程修改也可能导致及时失败的“误报”

多线程并发修改集合时,抛出ConcurrentModificationException异常作为及时失败的提醒,往往是我们期望的结果。然而,如果在单线程遍历迭代器的过程中修改了集合,也会抛出ConcurrentModificationException异常,看起来发生了及时失败。这不是我们期望的结果,是一种及时失败的误报。

我们改用集合的remove方法移除user“张三”:

…
public void run() {…if(“张三”.equals(user.getName())){ // 在迭代过程中修改集合users.remove(user); // itrUsers.remove();} else { // 正常输出System.out.println(user);}…
}
…

假设只有一个线程执行run方法,在”张三”被删除之后,下一次执行next方法时,仍旧会抛出ConcurrentModificationException异常,也就是导致了及时失败。

这时因为集合的remove方法并没有维护集合修改的状态(如对modCount&expectedModCount组合的修改和检查):

public class ArrayList<E> extends AbstractList<E>
…public boolean remove(Object o) { // 集合的remove方法if (o == null) {for (int index = 0; index < size; index++)if (elementData[index] == null) {fastRemove(index);return true;}} else {for (int index = 0; index < size; index++)if (o.equals(elementData[index])) {fastRemove(index);return true;}}return false;}
…
}

这也让我们更容易理解及时失败的本质——依托于对集合修改状态的维护。这里的主要原因看起来是“集合的remove方法破坏了正常维护的集合修改状态”,但对于使用者而言,集合在单线程环境下却抛出了ConcurrentModificationException异常,这是由于及时失败机制没有区分单线程与多线程的情况,统一给出同样的提醒(抛出ConcurrentModificationException异常),因而是及时失败的误报。

迭代器会“丢失”某些并发修改行为,让及时失败失效

除了误报,及时失败之仅限于“善意”(有提醒就是“善意”的,没有也不是“恶意”的)还体现在其可能“丢失”某些并发修改行为。在这里,“丢失”意味着不提醒——某些线程并发修改了当前集合,但没有抛出ConcurrentModificationException异常,及时失败机制失效了。

主动避过及时失败的检查

利用hasNext方法提前结束线程,可以主动避过及时失败的检查,从而导致修改行为的丢失:

private class Itr implements Iterator<E> {
…public boolean hasNext() {return cursor != size; // 思考:如果删除了集合的倒数第二个元素,会发生什么?}
…
}

还是单线程的场景下,假设我们删除了集合的倒数第二个元素。这时next方法导致cursor=oldSize-1,同时remove方法导致newSize=oldSize-1(oldSize是集合修改之前的size值,newSize集合修改之后的);所以hasNext方法会返回false,让用户误以为集合迭代已经结束(实际上还有最后一个元素),从而循环终止(在我们的程序里用hasNext判断是否结束),无法抛出ConcurrentModificationException异常,及时失败失效了。

推广到多线程的情景是一样的,因为size是共享的。

及时失败的实现是非线程安全的

很容易忽略的一点是,上述集合修改状态的维护本身就是在没有同步的情况下进行的,因此可能看到更多(远比上述要多)失效的集合修改状态,使迭代器意识不到集合发生了修改,这是一种竞态条件(Race Condition)。

假设线程A进入迭代器的remove方法,线程B进入迭代器的next方法,现在线程A执行集合的remove方法:

private class Itr implements Iterator<E> {
…public void remove() {…ArrayList.this.remove(lastRet);…}
…
}

首先,假设没有其他线程并发修改,则两个线程都可以通过checkForComodification()的检查;然后线程A快速的执行集合的remove方法;待线程A执行完集合的remove方法,由于线程B之前已经通过了检查,现在就无法意识到“users集合在线程A中已经发生了变化”。另外,因为几乎完全不存在同步措施,modCount的修改也存在竞态条件,其他状态也无法保证是否有效。

总结

上面看到了非线程安全集合类的迭代器是不安全的,但在单线程的环境下,这些集合类在性能、维护难度等方面仍然具有不可替代的优势。那么该如何在兼具一定程度线程安全的前提下,更好的发挥內建集合类的优势呢?总结起来无非两点:

  1. 使用非线程安全的集合时(实际上对于某些“线程安全”的集合类,其迭代器也是线程不安全的),迭代过程中需要用户自觉维护,不修改该集合。
  2. 应尽可能明确线程安全的需求等级,做好一致性、活跃性、性能等方面的平衡,再针对性的使用相应的集合类。

参考:

  • 传智播客_张孝祥_Java多线程与并发库高级应用视频教程/19_传智播客_张孝祥_java5同步集合类的应用.avi

本文链接:源码|从源码分析非线程安全集合类的不安全迭代器
作者:猴子007
出处:https://monkeysayhi.github.io
本文基于 知识共享署名-相同方式共享 4.0 国际许可协议发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名及链接。

转载于:https://www.cnblogs.com/monkeysayhi/p/7659400.html

从源码分析非线程安全集合类的不安全迭代器相关推荐

  1. Hbase Compaction 源码分析 - CompactSplitThread 线程池选择

    目录 CompactSplitThread requestCompactionInternal方法 selectCompaction方法 requestCompaction方法 其他相关文章 Hbas ...

  2. 深入源码分析Java线程池的实现原理

    转载自   深入源码分析Java线程池的实现原理 程序的运行,其本质上,是对系统资源(CPU.内存.磁盘.网络等等)的使用.如何高效的使用这些资源是我们编程优化演进的一个方向.今天说的线程池就是一种对 ...

  3. 从原理到实现丨手把手教你写一个线程池丨源码分析丨线程池内部组成及优化

    人人都能学会的线程池 手写完整版 1. 线程池的使用场景 2. 线程池的内部组成 3. 线程池优化 [项目实战]从原理到实现丨手把手教你写一个线程池丨源码分析丨线程池内部组成及优化 内容包括:C/C+ ...

  4. Libuv源码分析 —— 8. 线程池

    网络I/O 在 上一节 的学习中,我们已经搞明白了网络I/O的基本过程,并通过了解进程/线程间通信来熟悉这个流程.下面,让咱们学习线程池中的线程如何工作.并和主进程进行通信的吧! 线程池 Libuv ...

  5. 从源码分析创建线程池的4种方式

    摘要:从创建线程池的源码来深入分析究竟有哪些方式可以创建线程池. 本文分享自华为云社区<[高并发]从源码角度分析创建线程池究竟有哪些方式>,作者:冰 河 . 在Java的高并发领域,线程池 ...

  6. 线程资源PHP源码分析之线程安全模型

    文章结束给大家来个程序员笑话:[M] 迎欢载转,载转请注明出处http://blog.csdn.net/hackooo/article/details/8702156 感谢!新浪微博:小灰马 0.媒介 ...

  7. PHP源码分析之线程安全模型

    欢迎转载,转载请注明出处http://blog.csdn.net/hackooo/article/details/8702156 谢谢!新浪微博:小灰马 0.前言 相信很多人跟我一样,一开始看PHP源 ...

  8. JDK1.8源码分析:线程安全的CopyOnWriteArrayList与CopyOnWriteArraySet

    点击上方蓝色"方志朋",选择"设为星标" 回复"666"获取独家整理的学习资料! 作者:服务端开发 blog.csdn.net/u01001 ...

  9. c++ 线程池_JAVA并发编程:线程池ThreadPoolExecutor源码分析

    前面的文章已经详细分析了线程池的工作原理及其基本应用,接下来本文将从底层源码分析一下线程池的执行过程.在看源码的时候,首先带着以下两个问题去仔细阅读.一是线程池如何保证核心线程数不会被销毁,空闲线程数 ...

  10. threadpoolexecutor创建线程池_线程池ThreadPoolExecutor源码分析

    什么是线程池 创建线程要花费昂贵的资源和时间,如果任务来了才创建那么响应时间会变长,而且一个进程能创建的线程数量有限.为了避免这些问题,在程序启动的时候就创建若干线程来响应出来,它们被称为线程池,里面 ...

最新文章

  1. 硬件工程师必备秘籍,模拟电子经典200问!
  2. matplotlib plt.figure() 参数详细解释 对于绘制直方图 点图 的通用场景
  3. oracle修改连接数
  4. 「洛谷P1343」地震逃生 解题报告
  5. IT行业的日常工作方法 学习(转)
  6. Project Server的页面如何修改Text
  7. linux高端内存申请,Linux高端内存
  8. * 图形例子,函数实现体会地址传递
  9. 【OS学习笔记】三十九 保护模式十:中断和异常的处理与抢占式多任务对应的汇编代码----动态加载的用户程序/任务一代码
  10. WPF Unleashed Chapter 2:XAML Demystified 翻译(第二部分)
  11. 一些.NET的开源项目资料
  12. 计算机专业女生进电网,考入华北电力大学计算机专业,无缘国家电网,这是为什么?...
  13. Forth 系统实现
  14. 2020牛客寒假算法基础集训营4 - G 音乐鉴赏-全概率公式
  15. Jinja2安装与基本API用法
  16. android 大图分块加载,超大图加载
  17. 硬件设计与实践:16位CPU设计
  18. 计算机管理打不开什么情况,Win7 计算机管理 打不开的解决方法
  19. 想对大一大二学生说一些心里话
  20. 【51】PCIe简介

热门文章

  1. 十三、K8s SVC相关操作
  2. H3C 静态路由的配置
  3. 杭电计算机2013年硕士研究生复试详解
  4. MarkdownPad下载安装图文详解
  5. HDU--2502 月之数
  6. git报错之fatal: protocol error: bad line length character: No This
  7. Linux集群:LVS搭建负载均衡集群(二)
  8. POJ3421:X-factor Chains——题解
  9. JavaScript DOM 编程艺术(第2版)读书笔记 (7)
  10. [JavaScript]面向对象编程