HashMap是线程不安全的!主要表现在多线程情况下:

1)hash冲突时,put方法不是同步的先存的值会被后存的值覆盖。(1.7和1.8都有的表现)

2)在resize的时候,可能会导致死循环(环形链表)(仅1.7会有的表现,因为其头插法导致)


让我们先来了解一下HashMap的底层存储结构,HashMap底层是一个Entry数组,一旦发生Hash冲突的的时候,HashMap采用拉链法解决碰撞冲突,Entry内部的变量:

[java] view plain copy

  1. final Object key;
  2. Object value;
  3. Entry next;
  4. int hash;

通过Entry内部的next变量可以知道使用的是链表,这时候我们可以知道,如果多个线程,在某一时刻同时操作HashMap并执行put操作,而有大于两个key的hash值相同,如图中a1、a2,这个时候需要解决碰撞冲突,而解决冲突的办法上面已经说过,对于链表的结构在这里不再赘述,暂且不讨论是从链表头部插入还是从尾部初入,这个时候两个线程如果恰好都取到了对应位置的头结点e1,而最终的结果可想而知,a1、a2两个数据中势必会有一个会丢失,如图所示:

再来看下put方法

[java] view plain copy

  1. public Object put(Object obj, Object obj1)
  2. {
  3. if(table == EMPTY_TABLE)
  4. inflateTable(threshold);
  5. if(obj == null)
  6. return putForNullKey(obj1);
  7. int i = hash(obj);
  8. int j = indexFor(i, table.length);
  9. for(Entry entry = table[j]; entry != null; entry = entry.next)
  10. {
  11. Object obj2;
  12. //搜索同一个桶的链表上是否有相同key的entry,有则直接替换value
  13. if(entry.hash == i && ((obj2 = entry.key) == obj || obj.equals(obj2)))
  14. {
  15. Object obj3 = entry.value;
  16. entry.value = obj1;
  17. entry.recordAccess(this);
  18. return obj3;
  19. }
  20. }
  21. modCount++;
  22. //判断是否需要扩容,是则扩容,否,则创建entry
  23. addEntry(i, obj, obj1, j);
  24. return null;
  25. }

put方法不是同步的,同时调用了addEntry方法:

[java] view plain copy

  1. void addEntry(int i, Object obj, Object obj1, int j)
  2. {
  3. if(size >= threshold && null != table[j])
  4. {
  5. resize(2 * table.length);
  6. i = null == obj ? 0 : hash(obj);
  7. j = indexFor(i, table.length);
  8. }
  9. createEntry(i, obj, obj1, j);
  10. }

addEntry方法依然不是同步的,所以导致了线程不安全出现伤处问题,其他类似操作不再说明,源码一看便知


resize死循环(JDK1.7)

重新调整 HashMap 大小的时候,存在条件竞争。

因为如果两个线程都发现 HashMap 需要重新调整大小了,它们会同时试着调整大小。在调整大小的过程中,存储在链表中的元素的次序会反过来。因为移动到新的 bucket 位置的时候,HashMap 并不会将元素放在链表的尾部而是放在头部。这是为了避免尾部遍历(tail traversing)。如果条件竞争发生了,那么就死循环了。多线程的环境下不使用 HashMap。

HashMap 的容量是有限的。当经过多次元素插入,使得 HashMap 达到一定饱和度时,Key 映射位置发生冲突的几率会逐渐提高这时候, HashMap 需要扩展它的长度,也就是进行Resize。

  1. 扩容:创建一个新的 Entry 空数组,长度是原数组的2倍

  2. rehash:遍历原 Entry 数组,把所有的 Entry 重新 Hash 到新数组

为什么多线程会导致死循环,它是怎么发生的?

我们都知道HashMap初始容量大小为16,一般来说,当有数据要插入时,都会检查容量有没有超过设定的thredhold,如果超过,需要增大Hash表的尺寸,但是这样一来,整个Hash表里的元素都需要被重算一遍。这叫rehash,这个成本相当的大。

1

2

3

4

5

6

7

8

9

10

11

12

13

void resize(int newCapacity) {

        Entry[] oldTable = table;

        int oldCapacity = oldTable.length;

        if (oldCapacity == MAXIMUM_CAPACITY) {

            threshold = Integer.MAX_VALUE;

            return;

        }

        Entry[] newTable = new Entry[newCapacity];

        transfer(newTable, initHashSeedAsNeeded(newCapacity));

        table = newTable;

        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);

}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

void transfer(Entry[] newTable, boolean rehash) {

        int newCapacity = newTable.length;

        for (Entry<K,V> e : table) {

            while(null != e) {

                Entry<K,V> next = e.next;

                if (rehash) {

                    e.hash = null == e.key ? 0 : hash(e.key);

                }

  //头插法(JDK1.7)

                int i = indexFor(e.hash, newCapacity);

                e.next = newTable[i];

                newTable[i] = e;

                e = next;

            }

        }

}

   

大概看下transfer:

  1. 对索引数组中的元素遍历
  2. 对链表上的每一个节点遍历:用 next 取得要转移那个元素的下一个,将 e 转移到新 Hash 表的头部,使用头插法插入节点。
  3. 循环2,直到链表节点全部转移
  4. 循环1,直到所有索引数组全部转移

经过这几步,我们会发现转移的时候是逆序的。假如转移前链表顺序是1->2->3,那么转移后就会变成3->2->1。这时候就有点头绪了,死锁问题不就是因为1->2的同时2->1造成的吗?所以,HashMap 的死锁问题就出在这个transfer()函数上。

1.1 单线程 rehash 详细演示

单线程情况下,rehash 不会出现任何问题:

  • 假设hash算法就是最简单的 key mod table.length(也就是数组的长度)。
  • 最上面的是old hash 表,其中的Hash表的 size = 2, 所以 key = 3, 7, 5,在 mod 2以后碰撞发生在 table[1]
  • 接下来的三个步骤是 Hash表 resize 到4,并将所有的 <key,value> 重新rehash到新 Hash 表的过程

如图所示:头插法

1.2 多线程 rehash 详细演示

为了思路更清晰,我们只将关键代码展示出来

1

2

3

4

5

6

while(null != e) {

    Entry<K,V> next = e.next;

    e.next = newTable[i];

    newTable[i] = e;

    e = next;

}

  1. Entry<K,V> next = e.next;——因为是单链表,如果要转移头指针,一定要保存下一个结点,不然转移后链表就丢了
  2. e.next = newTable[i];——e 要插入到链表的头部,所以要先用 e.next 指向新的 Hash 表第一个元素(为什么不加到新链表最后?因为复杂度是 O(N))
  3. newTable[i] = e;——现在新 Hash 表的头指针仍然指向 e 没转移前的第一个元素,所以需要将新 Hash 表的头指针指向 e
  4. e = next——转移 e 的下一个结点

假设这里有两个线程同时执行了put()操作,并进入了transfer()环节

1

2

3

4

5

6

while(null != e) {

    Entry<K,V> next = e.next; //线程1执行到这里被调度挂起了

    e.next = newTable[i];

    newTable[i] = e;

    e = next;

}

那么现在的状态为:

从上面的图我们可以看到,因为线程1的 e 指向了 key(3),而 next 指向了 key(7),在线程2 rehash 后,就指向了线程2 rehash 后的链表。

然后线程1被唤醒了:

  1. 执行e.next = newTable[i],于是 key(3)的 next 指向了线程1的新 Hash 表,因为新 Hash 表为空,所以e.next = null
  2. 执行newTable[i] = e,所以线程1的新 Hash 表第一个元素指向了线程2新 Hash 表的 key(3)。好了,e 处理完毕。
  3. 执行e = next,将 e 指向 next,所以新的 e 是 key(7)

然后该执行 key(3)的 next 节点 key(7)了:

  1. 现在的 e 节点是 key(7),首先执行Entry<K,V> next = e.next,那么 next 就是 key(3)了
  2. 执行e.next = newTable[i],于是key(7) 的 next 就成了 key(3)
  3. 执行newTable[i] = e,那么线程1的新 Hash 表第一个元素变成了 key(7)
  4. 执行e = next,将 e 指向 next,所以新的 e 是 key(3)

这时候的状态图为:

然后又该执行 key(7)的 next 节点 key(3)了:

  1. 现在的 e 节点是 key(3),首先执行Entry<K,V> next = e.next,那么 next 就是 null
  2. 执行e.next = newTable[i],于是key(3) 的 next 就成了 key(7)
  3. 执行newTable[i] = e,那么线程1的新 Hash 表第一个元素变成了 key(3)
  4. 执行e = next,将 e 指向 next,所以新的 e 是 key(7)

这时候的状态如图所示:

很明显,环形链表出现了!!当然,现在还没有事情,因为下一个节点是 null,所以transfer()就完成了,put()的其余过程搞定后,HashMap 的底层实现就是线程1的新 Hash 表了。


JDK 1.7 HashMap扩容导致死循环的主要原因

HashMap扩容导致死循环的主要原因在于扩容后链表中的节点在新的hash桶使用头插法插入

新的hash桶会倒置原hash桶中的单链表,那么在多个线程同时扩容的情况下就可能导致产生一个存在闭环的单链表,从而导致死循环。

JDK 1.8 HashMap扩容不会造成死循环的原因

在JDK 1.8中执行上面的扩容死循环代码示例就不会发生死循环。由于使用的是尾插法不会导致单链表的倒置,所以扩容的时候不会导致死循环。

通过上面的分析,不难发现循环的产生是因为新链表的顺序跟旧的链表是完全相反的,所以只要保证建新链时还是按照原来的顺序的话就不会产生循环。

这里虽然JDK 1.8 中HashMap扩容的时候不会造成死循环,但是如果多个线程同时执行put操作,可能会导致同时向一个单链表中插入数据,从而导致数据丢失的。

所以不论是JDK 1.7 还是 1.8,HashMap线程都是不安全的,要使用线程安全的Map可以考虑ConcurrentHashMap。

Java集合:HashMap线程不安全?有哪些表现?相关推荐

  1. 【Java 集合】Java 集合的线程安全性 ( 加锁同步 | java.utils 集合 | 集合属性 | java.util.concurrent 集合 | CopyOnWrite 机制 )

    文章目录 I . Java 集合的线程安全概念 ( 加锁同步 ) II . 线程不安全集合 ( 没有并发需求 推荐使用 ) III . 集合属性说明 IV . 早期的线程安全集合 ( 不推荐使用 ) ...

  2. Java集合中线程安全的类

    集合中线程安全的类都是jdk1.1中的出现的.在jdk1.2之后,就出现许多非线程安全的类. 下面是这些线程安全的同步的类: vector:就比arraylist多了个同步化机制(线程安全),因为效率 ...

  3. 【Java】HashMap线程安全问题

    一.线程不安全的原因 jdk1.7和jdk1.8中HashMap都是线程不安全的,那就具体讲一下为什么会线程不安全(两个方面). (1)调用put方法 假如有两个线程A和B,A希望插入一个key-va ...

  4. Java集合HashMap

    HashMap Map接口的一个实现类 用于存储键值对映射关系 重复键 如果,出现重复键,将覆盖原有键的Value值 package bhz.aio;import java.util.HashMap; ...

  5. Java集合——HashMap、HashTable以及ConCurrentHashMap异同比较

    转发:https://www.cnblogs.com/zx-bob-123/archive/2017/12/26/8118074.html 0. 前言 HashMap和HashTable的区别一种比较 ...

  6. Java集合的线程安全用法

    线程安全的集合包含2个问题 1.多线程并发修改一 个 集合 怎么办? 2.如果迭代的过程中 集合 被修改了怎么办? a.一个线程在迭代,另一个线程在修改 b.在同一个线程内用同一个迭代器对象进行迭代. ...

  7. 深入java集合-HashMap

    本文为读书笔记,书籍为java并发编程的艺术 hashmap资料来自b站黑马 文章目录 1.HashMap 1.1 HashMap成员变量 问题: 为什么必须是2的n次幂?如果输入值不是2的幂比如10 ...

  8. java集合到线程的考试_成都汇智动力-Java SE考试编程题总结

    原标题:成都汇智动力-Java SE考试编程题总结 线程和进程的区别: (1)进程是运行中的程序,拥有自己独立的内存空间和资源; (2)一个进程可以有一个或多个线程组成,且至少有一个线程称为主线程; ...

  9. Java集合—HashMap底层原理

    原文链接:最通俗易懂搞定HashMap的底层原理 HashMap的底层原理面试必考题.为什么面试官如此青睐这道题?HashMap里面涉及了很多的知识点,可以比较全面考察面试者的基本功,想要拿到一个好o ...

  10. 分析了解JDK1.8版本的Java集合HashMap的put()方法

    hashMap是java最常用的Key-Value形式的集合.了解其原理和底层代码是很有必要的,今天就记录下对HashMap的.put()方法的研究分析(元素添加方法): 先说下个人研究分析结果: H ...

最新文章

  1. linux @webserviceclient 访问超时_Linux系统调优
  2. Android的ImageView背后的绘制原理
  3. python怎么读excel文件-python如何读写excel文件
  4. 优步CEO是混蛋吗?
  5. 速卖通新手入驻必须了解的“9大知识点”
  6. bat怎么获取前一天 的日期_bat脚本 得到前一天的日期
  7. jsp连接mysql数据库代码_JSP连接MySQL数据库代码
  8. 一文剖析区块链现状:丛林法则下的胜者
  9. linux 设置java内存大小_Linux 下修改Tomcat使用的JVM内存大小
  10. TOSCA自动化测试工具视频资料
  11. np.random.uniform,random,choice,newaxis
  12. 【数学基础】机器学习与深度学习中的数学知识
  13. FISCO BCOS 数据结构与编码协议 交易结构 区块结构
  14. Java基础(一):Java集合框架(超详细解析,看完面试不再怕)
  15. git submodule update --init时报错:Failed to recurse into submodule path third_party/protobuf
  16. python日历教程_基于python实现简单日历
  17. windows 10(64位) 本地模式安装Hadoop和Hbase
  18. 用crontab每隔1分钟执行一个命令行脚本
  19. 渗透测试实战指南笔记
  20. 新绝代双骄3终极全攻略2

热门文章

  1. linux关闭在线登录用户
  2. 使用maven编译YCSB0.1.4对cassandra进行性能测试
  3. C#通用类库--设置开机自运行禁用任务管理器注册表等操作
  4. 基于USES_CONVERSION的W2A用法之CString转char
  5. 使用ffmpeg循环推流(循环读取视频文件)推送RTMP服务器的方法
  6. 什么是视频编码(Codec)?
  7. html——黑体、斜体、下划线及删除线
  8. GPU视频解码之CUVID
  9. MySQL python update 语句
  10. wince支持多线程编程吗_以前面试只问多线程,现在都开始问响应式编程了!我懵了...