Java HashMap的工作原理 及各种Map区别
2019独角兽企业重金招聘Python工程师标准>>>
一、Java HashMap的工作原理
jdk1.7下HashMap数据结构:数组加链表,链表长度没有8的限制;
jdk1.8 HashMap数据结构:数组+链表+红黑树;链表超过8会转存为红黑树;
1.jdk1.8 中HashMap的put工作原理:
1)、对key做null检查。如果key是null,会被存储到table[0],因为null的hash值总是0。
2)、判断当前桶是否为空,空的就需要初始化(resize 中会判断是否进行初始化)
给定的默认容量为 16,负载因子为 0.75。Map 在使用过程中不断的往里面存放数据,当数量达到了 16 * 0.75 = 12 就需要将当前 16 的容量进行扩容,而扩容这个过程涉及到 rehash、复制数据等操作,所以非常消耗性能。
3)、获取key的hashCode值(可以理解为内存地址位置,如:3254239),并对该32位hashCode值进行高低16位的异或运算;得到hash值(如:3812);(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
4)、将获取到的hash值进行一个求模运算(相当于3812%16),得到该key对应的索引位置;if ((p = tab[i = (n - 1) & hash]) == null);该位置肯定不会超过16位;
5)、根据当前 key 的 hashcode 定位到具体的桶中并判断是否为空,为空表明没有 Hash 冲突就直接在当前位置创建一个新桶即可。
6)、如果当前桶有值( Hash 冲突),那么就要比较当前桶中的 key、key 的 hashcode 与写入的 key 是否相等,相等就赋值给 e,在第 8 步的时候会统一进行赋值及返回。
7)、如果当前桶为红黑树,那就要按照红黑树的方式写入数据。
8)、如果是个链表,就需要将当前的 key、value 封装成一个新节点写入到当前桶的后面(形成链表)。
9)、接着判断当前链表的大小是否大于预设的阈值,大于时就要转换为红黑树。
10)、如果在遍历过程中找到 key 相同时直接退出遍历。
11)、如果 e != null 就相当于存在相同的 key,那就需要将值覆盖。
12)、最后判断是否需要进行扩容。
2.jdk1.8 中HashMap的get工作原理:
1)、计算hash部分跟put相同;
2)、首先将 key hash 之后取得所定位的桶。
3)、如果桶为空则直接返回 null 。
4)、否则判断桶的第一个位置(有可能是链表、红黑树)的 key 是否为查询的 key,是就直接返回 value。
5)、如果第一个不匹配,则判断它的下一个是红黑树还是链表。
6)、红黑树就按照树的查找方式返回值。
7)、不然就按照链表的方式遍历匹配返回值。
问题1:HashMap为何要进行hash计算?hash函数是怎么运算的?
尽量让node落点分布均匀,减少碰撞的一个概率,如果碰撞概率高了,就势必导致数组下标下的链表长度太长;
运算方式:将获取到的32位hash值,分成高16位和低16位,再将高16位移到低16位进行异或运算;
32位:3254239,通过异或运算后,3812,
table[3812]越界,再做个求模运算3812%16=,一定不会超过16位;hash%n===(n-1)&hash,速度快,效率高;
问题2:数组扩容,2倍扩容;为什么是2的N次幂;就是因为hash算法这(n-1)&hash;要符合这算法;必须是这样;
resize()方法中的扩容:newThr = oldThr << 1; // double threshold
问题3:但是 HashMap 原有的问题也都存在,比如在并发场景下使用时容易出现死循环。
HashMap 扩容的时候会调用 resize() 方法,就是这里的并发操作容易在一个桶上形成环形链表;这样当获取一个不存在的 key 时,计算出的 index 正好是环形链表的下标就会出现死循环。
二、Hashtable、LinkedHashMap、TreeMap、SortedMap、WeakHashMap、IdentityHashMap、ConcurrentHashMap的区别:
(1) HashMap与HashTable的区别:
a.Hashtable中的对象是线程安全的。而HashMap则是异步的,因此HashMap中的对象并不是线程安全的。因为同步的要求会影响执行的效率,所以如果你不需要线程安全的集合那么使用
HashMap是一个很好的选择,这样可以避免由于同步带来的不必要的性能开销,从而提高效率。
b.值:HashMap可以让你将空值作为一个表的条目的key或value,但是Hashtable是不能放入空值的。HashMap最多只有一个key值为null,但可以有无数多个value值为null。
注意:
1、用作key的对象必须实现hashCode和equals方法。
2、不能保证其中的键值对的顺序
3、尽量不要使用可变对象作为它们的key值。
(2) LinkedHashMap:
它的父类是HashMap,使用双向链表来维护键值对的次序,迭代顺序与键值对的插入顺序保持一致。LinkedHashMap需要维护元素的插入顺序,插入性能略低于HashMap,但在迭代访问元
素时有很好的性能,因为它是以链表来维护内部顺序。
(3) TreeMap和SortedMap:
Map接口派生了一个SortMap子接口,SortMap的实现类为TreeMap。TreeMap也是基于红黑树对所有的key进行排序,有两种排序方式:自然排序和定制排序。HashMap通常比TreeMap快一点(树
和哈希表的数据结构使然),建议多使用HashMap,在需要排序的Map时候才用TreeMap。
(4) WeakHashMap:
WeakHashMap与HashMap的用法基本相同,区别在于:后者的key保留对象的强引用,即只要HashMap对象不被销毁,其对象所有key所引用的对象不会被垃圾回收;WeakHashMap适合短时间内就过期的缓存时最好使用weakHashMap,它包含了一个自动调用的方法expungeStaleEntries,这样就会在值被引用后直接执行这个隐含的方法,将不用的键清除掉。
(5) IdentityHashMap类:
IdentityHashMap与HashMap基本相似,只是当两个key严格相等时,即key1==key2时,它才认为两个key是相等的 。IdentityHashMap也允许使用null,但不保证键值对之间的顺序。
(6) EnumMap类:
1、EnumMap中所有key都必须是单个枚举类的枚举值,创建EnumMap时必须显示或隐式指定它对应的枚举类。
2、EnumMap根据key的自然顺序,即枚举值在枚举类中定义的顺序,来维护键值对的次序。
3、EnumMap不允许使用null作为key值,但value可以。
(7) ConcurrentHashMap:
1.ConcurrentHashMap对整个桶数组进行了分段,而HashMap则没有
2.ConcurrentHashMap在每一个分段上都用锁进行保护,从而让锁的粒度更精细一些,并发性能更好,而HashMap没有锁机制,不是线程安全的。
ConcurrentHashMap如何进行扩容的?
当往hashMap中成功插入一个key/value节点时,有可能触发扩容动作:
1、如果新增节点之后,所在链表的元素个数达到了阈值 8,则会调用treeifyBin
方法把链表转换成红黑树,不过在结构转换之前,会对数组长度进行判断
如果数组长度n小于阈值MIN_TREEIFY_CAPACITY
,默认是64,则会调用tryPresize
方法把数组长度扩大到原来的两倍,并触发transfer
方法,重新调整节点的位置。
2、新增节点之后,会调用addCount方法记录元素个数,并检查是否需要进行扩容,当数组元素个数达到阈值时,会触发transfer方法,重新调整节点的位置。
三、红黑树的理解?
红黑树是一种自平衡二叉查找树,红黑树是一种很有意思的平衡检索树;每次插入的时候都要进行计算,保证二叉树的平衡;如果有2的N次方数据量级,查询的时候只需要查询N次即可。
我们对任何有效的红黑树加以如下增补要求:
1.节点是红色或黑色。
2.根是黑色。
3.所有叶子(外部节点)都是黑色。
4.每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)
5.从每个叶子到根的所有路径都包含相同数目的黑色节点。
这些约束强制了红黑树的关键属性: 从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。
转载于:https://my.oschina.net/u/2322635/blog/393691
Java HashMap的工作原理 及各种Map区别相关推荐
- HashMap的工作原理
HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...
- HashMap的工作原理及其相关的知识点
2019独角兽企业重金招聘Python工程师标准>>> 先来些简单的问题 "你用过HashMap吗?" "什么是HashMap?你为什么用到它?&quo ...
- HashMap的工作原理--重点----数据结构示意图的理解
HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道HashTable和HashMap之间的区别,那么为何这道面试题如此 ...
- 阿里P7级别架构师教你HashMap的工作原理
HashMap的工作原理是近年来常见的Java面试题.几乎每个Java程序员都知道HashMap,都知道哪里要用HashMap,知道Hashtable和HashMap之间的区别,那么为何这道面试题如此 ...
- java gc的工作原理、如何优化GC的性能、如何和GC进行有效的交互
java gc的工作原理.如何优化GC的性能.如何和GC进行有效的交互 一个优秀的Java 程序员必须了解GC 的工作原理.如何优化GC的性能.如何和GC进行有效的交互,因为有一些应用程序对性能要求较 ...
- Java执行引擎工作原理:方法调用
Java执行引擎工作原理:方法调用 方法调用如何实现 函数指针和指针函数 CallStub源码详解 Git链接(有HotSpot源码) 1 方法调用如何实现 计算机核心三大功能:方法调用.取指.运算 ...
- HashMap的工作原理(一):Hash算法
1.什么是Hash Hash也被称为散列.哈希,对应的英文都是Hash.他们的基本原理都是把任意长度的输入,通过Hash算法变成固定长度的输出.这个映射的规则就是对应的Hash算法,而原始数据映射之后 ...
- Java 程序的工作原理
文章目录 Java 语言的主要特点 Java 体系 从源码到机器码的过程 JDK.JRE 与 JVM 是什么 字节码解释过程 Java两大核心机制之JVM Java两大核心机制之GC Java 语言的 ...
- 【源码阅读计划】浅析 Java 线程池工作原理及核心源码
[源码阅读计划]浅析 Java 线程池工作原理及核心源码 为什么要用线程池? 线程池的设计 线程池如何维护自身状态? 线程池如何管理任务? execute函数执行过程(分配) getTask 函数(获 ...
最新文章
- python四:字符串和数字
- zabbix企业应用之监控mysql 5.6版本
- 编译驱动时出现Cannot open file trace.h错误
- reactjs组件的props属性及其特点
- 【Linux网络编程】TCP网络编程中connect()、listen()和accept()三者之间的关系
- sas sql中有类似mysql的 g_SAS中的SQL
- 什么情况不能办理房产抵押贷款 房产抵押贷能贷多少?
- Android Glide图片加载框架(二)源码解析之with()
- 变形监测期末复习_材料力学复习题
- Sublime Text 2 快捷键大全
- 树形结构递归_递归和匿名函数
- 构图之法——9条构图小贴士
- SPL:self-paced learning 自步学习
- 关于若依框架多级菜单的设置
- 中国的漫威,还很遥远么
- 多种方法进行去基线处理
- 智能优化及其应用——课程设计(粒子群算法)
- 【C语言】指针终结者-初阶
- 安装黑群晖找不到局域网电脑_简单几招,教你如何隐藏电脑上的文件,保证让其他人找不到!...
- 实现页面的简繁体的切换
热门文章
- 织梦怎样调取mysql_如何实现dedecms外部数据库调用
- python什么时候用类设计_关于python:类模板的习惯用法或设计模式?
- ubuntu18 mysql5.6源码_Ubuntu 18.04 使用Systemd管理MySQL 5.6
- VB如何直接显示内存中的二进制图像数据
- VB6中给数组赋值的限制
- 在vb中使用Iphlpapi.dll获取网络信息(下)
- 银河水滴打响步态识别商用第一枪!3大产品1.35亿订单,工业视觉平台免费开放...
- 李开复发布新书《AI未来》,答技术大变革下的生存法则,LeCun纳德拉推荐
- 刚刚,李彦宏首谈Uber致命车祸,还给了一个很“特别”的评价
- 华为Mate10到底AI在哪?