HashMap原理详解(基于jdk1.8)
HashMap原理详解(基于jdk1.8)
HashMap原理详解,有兴趣的同学可以看下。有错误的地方也希望大佬们能指点下。
HashMap的内部存储是一个数组(bucket),数组的元素Node实现了Map.Entry接口(hash, key, value, next),
当next非空时候会指向定位相同的另外一个Entry。这里借用大佬一张图
HashMap容量大小、负载因子、阀值
在java api中,HashMap的容量定义为16,而阀值定义为0.75。HashMap容量大小指的是内部存储的这个数组bucket大小,负载因子为0.75。阀值=容量大小*负载因子,当数组中的entity的个数大于阀值的时候,HashMap就会进行扩容,调整为当前大小的两倍同时,初始化容量的大小也是2的次幂(大于等于设定容量的最小次幂),则bucket的大小在扩容前后都将是2的次幂(非常重要,resize时能带来极大便利)。
HashMap源码:
/*** 初始容量大小 定义为final 必须为2的次幂*/static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16/*** 加载因子 定义为final*/static final float DEFAULT_LOAD_FACTOR = 0.75f;
为什么HashMap初始容量是16?(深入)
HashMap中有种情况称为Hash碰撞,指的是存数据的时候,两个数据值不一样,但是hashcode一样,也就是说一个hashcode对应多个值,(面试一题:hashcode相同值不一定相同,值相同hashcode一定相同),所以在HashMap中为了尽量减少hash值得碰撞,需要实现一个尽量均匀分布的hash函数。
为什么HashMap初始容量是16?
公式jdk中的:index = e.hash & (newCap - 1)
举例证明:假设是容量16
key | 十进制 | 与初始量16的与(&)操作 |
---|---|---|
admin | 171271319 | 1010001101010110010010010111 |
hello | 288970072 | 10001001110010101010101011000 |
name | 6071694 | 10111001010010110001110 |
假设是容量10
key | 十进制 | 二进制 | 与初始量16的与(&)操作 |
---|---|---|---|
admin | 171271319 | 1010001101010110010010010111 | 0001 |
hello | 288970072 | 10001001110010101010101011000 | 1000 |
name | 6071694 | 10111001010010110001110 | 1000 |
怎么样,同学们看出规律来了没,十进制结果碰撞太容易了。最终原因还是因为二进制的与运算,同位1可为1,否则为0。初始容量为16时候,十进制为(16-1=15)1111。相当于几乎只与key.hash有关了(当然除非是两个key的hash后四位都是1111就会产生碰撞了),当然2得次幂也都是行得,只不过16相对来说扩容次数会比较少,节省资源控件。其他的也是试试,比如初始量为8,5,12什么的都可以,但是16才最能减少碰撞了。当然低4位也是比较容易发生碰撞的,所以设计者在hash方法上做了手脚(看下面hash方法,在hash上使用了异或一下,节省了开支,又步骤简单)
HashMap的hash方法(混乱函数)
static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}
这里jdk为了保证良好的hashcode,对key进一步使用了hashcode方法。使用的是自身的高16位与低16位进行异或,进步一散列hash,其中hashcode是Object的方法,注意这里的多态使用。
key | 调用hashcode() | 然后位移16 | hash值 | 下标(公式)计算 | 下标十进制 |
---|---|---|---|---|---|
admin | 101100001100000001101001111 | 10110000110 | 101100001100000011011001001 | 1001 | 9 |
图解:这图画的我好尴尬啊
HashMap的put、get
put方法引发的思考
- 在一个长度为16的数组中,元素到底是存储在哪里的呢。其实这个问题在hash方法里面我就解说了,获取了hash值之后,会与数组的长度作一个与操作,最终获取到的是一个低四位的二进制,如上图中的1001,最终下标就是9.
- 哪怕经过了hash异或,还是有可能会发生hash碰撞,那么HashMap是怎么处理这些hash值相同的元素的呢。一张比较丑的图来解释下hashmap内部的构造
以我们的角度来看,这个Map横向是数组形式,纵向是一条条链表形式,存储位置算法是根据hash(key)%len得到的,比如hash(key)=30, 30%16=14,存的位置为14下标。hash(key)=14,14%16=14,这个时候之前的30就会被挤下去,而14元素会取代链表第一个位置。30就变成了存储在第二个位置。这个就很好的解释了Node元素里面的next,指向了定位相同的一个Entity。当链表长度大于8 的时候,链表就会转换成红黑树结构(这其实是为了优化速度),时间复杂度变成了log(n)。
PUT方法源码解读
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;//table数组为空,重新分配内存空间if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//tab[数组下标]的值为null的时候,这个值重新初始化Node节点,并放置在这个位置if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);else {//如果这个坐标数组有数据的话Node<K,V> e; K k;//如果key相同 key的hash也相同 两个节点相等if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;//如果该节点是代表红黑树的节点,调用红黑树的插值方法else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {for (int binCount = 0; ; ++binCount) {if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);//当单个桶(bucket)>=(8-1=7)的时候 调用treeifyBin转换为红黑树结构if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}++modCount;if (++size > threshold)resize();afterNodeInsertion(evict);return null;}
get方法解读
final Node<K,V> getNode(int hash, Object key) {Node<K,V>[] tab; Node<K,V> first, e; int n; K k;if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {// 判断第一个节点是不是就是需要的if (first.hash == hash && // always check first node((k = first.key) == key || (key != null && key.equals(k))))return first;if ((e = first.next) != null) {// 判断是否是红黑树if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);do {// 链表遍历if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}}return null;}
HashMap原理详解(基于jdk1.8)相关推荐
- Java集合篇:HashMap原理详解(JDK1.7及之前的版本)
(本文有关HashMap的源码都是基于JDK1.6的) 摘要: HashMap是Map族中最为常用的一种,也是 Java Collection Framework 的重要成员.本文首先给出了 Hash ...
- Java集合篇:HashMap原理详解(JDK1.8)
概述 JDK 1.8对HashMap进行了比较大的优化,底层实现由之前的"数组+链表"改为"数组+链表+红黑树",本文就HashMap的几个常用的重要方法和JD ...
- 【Java基础】HashMap原理详解
[Java基础]HashMap原理详解 HashMap的实现 1. 数组 2.线性链表 3.红黑树 3.1概述 3.2性质 4.HashMap扩容死锁 5. BATJ一线大厂技术栈 HashMap的实 ...
- HashMap 原理详解
一.HashMap的原理详解 首先我们要知道什么是哈希表以及它的结构.在介绍哈希表之前我们需要了解并且掌握数组.链表以及红黑树的结构以及特点. 1.我们先来看一下HashMap的使用 public c ...
- OSPFv2原理详解(基于RFC2328)+配置介绍+RFC2328翻译
个人认为,理解报文就理解了协议.通过报文中的字段可以理解协议在交互过程中相关传递的信息,更加便于理解协议. 虽然路由器自身可以对协议做一些独特的配置,但是报文仍然是协议的核心.例如,OSPF的完全末节 ...
- Java集合篇:Hashtable原理详解(JDK1.8)
(本文使用的源码基于JDK1.8的) 一.Hashtable的基本方法: 这部分参考博客:https://blog.csdn.net/chenssy/article/details/22896871 ...
- HashMap原理详解
一.hashmap简介 hashmap是Java当中一种数据结构,是一个用于存储Key-Value键值对的集合,每一个键值对也叫作Entry. 二.JDK7的HashMap 1.JDK7时HashMa ...
- Java HashMap的实现原理详解
HashMap是Java Map类型的集合类中最常使用的,本文基于Java1.8,对于HashMap的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.com/ja ...
- 操作系统:基于页面置换算法的缓存原理详解(下)
概述: 在上一篇<操作系统:基于页面置换算法的缓存原理详解(上)>中,我们主要阐述了FIFO.LRU和Clock页面置换算法.接着上一篇说到的,本文也有三个核心算法要讲解.分别是LFU(L ...
最新文章
- 钢铁侠“变身”AI布道师?小罗伯特·唐尼这次推出一部AI科普纪录片
- 请解释一下http请求中的304状态码的含义
- backreference Oracle正則表達式中的反向引用
- 湖南工业职业技术学院计算机协会,计算机网络协会
- 关于学计算机有什么用检讨书,旷计算机课检讨书
- [python]设计模式
- 判断是否是空对象_3分钟短文 | Laravel 查询结果检查是不是空,5个方法你别用错...
- acpi_hardware_id可以通过HID/CLD/UID/CLS/method/path获得
- 互联网安全架构师培训课程 互联网安全与防御高级实战课程 基于Springboot安全解决方案
- 三菱PLC水处理程序加触摸屏程序 三菱PLC水处理程序加触摸屏程序
- 第九届蓝桥杯 乘积尾零
- CRC校验关键点说明(内附C语言CRC校验库)
- 数据库作业8:SQL练习5 - SELECT(嵌套查询EXISTS、集合查询、基于派生表的查询)
- 目标检测数据集格式转换(yolo→voc)
- 基于ATT-LSTM的语音情感分类
- android imageview 锯齿,[置顶] android 自定义圆角ImageView以及锯齿的处理
- 2021年涡阳四中高考成绩查询,振奋人心,全是省重点!高考成绩出来了,涡阳家长快来看看!...
- 使用NPOI按照word模板文件生成新的word文件
- 1608: DNA序列---复制问题 - kmp
- php无限级分类是什么意思,PHP 无限级分类(递归)