HashMap原理详解（基于jdk1.8）

HashMap原理详解，有兴趣的同学可以看下。有错误的地方也希望大佬们能指点下。

HashMap的内部存储是一个数组（bucket），数组的元素Node实现了Map.Entry接口（hash, key, value, next），
当next非空时候会指向定位相同的另外一个Entry。这里借用大佬一张图

HashMap容量大小、负载因子、阀值

在java api中，HashMap的容量定义为16，而阀值定义为0.75。HashMap容量大小指的是内部存储的这个数组bucket大小，负载因子为0.75。阀值=容量大小*负载因子，当数组中的entity的个数大于阀值的时候，HashMap就会进行扩容，调整为当前大小的两倍同时，初始化容量的大小也是2的次幂（大于等于设定容量的最小次幂），则bucket的大小在扩容前后都将是2的次幂（非常重要，resize时能带来极大便利）。

HashMap源码：

 /*** 初始容量大小 定义为final 必须为2的次幂*/static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16/*** 加载因子 定义为final*/static final float DEFAULT_LOAD_FACTOR = 0.75f;

为什么HashMap初始容量是16？（深入）

HashMap中有种情况称为Hash碰撞，指的是存数据的时候，两个数据值不一样，但是hashcode一样，也就是说一个hashcode对应多个值，（面试一题：hashcode相同值不一定相同，值相同hashcode一定相同），所以在HashMap中为了尽量减少hash值得碰撞，需要实现一个尽量均匀分布的hash函数。

为什么HashMap初始容量是16？

公式jdk中的：index = e.hash & (newCap - 1)

举例证明：假设是容量16

key	十进制	与初始量16的与（&）操作
admin	171271319	1010001101010110010010010111
hello	288970072	10001001110010101010101011000
name	6071694	10111001010010110001110

假设是容量10

key	十进制	二进制	与初始量16的与（&）操作
admin	171271319	1010001101010110010010010111	0001
hello	288970072	10001001110010101010101011000	1000
name	6071694	10111001010010110001110	1000

怎么样，同学们看出规律来了没，十进制结果碰撞太容易了。最终原因还是因为二进制的与运算，同位1可为1，否则为0。初始容量为16时候，十进制为（16-1=15）1111。相当于几乎只与key.hash有关了（当然除非是两个key的hash后四位都是1111就会产生碰撞了），当然2得次幂也都是行得，只不过16相对来说扩容次数会比较少，节省资源控件。其他的也是试试，比如初始量为8,5,12什么的都可以，但是16才最能减少碰撞了。当然低4位也是比较容易发生碰撞的，所以设计者在hash方法上做了手脚（看下面hash方法，在hash上使用了异或一下，节省了开支，又步骤简单）

HashMap的hash方法(混乱函数)

 static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);}

这里jdk为了保证良好的hashcode，对key进一步使用了hashcode方法。使用的是自身的高16位与低16位进行异或，进步一散列hash,其中hashcode是Object的方法，注意这里的多态使用。

key	调用hashcode()	然后位移16	hash值	下标（公式）计算	下标十进制
admin	101100001100000001101001111	10110000110	101100001100000011011001001	1001	9

图解：这图画的我好尴尬啊

HashMap的put、get

put方法引发的思考

在一个长度为16的数组中，元素到底是存储在哪里的呢。其实这个问题在hash方法里面我就解说了，获取了hash值之后，会与数组的长度作一个与操作，最终获取到的是一个低四位的二进制，如上图中的1001，最终下标就是9.
哪怕经过了hash异或，还是有可能会发生hash碰撞，那么HashMap是怎么处理这些hash值相同的元素的呢。一张比较丑的图来解释下hashmap内部的构造

以我们的角度来看，这个Map横向是数组形式，纵向是一条条链表形式，存储位置算法是根据hash(key)%len得到的，比如hash（key）=30, 30%16=14，存的位置为14下标。hash（key）=14,14%16=14，这个时候之前的30就会被挤下去，而14元素会取代链表第一个位置。30就变成了存储在第二个位置。这个就很好的解释了Node元素里面的next，指向了定位相同的一个Entity。当链表长度大于8 的时候，链表就会转换成红黑树结构（这其实是为了优化速度），时间复杂度变成了log(n)。
PUT方法源码解读

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,boolean evict) {Node<K,V>[] tab; Node<K,V> p; int n, i;//table数组为空，重新分配内存空间if ((tab = table) == null || (n = tab.length) == 0)n = (tab = resize()).length;//tab[数组下标]的值为null的时候，这个值重新初始化Node节点，并放置在这个位置if ((p = tab[i = (n - 1) & hash]) == null)tab[i] = newNode(hash, key, value, null);else {//如果这个坐标数组有数据的话Node<K,V> e; K k;//如果key相同 key的hash也相同 两个节点相等if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))e = p;//如果该节点是代表红黑树的节点，调用红黑树的插值方法else if (p instanceof TreeNode)e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);else {for (int binCount = 0; ; ++binCount) {if ((e = p.next) == null) {p.next = newNode(hash, key, value, null);//当单个桶（bucket）>=（8-1=7）的时候 调用treeifyBin转换为红黑树结构if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1sttreeifyBin(tab, hash);break;}if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))break;p = e;}}if (e != null) { // existing mapping for keyV oldValue = e.value;if (!onlyIfAbsent || oldValue == null)e.value = value;afterNodeAccess(e);return oldValue;}}++modCount;if (++size > threshold)resize();afterNodeInsertion(evict);return null;}

get方法解读

 final Node<K,V> getNode(int hash, Object key) {Node<K,V>[] tab; Node<K,V> first, e; int n; K k;if ((tab = table) != null && (n = tab.length) > 0 &&(first = tab[(n - 1) & hash]) != null) {// 判断第一个节点是不是就是需要的if (first.hash == hash && // always check first node((k = first.key) == key || (key != null && key.equals(k))))return first;if ((e = first.next) != null) {// 判断是否是红黑树if (first instanceof TreeNode)return ((TreeNode<K,V>)first).getTreeNode(hash, key);do {// 链表遍历if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k))))return e;} while ((e = e.next) != null);}}return null;}