HashMap 原理详解

一、HashMap的原理详解

首先我们要知道什么是哈希表以及它的结构。在介绍哈希表之前我们需要了解并且掌握数组、链表以及红黑树的结构以及特点。

1、我们先来看一下HashMap的使用

public class Test {public static void main(String[] args) {HashMap<String, Object> maps = new HashMap<>();maps.put("name","zhao");maps.put("age", 20);maps.put("weight", "54KG");maps.put("height", "174cm");System.out.println(maps.get("name"));System.out.println(maps.get("age"));}
}

控制台输出：

从中我们可以看出来，我们可以根据name得到zhao，根据age 可以得到20。这其实就是HashMap里面的key和value，我们可以根据key得到value。

2、对HashMap中的存和取操作的原理分析

HashMap在不同的语言中的定义稍有不同，在java中，HashMap在JDK1.8之前的实现方式 数组+链表,但是在JDK1.8后对HashMap进行了底层优化,改为了由 数组+链表+红黑树 实现,主要的目的是提高查找效率。在哈希表中进行添加，删除，查找等操作，性能十分之高，不考虑哈希冲突的情况下（后面会探讨下哈希冲突的情况），仅需一次定位即可完成，时间复杂度为O(1)

那我们需要知道在java中为什么要用数组和链表实现，以及在jdk1.8之后为什么要加上红黑树？
（1）、在jdk1.8之前：

哈希表的原理结构如图所示：
( 数组中记录的是链表头结点的地址）

1）、存储过程分析(key，value都存在链表中)

首先我们来解释一下如何将数据存到HashMap中：
maps.put(“name”,“zhao”);
数组加链表，数组里存的是对应链表头部结点的地址。通过拉链法存储数据到链表中。
在这里我们需要知道什么是散列、散列函数 和 HashCode（哈希值）

在存储的时候，将所有要存取的数据通过一个函数转为相对应的一个值，这些值是无序的、杂乱无章的，然后将转化后的一堆值比较平均的放在数组每个索引后的链表里面，这个过程就是散列；这个函数就是散列函数；转化后的值就是HashCode值。
引入散列的原因 就是避免出现数据倾斜的情况，也就是100个数据，一个数组索引后面的链表占据了90个，这就是数据倾斜，导致查询速度大大降低，所以说这是不合适的，因此引入了散列。

存储原理图：

对于一堆数据，我们会给出具体的算法（散列函数）来确定某个元素具体放在哪个数组下标的后面，因此我们一定要确定好这个算法，否则会产生数据倾斜的现象。

还有一点需要注意(重新哈希)：

在存的过程中，链表的长度是有限制的，在没有达到临界点的时候，存储的时间复杂度为O(1)；但当达到临界点的时候，他要进行重新哈希，这时候存储的时间复杂度变为O(n)。

2）读取分析

maps.get("name")

在读取的时候我们是根据key去获取value值，只要确定了key散列以后的哈希值，那么我们就可以找到它对应的value值。
假如我们想得到name对应的value值，首先在读取的过程中先将name通过散列函数得到散列值，根据散列值判断他在那个数组索引下标，找到数组索引下标后去遍历索引后的链表，找到对应的hashcode，进而获得value值。

读取原理图分析：

（2）、在jdk1.8之后：

java语言在jdk1.8之后对于HashMap进行优化，加上了红黑树，那么为什么要加上红黑树呢，其他二叉树结构不可以吗？之前的结构有什么缺点，加上红黑树以后做了哪些优化？我们下面来分析一下：

在1.8之前，在存储数据的时候我们规定了链表的长度不能超过多少，如果超过了这个值的话，增加数组的长度，重新进行哈希（rehash），如果要是这样的话，会大大增加时间复杂度(为O(n))，所以这样是不合适，因此我们引入了红黑树的结构。那为什么不引用AVL树呢，关键在于红黑树的局部平衡，而其他的二叉树可能会退化为链表，所以说也是不合适的。
根据散列函数我们将数据依次放入到哈希表中，在java中规定当某一链表的字节数大于8并且数组长度大于等于64的时候，我们便采用红黑树进行存储，时间复杂度为O(logN)，这样大大减少了查找时间。(如下图所示)

二、HashMap的注意事项

线程不安全（没有加锁）;
HashMap用于场景：读多写少的情况下使用（一次写入，剩下为读）；HashMap经常用于读取和数据匹配的情况下。
在进行数据匹配的情况下，整体时间复杂度为O(n)，因为单次查找为O(1)，循环n次，所以为O(n)。
如果遇到key一样存储的时候HashMap会把value值覆盖。这时候有一种跟HashMap一样的结构Set，Set只有一个值，即Set< Integer >，并且在使用的时候不能为空，它在存储数据的时候，会先对这些数据进行去重的操作以及判断有没有这个数。

HashMap 原理详解相关推荐

【Java基础】HashMap原理详解
[Java基础]HashMap原理详解 HashMap的实现 1. 数组 2.线性链表 3.红黑树 3.1概述 3.2性质 4.HashMap扩容死锁 5. BATJ一线大厂技术栈 HashMap的实 ...
HashMap原理详解（基于jdk1.8）
HashMap原理详解(基于jdk1.8) HashMap原理详解,有兴趣的同学可以看下.有错误的地方也希望大佬们能指点下. HashMap的内部存储是一个数组(bucket),数组的元素Node实现 ...
Java集合篇：HashMap原理详解（JDK1.7及之前的版本）
(本文有关HashMap的源码都是基于JDK1.6的) 摘要: HashMap是Map族中最为常用的一种,也是 Java Collection Framework 的重要成员.本文首先给出了 Hash ...
Java集合篇：HashMap原理详解（JDK1.8）
概述 JDK 1.8对HashMap进行了比较大的优化,底层实现由之前的"数组+链表"改为"数组+链表+红黑树",本文就HashMap的几个常用的重要方法和JD ...
HashMap原理详解
一.hashmap简介 hashmap是Java当中一种数据结构,是一个用于存储Key-Value键值对的集合,每一个键值对也叫作Entry. 二.JDK7的HashMap 1.JDK7时HashMa ...
Java HashMap的实现原理详解
HashMap是Java Map类型的集合类中最常使用的,本文基于Java1.8,对于HashMap的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.com/ja ...
java源码系列：HashMap底层存储原理详解——4、技术本质-原理过程-算法-取模具体解决什么问题
目录简介取模具体解决什么问题? 通过数组特性,推导ascii码计算出来的下标值,创建数组非常占用空间取模,可保证下标,在HashMap默认创建下标之内简介上一篇文章,我们讲到哈希算法.哈希 ...
Java HashSet的实现原理详解
HashSet是Java Map类型的集合类中最常使用的,本文基于Java1.8,对于HashSet的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.com/ja ...
Java ArrayList的实现原理详解
ArrayList是Java List类型的集合类中最常使用的,本文基于Java1.8,对于ArrayList的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.c ...