HashMap 原理详解
一、HashMap的原理详解
首先我们要知道什么是哈希表以及它的结构。在介绍哈希表之前我们需要了解并且掌握数组、链表以及红黑树的结构以及特点。
1、我们先来看一下HashMap的使用
public class Test {public static void main(String[] args) {HashMap<String, Object> maps = new HashMap<>();maps.put("name","zhao");maps.put("age", 20);maps.put("weight", "54KG");maps.put("height", "174cm");System.out.println(maps.get("name"));System.out.println(maps.get("age"));}
}
控制台输出:
从中我们可以看出来,我们可以根据name得到zhao,根据age 可以得到20。这其实就是HashMap里面的key和value,我们可以根据key得到value。
2、对HashMap中的存和取操作的原理分析
HashMap在不同的语言中的定义稍有不同,在java中,HashMap在JDK1.8之前的实现方式 数组+链表,但是在JDK1.8后对HashMap进行了 底层优化,改为了由 数组+链表+红黑树 实现,主要的目的是提高查找效率。在哈希表中进行添加,删除,查找等操作,性能十分之高,不考虑哈希冲突的情况下(后面会探讨下哈希冲突的情况),仅需一次定位即可完成,时间复杂度为O(1)
那我们需要知道在java中为什么要用数组和链表实现,以及在jdk1.8之后为什么要加上红黑树?
(1)、在jdk1.8之前:
哈希表的原理结构如图所示:
( 数组中记录的是链表头结点的地址)
1)、存储过程分析(key,value都存在链表中)
首先我们来解释一下如何将数据存到HashMap中:
maps.put(“name”,“zhao”);
数组加链表,数组里存的是对应链表头部结点的地址。通过拉链法存储数据到链表中。
在这里我们需要知道什么是散列、散列函数 和 HashCode(哈希值)
在存储的时候,将所有要存取的数据通过一个函数转为相对应的一个值,这些值是无序的、杂乱无章的,然后将转化后的一堆值比较平均的放在数组每个索引后的链表里面,这个过程就是散列;这个函数就是散列函数;转化后的值就是HashCode值。
引入散列的原因 就是避免出现数据倾斜的情况,也就是100个数据,一个数组索引后面的链表占据了90个,这就是数据倾斜,导致查询速度大大降低,所以说这是不合适的,因此引入了散列。
存储原理图:
对于一堆数据,我们会给出具体的算法(散列函数)来确定某个元素具体放在哪个数组下标的后面,因此我们一定要确定好这个算法,否则会产生数据倾斜的现象。
还有一点需要注意(重新哈希):
在存的过程中,链表的长度是有限制的,在没有达到临界点的时候,存储的时间复杂度为O(1);但当达到临界点的时候,他要进行重新哈希,这时候存储的时间复杂度变为O(n)。
2)读取分析
maps.get("name")
在读取的时候我们是根据key去获取value值,只要确定了key散列以后的哈希值,那么我们就可以找到它对应的value值。
假如我们想得到name对应的value值,首先在读取的过程中先将name通过散列函数得到散列值,根据散列值判断他在那个数组索引下标,找到数组索引下标后去遍历索引后的链表,找到对应的hashcode,进而获得value值。
读取原理图分析:
(2)、在jdk1.8之后:
java语言在jdk1.8之后对于HashMap进行优化,加上了红黑树,那么为什么要加上红黑树呢,其他二叉树结构不可以吗?之前的结构有什么缺点,加上红黑树以后做了哪些优化?我们下面来分析一下:
在1.8之前,在存储数据的时候我们规定了链表的长度不能超过多少,如果超过了这个值的话,增加数组的长度,重新进行哈希(rehash),如果要是这样的话,会大大增加时间复杂度(为O(n)),所以这样是不合适,因此我们引入了 红黑树 的结构。那为什么不引用AVL树呢,关键在于红黑树的局部平衡,而其他的二叉树可能会退化为链表,所以说也是不合适的。
根据散列函数我们将数据依次放入到哈希表中,在java中规定当某一链表的字节数大于8并且数组长度大于等于64的时候,我们便采用红黑树
进行存储,时间复杂度为O(logN),这样大大减少了查找时间。(如下图所示)
二、HashMap的注意事项
- 线程不安全(没有加锁);
- HashMap用于场景:读多写少的情况下使用(一次写入,剩下为读);HashMap经常用于读取和数据匹配的情况下。
- 在进行数据匹配的情况下,整体时间复杂度为O(n),因为单次查找为O(1),循环n次,所以为O(n)。
- 如果遇到key一样存储的时候HashMap会把value值覆盖。这时候有一种跟HashMap一样的结构Set,Set只有一个值,即Set< Integer >,并且在使用的时候不能为空,它在存储数据的时候,会先对这些数据进行去重的操作以及判断有没有这个数。
HashMap 原理详解相关推荐
- 【Java基础】HashMap原理详解
[Java基础]HashMap原理详解 HashMap的实现 1. 数组 2.线性链表 3.红黑树 3.1概述 3.2性质 4.HashMap扩容死锁 5. BATJ一线大厂技术栈 HashMap的实 ...
- HashMap原理详解(基于jdk1.8)
HashMap原理详解(基于jdk1.8) HashMap原理详解,有兴趣的同学可以看下.有错误的地方也希望大佬们能指点下. HashMap的内部存储是一个数组(bucket),数组的元素Node实现 ...
- Java集合篇:HashMap原理详解(JDK1.7及之前的版本)
(本文有关HashMap的源码都是基于JDK1.6的) 摘要: HashMap是Map族中最为常用的一种,也是 Java Collection Framework 的重要成员.本文首先给出了 Hash ...
- Java集合篇:HashMap原理详解(JDK1.8)
概述 JDK 1.8对HashMap进行了比较大的优化,底层实现由之前的"数组+链表"改为"数组+链表+红黑树",本文就HashMap的几个常用的重要方法和JD ...
- HashMap原理详解
一.hashmap简介 hashmap是Java当中一种数据结构,是一个用于存储Key-Value键值对的集合,每一个键值对也叫作Entry. 二.JDK7的HashMap 1.JDK7时HashMa ...
- Java HashMap的实现原理详解
HashMap是Java Map类型的集合类中最常使用的,本文基于Java1.8,对于HashMap的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.com/ja ...
- java源码系列:HashMap底层存储原理详解——4、技术本质-原理过程-算法-取模具体解决什么问题
目录 简介 取模具体解决什么问题? 通过数组特性,推导ascii码计算出来的下标值,创建数组非常占用空间 取模,可保证下标,在HashMap默认创建下标之内 简介 上一篇文章,我们讲到 哈希算法.哈希 ...
- Java HashSet的实现原理详解
HashSet是Java Map类型的集合类中最常使用的,本文基于Java1.8,对于HashSet的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.com/ja ...
- Java ArrayList的实现原理详解
ArrayList是Java List类型的集合类中最常使用的,本文基于Java1.8,对于ArrayList的实现原理做一下详细讲解. (Java1.8源码:http://docs.oracle.c ...
最新文章
- python测试rabbitmq的消息收发
- Ubuntu下安装Oracle11g(图文教程)
- 朱邦芬院士:我所熟悉的几位中国物理学大师的为人之本
- 本博打开方式,请详读
- 如何用python32位开发词典软件_Python如何实现字典?
- RuntimeError: Expected tensor for argument #1 ‘indices‘ to have scalar type Long; but got CUDAFloatT
- 使用BeautifulSoup爬取“0daydown”网站的信息(2)——字符编码问题解决
- 用excel制作,出入库信息管理表,动态库存表
- 初见安~这里是樱狸的博客目录~
- 傻子也能看懂的弗洛伊德算法(转)
- Android stdio调试程序闪退或者报错:xxx keeps stopping解决方案
- matlab不规则碎片拼接,一种不规则破碎单面图像快速拼接方法
- JPBC库应用之身份基加密IBE
- 微信小程序开发基础(02模板与配置)
- 【Transformers】第 5 章:微调文本分类的语言模型
- 网页版坦克大战坦克换方向原理
- AcWing 417. 不高兴的津津
- python3 tensorflow 人脸识别_tensorflow人脸识别(自己的数据集)
- 电力电子中控制器带宽的概念
- 软件批量安装,软件自动安装,一键安装合集