jdk1.8对hashmap的简单介绍

基于哈希表实现的Map接口。此实现提供了所有可选映射操作,并允许空值(value)和空键(key)。(HashMap类大致相当于Hashtable,只是它是线程不安全的,并且允许空值)这个类不能保证映射的顺序;特别是,它不能保证顺序随时间保持不变。

hashmap底层结构

hashmap底层由数组和链表实现(jdk1.8中当链表的长度大于8时,链表会转换成红黑树)

hashmap的初始容量和最多容量

初始容量16

 static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

最大容量 1 << 30

static final int MAXIMUM_CAPACITY = 1 << 30;// 为什么不是1 << 31,因为最左侧的一位表示符号位,容量不能为负数

为什么规定容量必须是2的n次幂

  • 加快hash计算速度
  • 均匀分布,减少hash冲突
//计算索引算法
i=(len - 1) & hash

len为数组的长度,由于len是2的n次方,(n-1)转换成2进制后全部为1.

2的n次方,可以通过位移操作来实现,可以加快hash计算速度,结合按位与计算加快数组下标的计算。例如在HashMap做扩容时,满足2的幂就是相当于每次扩容都是翻倍(就是<<1右移一位),这样扩容时在重新计算下标位置时,只有两种情况,一种是下标不变,另一种是下标变为:原下标位置+扩容前容量,这样扩容后节点移动相对较少,也可以提高性能。。

可以改善数据的均匀分布,减少hash冲突,毕竟hash冲突越大,代表数组中一个链的长度越大,这样的话会降低hashmap的性能。
其中关键代码为HashMap中的数组下标计算:i = (n - 1) & hash,该计算方法可以实现一个均匀分布。

hashmap怎么计算hash值,为什么

高16位和低16位进行异或

static final int hash(Object key) {int h;return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

主要还是为了解决hash碰撞问题。让高位和低位都参与hash值的计算

怎么指定hashmap的初始值,怎么保证输入的值是2的n次方

new HashMap<>(n);

保证输入的值是2的n次方,该算法让最高位的1后面的位全变为1

//返回大于输入参数且最近的2的整数次幂的数。比如10,则返回16// Returns a power of two size for the given target capacity.static final int tableSizeFor(int cap) {int n = cap - 1;n |= n >>> 1;n |= n >>> 2;n |= n >>> 4;n |= n >>> 8;n |= n >>> 16;return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

hashmap在什么情况下进行扩容

加载因子0.75. 如果默认容量是16,那么当元素达到16 x 0.75=12时,就会发生扩容.

static final float DEFAULT_LOAD_FACTOR = 0.75f;

为什么加载因子是0.75

在HashMap的源码中有这么一段注释

* Ideally, under random hashCodes, the frequency of
* nodes in bins follows a Poisson distribution
* (http://en.wikipedia.org/wiki/Poisson_distribution) with a
* parameter of about 0.5 on average for the default resizing
* threshold of 0.75, although with a large variance because of
* resizing granularity. Ignoring variance, the expected
* occurrences of list size k are (exp(-0.5) * pow(0.5, k) /
* factorial(k)). The first values are:
* 0:    0.60653066
* 1:    0.30326533
* 2:    0.07581633
* 3:    0.01263606
* 4:    0.00157952
* 5:    0.00015795
* 6:    0.00001316
* 7:    0.00000094
* 8:    0.00000006
* more: less than 1 in ten million

大概意思是:

在理想情况下,使用随机哈希码,在扩容阈值(加载因子)为0.75的情况下,节点出现在频率在Hash桶(表)中遵循参数平均为0.5的泊松分布。忽略方差,即X = λt,P(λt = k),其中λt = 0.5的情况,按公式

选择0.75作为默认的加载因子,完全是时间和空间成本上寻求的一种折衷选择。

在jdk1.8中在什么情况下链表会转换成红黑树

static final int TREEIFY_THRESHOLD = 8;

jdk1.8 resize的过程

当put时,如果发现目前的bucket占用程度已经超过了Load Factor所希望的比例,那么就会发生resize。在resize的过程,简单的说就是把bucket扩充为2倍,之后重新计算index,把节点再放到新的bucket中。resize的注释是这样描述的:当超过限制的时候会resize,然而又因为我们使用的是2次幂的扩展(指长度扩为原来2倍),所以,元素的位置要么是在原位置,要么是在原位置再移动2次幂的位置。

例如我们从16扩展为32时,具体的变化如下所示:

因此元素在重新计算hash之后,因为n变为2倍,那么n-1的mask范围在高位多1bit(红色),因此新的index就会发生这样的变化:

因此,我们在扩充HashMap的时候,不需要重新计算hash,只需要看看原来的hash值新增的那个bit是1还是0就好了,是0的话索引没变,是1的话索引变成“原索引+oldCap”。可以看看下图为16扩充为32的resize示意图:

这个设计确实非常的巧妙,既省去了重新计算hash值的时间,而且同时,由于新增的1bit是0还是1可以认为是随机的,因此resize的过程,均匀的把之前的冲突的节点分散到新的bucket了。

 final Node<K,V>[] resize() {Node<K,V>[] oldTab = table;int oldCap = (oldTab == null) ? 0 : oldTab.length;int oldThr = threshold;int newCap, newThr = 0;if (oldCap > 0) {if (oldCap >= MAXIMUM_CAPACITY) {threshold = Integer.MAX_VALUE;return oldTab;}else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&oldCap >= DEFAULT_INITIAL_CAPACITY)newThr = oldThr << 1; // double threshold}else if (oldThr > 0) // initial capacity was placed in thresholdnewCap = oldThr;else {               // zero initial threshold signifies using defaultsnewCap = DEFAULT_INITIAL_CAPACITY;newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);}if (newThr == 0) {float ft = (float)newCap * loadFactor;newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?(int)ft : Integer.MAX_VALUE);}threshold = newThr;@SuppressWarnings({"rawtypes","unchecked"})Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];table = newTab;if (oldTab != null) {for (int j = 0; j < oldCap; ++j) {Node<K,V> e;if ((e = oldTab[j]) != null) {oldTab[j] = null;if (e.next == null)newTab[e.hash & (newCap - 1)] = e;else if (e instanceof TreeNode)((TreeNode<K,V>)e).split(this, newTab, j, oldCap);else { // preserve orderNode<K,V> loHead = null, loTail = null;Node<K,V> hiHead = null, hiTail = null;Node<K,V> next;do {next = e.next;if ((e.hash & oldCap) == 0) {if (loTail == null)loHead = e;elseloTail.next = e;loTail = e;}else {if (hiTail == null)hiHead = e;elsehiTail.next = e;hiTail = e;}} while ((e = next) != null);if (loTail != null) {loTail.next = null;newTab[j] = loHead;}if (hiTail != null) {hiTail.next = null;newTab[j + oldCap] = hiHead;}}}}}return newTab;}

你知道get和put的原理吗?equals()和hashCode()的都有什么作用?

通过对key的hashCode()进行hashing,并计算下标( n-1 & hash),从而获得buckets的位置。如果产生碰撞,则利用key.equals()方法去链表或树中去查找对应的节点

头插法与尾插法

jdk1.7插入元素到单链表中采用头插法,jdk1.8采用的是尾插法。

  • jdk1.7 插入链表的头部,有一种看法是新插入的数据被查询的概率比较大,插入到头部查询相对比较快. 但是在多线程环境中扩容可能会造成循环链表,导致CPU100%
  • jdk1.8 改进:采用尾插法,在扩容时不用重新计算hash值,元素索引值的变换是有规律的.

Entry与Node

  • jdk1.7 一对key,value叫做Entry
  • jdk1.8 一对key,value叫做Node

为什么要重写equals和hashCode

  • hashCode决定了Node/Entry在数组中的位置
  • equals 在元素发生碰撞时比较使用

hashmap默认使用java.lang.Object#equals 对比的是对象的地址,hashmap对象存储堆中,地址肯定不一样,所以要根据业务实现自己的equals,然而equals判断需要,然而hashmap在判断是先判断hashCode相等后才会去执行equals.

 if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k))))
....

案例

public class Name {private String first; //first nameprivate String last;  //last namepublic String getFirst() {return first;}public void setFirst(String first) {this.first = first;}public String getLast() {return last;}public void setLast(String last) {this.last = last;}public Name(String first, String last) {this.first = first;this.last = last;}@Overridepublic boolean equals(Object object) {System.out.println("equals is running...");Name name = (Name) object;return first.equals(name.getFirst()) && last.equals(name.getLast());}public static void main(String[] args) {Map<Name, String> map = new HashMap<Name, String>();Name n1 = new Name("mali", "sb");System.out.println("the hashCode of n1 : " + n1.hashCode());map.put(n1, "yes");Name n2 = new Name("mali", "sb");System.out.println("the hashCode of n2 : " + n2.hashCode());System.out.println("is the key existed? ture or false? -> "+ map.containsKey(n2));}}


原文: https://rumenz.com/rumenbiji/java-hashmap-interview.html

hashmap面试问题相关推荐

  1. 终结HashMap面试?我是谁?我在哪

    终结HashMap面试?我是谁?我在哪 鲁班大师 JAVA葵花宝典 今天 来源:https://www.cnblogs.com/zhuoqingsen/p/HashMap.html 现在是晚上11点了 ...

  2. HashMap面试连环炮

    HashMap面试连环问 1.HashMap的底层数据结构是什么? 底层数据结构是哈希表结构(链表散列:数组+单向链表),结合了数组和链表的优点,当链表长度超过8时,链表会转为红黑树.数组中的每一个元 ...

  3. 有关 HashMap 面试会问的一切

    来自:码农田小齐 本文共6666字 | 阅读需12分钟 前言 HashMap 是无论在工作还是面试中都非常常见常考的数据结构. 比如 Leetcode 第一题 Two Sum 的某种变种的最优解就是需 ...

  4. HashMap面试深入详解jdk1.8

    HashMap是Java后端工程师面试的必问题,因为其中的知识点太多,很适合用来考察面试者的Java基础.今天基于jdk1.8来研究一下HashMap的底层实现. HashMap的内部数据结构 JDK ...

  5. HashMap 面试 21 问,这次要跪了!

    21 个刁钻的 HashMap 面试题,这次要跪了! 1:HashMap 的数据结构? A:哈希表结构(链表散列:数组+链表)实现,结合数组和链表的优点.当链表长度超过 8 时,链表转换为红黑树. t ...

  6. HashMap 面试常见的6连问,你能扛得住吗?

    今日推荐 这 9 个 Java 开源项目 yyds,你知道几个?阿里技术专家推荐的20本书,免费送!K8S 部署 SpringBoot 项目(一篇够用)妙用Java 8中的 Function接口 消灭 ...

  7. 【面试题】HashMap 面试 21 问

    文章目录 1.概述 1:HashMap 的数据结构? 2:HashMap 的工作原理? 3.当两个对象的 hashCode 相同会发生什么? 4.你知道 hash 的实现吗?为什么要这样实现? 5.为 ...

  8. 史上最强HashMap面试教程

    前言 写这篇文章的目的是因为我大学四年的室友,龙哥在培训java,刚好最近学习HashMap,于是我写一篇文章来模拟他以后面试被问到HashMap的场景:另外就是因为HashMap的使用确实广泛,深受 ...

  9. Java HashMap面试须知

    前言 HashMap作为Java面试中高频出现的面试题,是面试官们最喜欢问的问题之一,通常会出现在前3道技术面试题中,主要是为了筛选不会Java的候选人,亦或者是考察候选人平时会不会看JDK源码,下面 ...

  10. 史上最全Hashmap面试总结,51道附带答案,持续更新中...

    点击上方关注 "终端研发部" 设为"星标",和你一起掌握更多数据库知识 我历经两个工作日晚上总结了50道关于hashmap的面试题,我相信,下面将会是Hashm ...

最新文章

  1. 欢庆1024之:程序猿不是你想黑,想黑就能黑!
  2. C# Sqlite数据库 基本使用方法
  3. myeclipse 8.5最新注册码(过期时间到2016年)
  4. 我们的开源项目-2013年度开源社区线下聚会《JEECG微云快速开发平台-SAAS企业应用在线开发与微信移动应用》PPT分享
  5. Bzoj 1566: [NOI2009]管道取珠(动态规划-神题)
  6. java堆栈有序无序,浅谈Java并发编程系列(四)—— 原子性、可见性与有序性
  7. 深入理解OAuth2.0协议
  8. jsf el 表达式_JSF表达式语言– JSF EL
  9. C加载JVM崩溃,一般是因为某个变量为NULL
  10. JS 数组reduce()方法详解及高级技巧
  11. setpythonhome_python的set,和字典的详细使用方法,以及部分习题
  12. c语言转化音乐格式转换器安卓版,MP3格式转换器APP
  13. 什么是网络安全网格?
  14. 我们被大数据改变着的生活
  15. 工业相机——选型及参数
  16. CentOS 路由设置
  17. 合作开发的软件著作权归谁
  18. vue+canvas实现手写签字画板
  19. DaVinci:示波器
  20. 在线编程——排序算法总结

热门文章

  1. L1-041 寻找250-PAT团体程序设计天梯赛GPLT
  2. 蓝桥杯 ALGO-73 算法训练 统计字符次数
  3. html css 圆形按钮 仿uc,10款基于jquery的web前端动画特效
  4. MD5加密 java实现
  5. MySQL 时间戳转换成秒
  6. 人生不值得,我在用python.1_关于python
  7. date命令使用文档.txt
  8. Spring Boot 设置启动时banner
  9. 字符设备驱动之Led驱动学习记录
  10. 【我们都爱Paul Hegarty】斯坦福IOS8公开课个人笔记30 ScrollView Demo实战