面试官:你能简单介绍List和Set有什么区别吗?

小憨:

  • List是一个有序的集合,在内存是连续存储的,可以存储重复的元素,List查询快,增删慢;
  • Set是一个无序的集合,在内存中不连续,不可以存储重复的元素,Set增删快,查询慢;

面试官:那HashSet是如何保证元素不重复的?

小憨:3分钟。。。


为了避免出现小憨这种知其然不知其所以然的尴尬,我们还是有必要来分析下上述问题的。

客官,且看下文

我们都知道HashSet存放的元素是不允许重复的,那么HashSet又是是如何保证元素不可重复的,你知道吗?

先看段源码

public class HashSet    extends AbstractSet    implements Set, Cloneable, java.io.Serializable{    static final long serialVersionUID = -5024744406713321676L;    private transient HashMap map;    private static final Object PRESENT = new Object();    public HashSet() {        map = new HashMap<>();    }    public HashSet(Collection extends E> c) {        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));        addAll(c);    }    public HashSet(int initialCapacity, float loadFactor) {        map = new HashMap<>(initialCapacity, loadFactor);    }}

乍一看这段代码,哎呦我去,new HashSet()操作不就不是维护了一个HashMap嘛,要是这么往下演的话,我觉得我这点功力也能看个大概呀!

诸位同仁,咱接着往下看

public boolean add(E e) {    return map.put(e, PRESENT)==null;}

什么,这不就是map操作么,瞬间我来个下饭推理;

Map中的key是不允许重复的,而你HashSet正好利用我Map中key不重复的特性来校验重复元素,妙哉妙哉。

确实,HashSet确实是利用Map的这一特性实现了元素的不重复特性,但是我们再来深挖一下,Map他又是如何来保证key不重复的呢?

与其说这篇文章是介绍HashSet如何保证元素不重复的,倒不如说Map是如何保证Key不重复的。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,                   boolean evict) {        Node[] tab; Node p; int n, i;        if ((tab = table) == null || (n = tab.length) == 0)            n = (tab = resize()).length;        // 1、如果该位置不存在,直接插入        if ((p = tab[i = (n - 1) & hash]) == null)            tab[i] = newNode(hash, key, value, null);        else {            Node e; K k;            // 2、如果存在,判断是否是重复元素            if (p.hash == hash &&                ((k = p.key) == key || (key != null && key.equals(k))))                e = p;            else if (p instanceof TreeNode)                e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);            else {                for (int binCount = 0; ; ++binCount) {                    if ((e = p.next) == null) {                        p.next = newNode(hash, key, value, null);                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st                            treeifyBin(tab, hash);                        break;                    }                    if (e.hash == hash &&                        ((k = e.key) == key || (key != null && key.equals(k))))                        break;                    p = e;                }            }            if (e != null) { // existing mapping for key                V oldValue = e.value;                if (!onlyIfAbsent || oldValue == null)                    e.value = value;                afterNodeAccess(e);                return oldValue;            }        }        ++modCount;        if (++size > threshold)            resize();        afterNodeInsertion(evict);        return null;    }

上面部分我重点圈了两段代码,分别是1和2。

第一段

if ((p = tab[i = (n - 1) & hash]) == null)

这段代码其实主要是通过hash计算该元素的位置,然后判断该位置是否有值,如果没有值,那么可以直接插入,最后返回null;

第二段

if (p.hash == hash &&                ((k = p.key) == key || (key != null && key.equals(k))))                e = p;

如果通过计算,该位置上已经有其他元素,那么接下来就会通过hash和equals进行判断,判断它是不是重复元素,如果重复元素,那么最后会将这个重复元素返回。

通过第二段代码我们可以发现,判断元素是否重复,使用的是hash和equals方法进行判断的,所有我们Set里面如果存放的是对象,那么一定要重写hash和equals方法。

现在是不是很清晰了,为啥要重写equals方法了,不会出现那么诡异的代码了,这两个对象值都一样啊,为什么Set没去重呢!

hash 值重复_面试题:HashSet是如何保证元素不重复的相关推荐

  1. 面试官:HashSet是如何保证元素不重复的?

    作者 | 磊哥 来源 | Java面试真题解析(ID:aimianshi666) 转载请联系授权(微信ID:GG_Stone) 本文已收录<Java常见面试题>系列,开源地址:https: ...

  2. python数据透视表计数去除重复_如何从pandas数据透视表中删除重复值?

    因此,我试图将excel的一组指令复制到python中.问题是我对excel和正在发生的事情知之甚少.在 我有一个数据帧:no. name corrected no. corrected name 0 ...

  3. python字符串重复_【python】判断一个字符串是否包含重复字符?

    题目:判断一个字符串是否包含重复字符.例如good则包含,abc则不包含. 分析:哈希法. code: (1) strs = 'Good' hashTable = dict() listStrs = ...

  4. 机械键盘按键重复_如何修复机械键盘上的卡住或重复键

    机械键盘按键重复 Mechanical keyboards are great! But they're also more complex than conventional keyboards. ...

  5. redis日志_面试题之Redis如何保证系统宕机数据不会丢失?

    我们都知道 Redis 的数据全部在内存里,如果突然宕机,数据就会全部丢失,因此必须有一种机制来保证 Redis 的数据不会因为故障而丢失,这种机制就是 Redis 的持久化机制. Redis 有两种 ...

  6. java list 不重复_java中如何使list集合中元素不重复

    对list集合中的重复值进行处理,大部分是采用两种方法,一种是用遍历list集合判断后赋给另一个list集合,一种是用赋给set集合再返回给list集合.不同方法在不同情况下有各自的优势. 相关免费视 ...

  7. Hash(哈希)简述 —— Hash函数、Hash值、HashTable、HashMap

    总览 - Hash(哈希.散列) Hash是一种 散列函数或方法 的统称. · 该方法就是:把任意长度的输入通过散列算法变换成固定长度的输出,该输出就是散列值.-- (散列方法) · 这种转换是一种压 ...

  8. java数组练习题---创建元素不重复的数组

    题目:创建一个8元素的数组并输出,元素在1-10之间随机生成,且不相同: 题目表面上看似简单,实际却有一个最大的难点-----如何保证元素不重复: 因为元素是随机生成的且逐一赋值的,所以就可以在这一阶 ...

  9. hash 值重复_“重复”相关的问题

    重复子串比较的核心是使用 Rabin-Karp (Rolling Hash). Rabin-Karp字符串编码的本质是对字符串进行哈希,将字符串之间的比较转化为编码之间的比较 有N个不同的字符,可以将 ...

最新文章

  1. Session 时间
  2. 《Python游戏编程快速上手》第五章--龙穴探险
  3. java动态拼接请求_在JavaWeb项目中处理静态文件或动态链接拼接网站地址的最优处理方案...
  4. 试着用React写项目-利用react-router解决跳转路由等问题(二)
  5. 从前景、待遇、入门难度分析,Java和HTML5哪个好
  6. Android ListView 实现下拉刷新上拉加载
  7. 有关电子邮箱的各种协议
  8. 夏昕.深入浅出Hibernate中的第一个例子体会.
  9. 什么是模式、什么是模式识别、模式识别的方法、过程
  10. GMQ钱包积极打造并维护区块链健康生态的发展
  11. java ireport 打印_ireport客户端打印
  12. RealWin Server HMI 漏洞复现与恶意攻击链分析
  13. hihocoder-1051,codeforces-884A(C语言+注释)
  14. windows 查找目录下文件中包含某个字符串
  15. 商家如何自己零成本免费制作点餐小程序
  16. 单双号限行微信小程序源码
  17. 如何修改Android的ro属性
  18. 10亿手机号如何去重?(BitMap)
  19. 十二、GIO GSettings
  20. day01 -云计算简介与华为云计算解决方案01

热门文章

  1. procyon java8_java jdk 8反编译工具JD-GUI、procyon-decompiler、luyten、crf下载使用简介
  2. 【OpenCV 例程200篇】11. 图像通道的拆分(cv2.split)
  3. Python 小白从零开始 PyQt5 项目实战(7)折叠侧边栏的实现
  4. java中的single_解析java泛型(一)
  5. SkyEye建模之方法介绍篇
  6. 白盒测试-条件覆盖-短路陷阱
  7. django与grpc融合的过程
  8. python 安装echarts
  9. 用python实现时间的动态(动态时钟)+ 算出某年某月星期几的所有日期
  10. 【bzoj】 1412: [ZJOI2009]狼和羊的故事