一、HashSet底层实现

HashSet实现了Set接口,不允许有重复元素,因为HashSet是基于HashMap实现的,HashSet中的元素都存放在HashMap的key上面,而value中的值都是统一的一个private static final Object PRESENT = new Object();。HashSet跟HashMap一样,都是一个存放链表的数组

二、HashSet构造

HashSet底层使用HashMap来保存所有元素,更确切的说,HashSet中的元素,只是存放在了底层HashMap的key上, 而value使用一个static final的Object对象标识。因此HashSet 的实现比较简单,相关HashSet的操作,基本上都是直接调用底层HashMap的相关方法来完成。
部分源代码:

public class HashSet<E>extends AbstractSet<E>implements Set<E>, Cloneable, java.io.Serializable
{static final long serialVersionUID = -5024744406713321676L;//很容易看出底层是hashmap实现private transient HashMap<E,Object> map;private static final Object PRESENT = new Object();public HashSet() {map = new HashMap<>();}public HashSet(Collection<? extends E> c) {map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));addAll(c);}public HashSet(int initialCapacity, float loadFactor) {map = new HashMap<>(initialCapacity, loadFactor);}public HashSet(int initialCapacity) {map = new HashMap<>(initialCapacity);}HashSet(int initialCapacity, float loadFactor, boolean dummy) {map = new LinkedHashMap<>(initialCapacity, loadFactor);}... ...
}

主要方法:

三、HashSet和HashMap的区别在这里插入代码片

四、TreeSet底层实现

TreeSet底层采用NavigableMap这个接口来保存TreeSet集合,而实际上NavigableMap只是一个接口,实际上TreeSet还是用TreeMap来保存set元素。
TreeSet初始化的时候会new 一个TreeMap进行初始化
部分代码:

public class TreeSet<E> extends AbstractSet<E>implements NavigableSet<E>, Cloneable, java.io.Serializable
{private transient NavigableMap<E,Object> m;private static final Object PRESENT = new Object();TreeSet(NavigableMap<E,Object> m) {this.m = m;}public TreeSet() {this(new TreeMap<E,Object>());}......}

五、TreeSet和TreeMap

之所以把TreeSet和TreeMap放在一起讲解,是因为二者在Java里有着相同的实现,前者仅仅是对后者做了一层包装,也就是说TreeSet里面有一个TreeMap(适配器模式)**。因此本段将重点分析TreeMap。 Java TreeMap实现了SortedMap接口,也就是说会按照key的大小顺序对Map中的元素进行排序,key大小的评判可以通过其本身的自然顺序(natural ordering),也可以通过构造时传入的比较器(Comparator)。 TreeMap底层通过红黑树(Red-Black tree)实现,也就意味着containsKey(), get(), put(), remove()都有着log(n)的时间复杂度。其具体算法实现参照了《算法导论》。

出于性能原因,TreeMap是非同步的(not synchronized),如果需要在多线程环境使用,需要程序员手动同步;或者通过如下方式将TreeMap包装成(wrapped)同步的:

SortedMap m = Collections.synchronizedSortedMap(new TreeMap(...));

红黑树是一种近似平衡的二叉查找树,它能够确保任何一个节点的左右子树的高度差不会超过二者中较低那个的一陪。具体来说,红黑树是满足如下条件的二叉查找树(binary search tree):

  • 每个节点要么是红色,要么是黑色。
  • 根节点必须是黑色
  • 红色节点不能连续(也即是,红色节点的孩子和父亲都不能是红色)。
  • 对于每个节点,从该点至null(树尾端)的任何路径,都含有相同个数的黑色节点。

在树的结构发生改变时(插入或者删除操作),往往会破坏上述条件3或条件4,需要通过调整使得查找树重新满足红黑树的约束条件。

  1. 预备知识(左旋,右旋)

前文说到当查找树的结构发生改变时,红黑树的约束条件可能被破坏,需要通过调整使得查找树重新满足红黑树的约束条件。调整可以分为两类: 一类是颜色调整,即改变某个节点的颜色;另一类是结构调整,集改变检索树的结构关系。结构调整过程包含两个基本操作** :
左旋(Rotate Left),右旋(RotateRight)**。

  • 左旋的过程是将x的右子树绕x逆时针旋转,使得x的右子树成为x的父亲,同时修改相关节点的引用。旋转之后,二叉查找树的属性仍然满足。

TreeMap中左旋代码如下:

//Rotate Left
private void rotateLeft(Entry<K,V> p) {if (p != null) {Entry<K,V> r = p.right;p.right = r.left;if (r.left != null)r.left.parent = p;r.parent = p.parent;if (p.parent == null)root = r;else if (p.parent.left == p)p.parent.left = r;elsep.parent.right = r;r.left = p;p.parent = r;}
}
  • 右旋的过程是将x的左子树绕x顺时针旋转,使得x的左子树成为x的父亲,同时修改相关节点的引用。旋转之后,二叉查找树的属性仍然满足。
  • TreeMap中右旋代码如下:
 //Rotate Right
private void rotateRight(Entry<K,V> p) {if (p != null) {Entry<K,V> l = p.left;p.left = l.right;if (l.right != null) l.right.parent = p;l.parent = p.parent;if (p.parent == null)root = l;else if (p.parent.right == p)p.parent.right = l;else p.parent.left = l;l.right = p;p.parent = l;}
}
  1. 寻找节点后继

对于一棵二叉查找树,给定节点t,其后继(树中比大于t的最小的那个元素)可以通过如下方式找到:

  • t的右子树不空,则t的后继是其右子树中最小的那个元素。
  • t的右孩子为空,则t的后继是其第一个向左走的祖先。

后继节点在红黑树的删除操作中将会用到。

TreeMap中寻找节点后继的代码如下:

// 寻找节点后继函数successor()
static <K,V> TreeMap.Entry<K,V> successor(Entry<K,V> t) {if (t == null)return null;else if (t.right != null) {// 1. t的右子树不空,则t的后继是其右子树中最小的那个元素Entry<K,V> p = t.right;while (p.left != null)p = p.left;return p;} else {// 2. t的右孩子为空,则t的后继是其第一个向左走的祖先Entry<K,V> p = t.parent;Entry<K,V> ch = t;while (p != null && ch == p.right) {ch = p;p = p.parent;}return p;}
}
  1. 方法剖析
  • get()
  • get(Object key)方法根据指定的key值返回对应的value,该方法调用了getEntry(Object key)得到相应的entry,然后返回entry.value。因此getEntry()是算法的核心。算法思想是根据key的自然顺序(或者比较器顺序)对二叉查找树进行查找,直到找到满足k.compareTo(p.key) == 0的entry。

具体代码如下:

  //getEntry()方法
final Entry<K,V> getEntry(Object key) {......if (key == null)//不允许key值为nullthrow new NullPointerException();Comparable<? super K> k = (Comparable<? super K>) key;//使用元素的自然顺序Entry<K,V> p = root;while (p != null) {int cmp = k.compareTo(p.key);if (cmp < 0)//向左找p = p.left;else if (cmp > 0)//向右找p = p.right;elsereturn p;}return null;
}
  • put()
    put(K key, V value)方法是将指定的key, value对添加到map里。该方法首先会对map做一次查找,看是否包含该元组,如果已经包含则直接返回,查找过程类似于getEntry()方法;如果没有找到则会在红黑树中插入新的entry,如果插入之后破坏了红黑树的约束条件,还需要进行调整(旋转,改变某些节点的颜色)。
 public V put(K key, V value) {......int cmp;Entry<K,V> parent;if (key == null)throw new NullPointerException();Comparable<? super K> k = (Comparable<? super K>) key;//使用元素的自然顺序do {parent = t;cmp = k.compareTo(t.key);if (cmp < 0) t = t.left;//向左找else if (cmp > 0) t = t.right;//向右找else return t.setValue(value);} while (t != null);Entry<K,V> e = new Entry<>(key, value, parent);//创建并插入新的entryif (cmp < 0) parent.left = e;else parent.right = e;fixAfterInsertion(e);//调整size++;return null;
}

上述代码的插入部分并不难理解: 首先在红黑树上找到合适的位置,然后创建新的entry并插入(当然,新插入的节点一定是树的叶子)。难点是调整函数fixAfterInsertion(),前面已经说过,调整往往需要1.改变某些节点的颜色,2.对某些节点进行旋转。

调整函数fixAfterInsertion()的具体代码如下,其中用到了上文中提到的rotateLeft()和rotateRight()函数。通过代码我们能够看到,情况2其实是落在情况3内的。情况4~情况6跟前三种情况是对称的,因此图解中并没有画出后三种情况,读者可以参考代码自行理解。

//红黑树调整函数fixAfterInsertion()
private void fixAfterInsertion(Entry<K,V> x) {x.color = RED;while (x != null && x != root && x.parent.color == RED) {if (parentOf(x) == leftOf(parentOf(parentOf(x)))) {Entry<K,V> y = rightOf(parentOf(parentOf(x)));if (colorOf(y) == RED) {setColor(parentOf(x), BLACK);              // 情况1setColor(y, BLACK);                        // 情况1setColor(parentOf(parentOf(x)), RED);      // 情况1x = parentOf(parentOf(x));                 // 情况1} else {if (x == rightOf(parentOf(x))) {x = parentOf(x);                       // 情况2rotateLeft(x);                         // 情况2}setColor(parentOf(x), BLACK);              // 情况3setColor(parentOf(parentOf(x)), RED);      // 情况3rotateRight(parentOf(parentOf(x)));        // 情况3}} else {Entry<K,V> y = leftOf(parentOf(parentOf(x)));if (colorOf(y) == RED) {setColor(parentOf(x), BLACK);              // 情况4setColor(y, BLACK);                        // 情况4setColor(parentOf(parentOf(x)), RED);      // 情况4x = parentOf(parentOf(x));                 // 情况4} else {if (x == leftOf(parentOf(x))) {x = parentOf(x);                       // 情况5rotateRight(x);                        // 情况5}setColor(parentOf(x), BLACK);              // 情况6setColor(parentOf(parentOf(x)), RED);      // 情况6rotateLeft(parentOf(parentOf(x)));         // 情况6}}}root.color = BLACK;
}
  • remove()

remove(Object key)的作用是删除key值对应的entry,该方法首先通过上文中提到的getEntry(Object key)方法找到key值对应的entry,然后调用deleteEntry(Entry<K,V> entry)删除对应的entry。由于删除操作会改变红黑树的结构,有可能破坏红黑树的约束条件,因此有可能要进行调整。 getEntry()函数前面已经讲解过,这里重点放deleteEntry()上,该函数删除指定的entry并在红黑树的约束被破坏时进行调用fixAfterDeletion(Entry<K,V> x)进行调整。 由于红黑树是一棵增强版的二叉查找树,红黑树的删除操作跟普通二叉查找树的删除操作也就非常相似,唯一的区别是红黑树在节点删除之后可能需要进行调整。现在考虑一棵普通二叉查找树的删除过程,可以简单分为两种情况:

  • 删除点p的左右子树都为空,或者只有一棵子树非空。
  • 删除点p的左右子树都非空。

对于上述情况1,处理起来比较简单,直接将p删除(左右子树都为空时),或者用非空子树替代p(只有一棵子树非空时);对于情况2,可以用p的后继s(树中大于x的最小的那个元素)代替p,然后使用情况1删除s(此时s一定满足情况1.可以画画看)。
基于以上逻辑,红黑树的节点删除函数deleteEntry()代码如下:

 // 红黑树entry删除函数deleteEntry()
private void deleteEntry(Entry<K,V> p) {modCount++;size--;if (p.left != null && p.right != null) {// 2. 删除点p的左右子树都非空。Entry<K,V> s = successor(p);// 后继p.key = s.key;p.value = s.value;p = s;}Entry<K,V> replacement = (p.left != null ? p.left : p.right);if (replacement != null) {// 1. 删除点p只有一棵子树非空。replacement.parent = p.parent;if (p.parent == null)root = replacement;else if (p == p.parent.left)p.parent.left  = replacement;elsep.parent.right = replacement;p.left = p.right = p.parent = null;if (p.color == BLACK)fixAfterDeletion(replacement);// 调整} else if (p.parent == null) {root = null;} else { // 1. 删除点p的左右子树都为空if (p.color == BLACK)fixAfterDeletion(p);// 调整if (p.parent != null) {if (p == p.parent.left)p.parent.left = null;else if (p == p.parent.right)p.parent.right = null;p.parent = null;}}
}

上述代码中占据大量代码行的,是用来修改父子节点间引用关系的代码,其逻辑并不难理解。下面着重讲解删除后调整函数fixAfterDeletion()。首先请思考一下,删除了哪些点才会导致调整?只有删除点是BLACK的时候,才会触发调整函数,因为删除RED节点不会破坏红黑树的任何约束,而删除BLACK节点会破坏规则4。 跟上文中讲过的fixAfterInsertion()函数一样,这里也要分成若干种情况。记住,无论有多少情况,具体的调整操作只有两种: 1.改变某些节点的颜色,2.对某些节点进行旋转。

上述图解的总体思想是: 将情况1首先转换成情况2,或者转换成情况3和情况4。当然,该图解并不意味着调整过程一定是从情况1开始。通过后续代码我们还会发现几个有趣的规则: a).如果是由情况1之后紧接着进入的情况2,那么情况2之后一定会退出循环(因为x为红色);b).一旦进入情况3和情况4,一定会退出循环(因为x为root)。 删除后调整函数fixAfterDeletion()的具体代码如下,其中用到了上文中提到的rotateLeft()和rotateRight()函数。通过代码我们能够看到,情况3其实是落在情况4内的。情况5~情况8跟前四种情况是对称的,因此图解中并没有画出后四种情况,读者可以参考代码自行理解。

private void fixAfterDeletion(Entry<K,V> x) {while (x != root && colorOf(x) == BLACK) {if (x == leftOf(parentOf(x))) {Entry<K,V> sib = rightOf(parentOf(x));if (colorOf(sib) == RED) {setColor(sib, BLACK);                   // 情况1setColor(parentOf(x), RED);             // 情况1rotateLeft(parentOf(x));                // 情况1sib = rightOf(parentOf(x));             // 情况1}if (colorOf(leftOf(sib))  == BLACK &&colorOf(rightOf(sib)) == BLACK) {setColor(sib, RED);                     // 情况2x = parentOf(x);                        // 情况2} else {if (colorOf(rightOf(sib)) == BLACK) {setColor(leftOf(sib), BLACK);       // 情况3setColor(sib, RED);                 // 情况3rotateRight(sib);                   // 情况3sib = rightOf(parentOf(x));         // 情况3}setColor(sib, colorOf(parentOf(x)));    // 情况4setColor(parentOf(x), BLACK);           // 情况4setColor(rightOf(sib), BLACK);          // 情况4rotateLeft(parentOf(x));                // 情况4x = root;                               // 情况4}} else { // 跟前四种情况对称Entry<K,V> sib = leftOf(parentOf(x));if (colorOf(sib) == RED) {setColor(sib, BLACK);                   // 情况5setColor(parentOf(x), RED);             // 情况5rotateRight(parentOf(x));               // 情况5sib = leftOf(parentOf(x));              // 情况5}if (colorOf(rightOf(sib)) == BLACK &&colorOf(leftOf(sib)) == BLACK) {setColor(sib, RED);                     // 情况6x = parentOf(x);                        // 情况6} else {if (colorOf(leftOf(sib)) == BLACK) {setColor(rightOf(sib), BLACK);      // 情况7setColor(sib, RED);                 // 情况7rotateLeft(sib);                    // 情况7sib = leftOf(parentOf(x));          // 情况7}setColor(sib, colorOf(parentOf(x)));    // 情况8setColor(parentOf(x), BLACK);           // 情况8setColor(leftOf(sib), BLACK);           // 情况8rotateRight(parentOf(x));               // 情况8x = root;                               // 情况8}}}setColor(x, BLACK);
}
  1. TreeSet

前面已经说过TreeSet是对TreeMap的简单包装,对TreeSet的函数调用都会转换成合适的TreeMap方法,因此TreeSet的实现非常简单。这里不再赘述。

 // TreeSet是对TreeMap的简单包装
public class TreeSet<E> extends AbstractSet<E>implements NavigableSet<E>, Cloneable, java.io.Serializable
{......private transient NavigableMap<E,Object> m;// Dummy value to associate with an Object in the backing Mapprivate static final Object PRESENT = new Object();public TreeSet() {this.m = new TreeMap<E,Object>();// TreeSet里面有一个TreeMap}......public boolean add(E e) {return m.put(e, PRESENT)==null;}......
}
  1. 总结:
    TreeMap 是 Map 接口的常用实现类,TreeSet 是 Set 接口的常用实现类。
    虽然 TreeMap 和TreeSet 实现的接口规范不同,但 TreeSet 底层是通过 TreeMap 来实现的(如同HashSet底层是是通过HashMap来实现的一样),因此二者的实现方式完全一样。与HashSet完全类似,TreeSet里面绝大部分方法都是直接调用TreeMap方法来实现的而 TreeMap采用“红黑树”保存Map中的每个Entry——每个Entry都被当做红黑树的一个节点来对待TreeMap的插入就是一个“排序二叉树”算法:每当程序添加新节点时,总是从树的根节点开始比较,即将根节点当成当前节点,如果新增节点大于当前节点且当前节点的右节点存在,则以右节点作为当前节点;如果新增节点小于当前节点且当前节点的左节点存在,则以左节点作为当前节点;如果新增节点等于当前节点,则新增节点覆盖当前节点;直到某个节点的左右节点不存在,并结束循环;将新增的节点作为该节点的子节点,如果新增的节点大于该节点,则添加成该节点的右节点,如果新增的节点小于该节点,则添加成该节点的左节点。

相同点:

1、都是有序集合
2、TreeMap是TreeSet的底层结构
3、运行速度都比hash慢

不同点:

1、TreeSet只存储一个对象,而TreeMap存储两个对象Key和Value(仅仅key对象有序)
2、TreeSet中不能有重复对象,而TreeMap中可以存在
3、TreeMap的底层采用红黑树的实现,完成数据有序的插入,排序。

HashSet、TreeSet、TreeMap实现原理相关推荐

  1. HashMap,HashTable,TreeMap,HashSet,TreeSet

    注意:最好先看一下(三)中 树红黑树的数据结构分析,可以的话数组,链表的数据结构也先复习一下,这里默认你懂数组,链表 2.2 map Map 是一种把键对象和值对象映射的集合,它的每一个元素都包含一对 ...

  2. hashSet与treeSet的去重原理

    hashSet与treeSet的去重原理 1.TreeSet去重原理 :compareTo 可以实现排序及去重:如果compareTo返回0,说明是重复的,返回的是自己的某个属性和另一个对象的某个属性 ...

  3. Set集合[HashSet,TreeSet,LinkedHashSet],Map集合[HashMap,HashTable,TreeMap]

    ------------ Set ------------------- 有序: 根据添加元素顺序判定, 如果输出的结果和添加元素顺序是一样 无序: 根据添加元素顺序判定,如果输出的结果和添加元素的顺 ...

  4. 集合深度学习07—Set、HashSet、LinkedHashSet、TreeSet、 底层原理 源码解析

    一.Set接口 特点: 唯一 无序(相对List接口部分来说的,无序不等于随机) 没有索引相关的方法 遍历方式: 迭代器 增强 for 循环(底层还是 Itr 迭代器) 二.HashSet 1. Ha ...

  5. Java容器---Set: HashSet TreeSet LinkedHashSet

    1.Set接口概述        Set 不保存重复的元素(如何判断元素相同呢?).如果你试图将相同对象的多个实例添加到Set中,那么它就会阻止这种重复现象. Set中最常被使用的是测试归属性,你可以 ...

  6. HashSet,TreeSet和LinkedHashSet的区别

    Set接口 Set不允许包含相同的元素,如果试图把两个相同元素加入同一个集合中,add方法返回false. Set判断两个对象相同不是使用==运算符,而是根据equals方法.也就是说,只要两个对象用 ...

  7. java hashset 实现_HashSet实现原理分析(Java源码剖析)

    本文将深入讨论HashSet实现原理的源码细节.在分析源码之前,首先我们需要对HashSet有一个基本的理解. HashSet只存储不同的值,set中是不会出现重复值的. HashSet和HashMa ...

  8. Java 集合HashSet TreeSet HashMap ArrayList TreeList

    1.体系结构 2.工具类: package collection;public class InnerTest {private int age;public final int getAge() { ...

  9. Set集合HashSet,TreeSet

    1.Set是Collection子接口,Set无法记住元素添加顺序,不允许重复元素,最多包含 一个 null 元素,当试图添加两个相同元素进Set集合,添加操作失败,add()方法会返回false.( ...

最新文章

  1. CentOS安装编译环境
  2. stm32 hal uart_STM32 非阻塞HAL_UART_Receive_IT解析与实际应用
  3. java -cp 引用多个包_javac编译单文件、多文件引入jar包、-cp解决无法加载主类问题...
  4. The 4+1 view model
  5. android添加删除项目,编写android计算器添加删除按钮,出现很抱歉,XX项目已停止运行。...
  6. 《南溪的目标检测学习笔记》——主干网络backbone设计的学习笔记
  7. python-九九乘法打印
  8. Python基础【day03】:文件操作(七)
  9. 程序员买房,买车,一个避不开的梗
  10. java基础学习(8)4种引用类型简析StrongReference、 SoftReference、 WeakReference 、PhantomReference
  11. 从零开始撸一个ajax框架
  12. lbochs模拟器最新版_手机模拟器电脑模拟器-bochs模拟器安卓版下载 v2.6.8-都去下载...
  13. 记录linux deploy如何进行分区安装centos7
  14. phpstudy修改mysql账户名_phpstudy怎么更改用户名
  15. ecplise插入图片太大_PPT文件太大?100M的PPT一秒变18M,这个压缩方法实在绝了
  16. 苹果开发者帐号申请流程
  17. java实现光盘摆渡_一种光盘摆渡机的制作方法
  18. 最大公约数简便算法_三种求最大公约数的方法
  19. 微信视频号视频如何下载保存?教你批量下载保存视频号视频到手机相册
  20. opencv入门—播放AVI视频

热门文章

  1. 【计算机网络】Session机制
  2. BZOJ3451 Normal 期望、点分治、NTT
  3. 自动发送邮件(整理版)
  4. Winform打砖块游戏制作step by step第5节---重构代码,利用继承多态
  5. AttributeError:module tensorflow no attribute app解决办法
  6. Win10:tensorflow-gpu安装总结
  7. CUDA并行算法系列之FFT快速卷积
  8. win10下git的配置教程
  9. C++输入输出流进制转换
  10. 详解KMP算法原理,以及完整java与C++实现