作者 | 封承成

来源 | 程序员小灰(ID:chengxuyuanxiaohui)

导语:并查集是一种精巧的算法,本身并不难理解,却很常用,在许多场景下都能找到并查集的身影。

本文作者封承成,年仅12岁,非常感谢他的投稿。

并查集是什么

并查集,是一种判断“远房亲戚”的算法。

打个比方:你身边的某个“朋友”,很有可能就是你父亲的母亲的姑妈的大姨的哥哥的表妹的孙子的女儿的父亲的孙子。如果给定这么一张“家谱”(无向图),如何判断两个顶点是不是“亲戚”呢?用人话说,就是判断一个图中两个点是否联通(两个顶点相互联通则为亲戚)。

并查集是专门用来解决这样的问题的,和搜索不同,并查集在构建图的时候同时就标记出了哪个“人”属于哪个“团伙”(一团伙中的点两两联通)。

并查集的操作

1. 初始化

并查集的思想是通过标记确定该顶点所在的组。

所以对于一个n个点,m条边的图,我们需要新建一个长度为n的数组f(可以理解为father),f[n]代表点n的团伙“代表人”,当两个点所在团伙“代表人”相同,则这两个点所在团伙相同。

而在最开始,每个顶点间都是互相不连通的,所以每个顶点单独属于一个团伙,每个顶点理所应当成为自己团伙的“代表人”,所以我们把f[n]的初始值赋为n。

2. 合并团伙

我们以连接3和1这两个点做例子:

在连接点3和点1时,3和1形成了一个团伙,而3和1的团伙代表人f[3]和f[1]就应该统一,具体是让3做代表人还是让1做代表人随便,我们让1做代表人。f[3] = 1,这条语句可以理解为让1所在团伙的代表人同时成为3所在团伙的代表人。

(箭头只是体现了f数组中“团伙成员”和“代表人”的关系,其实这个图是无向图)

可是,像f[a] = b这样合并真的对吗?请读者考虑这样一种情况。

刚刚我们合并了3和1,现在我们需要合并3和2。如果按照f[a] = b这样合并,那么,f[3]就被赋值为了2。这样,f[3]原本的值1就被覆盖了,也就是说,1和3的团伙就被硬生生地“拆散”了。

下面我们换一个例子:合并3和4。此时我们不应该令f[3] =4,应该让f[3的团伙代表人] = (4的团伙代表人),如下图。

这样,合并两个团伙的工作就完成了。总结起来就一句话:f[a的团伙代表人] = (b的团伙代表人)。

3. 查找团伙代表人

紧接着,又一个问题浮出水面:根据上面的公式f[a的团伙代表人] = (b的团伙代表人),可是a、b的团伙代表人怎么求?是f[a]吗?不不不,这里的情况变得复杂了。大家再次考虑一种特殊情况。

在这种情况下,3的团伙代表人是谁?1还是4?正确答案是4。因为,一个团伙中每一个点都直接或间接地“指向”这个团伙的代表人。(1,3,4)这个团伙中,1直接地指向4,3间接地指向4,所以4才是这个团伙里的代表人。

那么,点x的团伙代表人怎么求呢?我们会发现另一个特征,任何一个团伙的代表人a,都有f[a] = a。很好理解,团伙代表人也是团伙的一个成员,团伙代表人所在团伙的代表人就是它自己。

而对于其他点a,f[a]均不等于a。并且如果一个顶点a有f[a] ≠ a,那么这个点一定不是团伙的代表人,因为f[a]不会间接地或直接地指向a(并查集保证不会存在环)。

根据这一特性,我们可以判断点a是否为某个团伙的代表人。

在例子中,我们想要知道1是否为团伙代表人,就可以看f[1]是否等于1,很明显,f[1] = 4,所以1不是该团伙的代表人,我们要继续“追本溯源”,对5进行判断。这个过程就是一种递归的寻找过程。

知道了这个特性,我们就可以写出相应的C++代码(这里还给出了循环版的代码,根据情况使用):

int getFather(int x) {return f[x] == x ? x : getFather(f[x]);
}
int getFather(int x) {while (f[x] != x)x = f[x];return x;
}

这是一个递归函数,如果f[x] = x,说明这个点已经是该团伙的代表人,直接返回就好了,如果它不是该团伙的代表人,那么就返回自己指向的点的团伙代表人。

在求getFather(3)时,f[3] != 3,返回getFather(f[3])也就是getFather(1);

在求getFather(1)时,f[1] != 1,返回getFather(f[1])也就是getFather(4);

在求getFather(4)时,f[4] == 4,返回4。递归结束。最后计算出3的团伙代表人是4。

4. 查询顶点是否在同一团伙

并查集的最后一种操作叫做查询,就是查询两个点是否连通(在同一团伙)。

前面已经讲了,当两个点所在团伙“代表人”相同,则这两个点所在团伙相同。判断两个点a、b在同一团伙的方法就是:

getFather(a) == getFather(b) 

5. 完整代码

const int N = 100; // 节点数量
int f[N];int init() {// 初始化for (int i=0; i<N; i++)f[i] = i;
}int getFather(int x) {// 查询所在团伙代表人return f[x]==x ? x : getFather(f[x]);
}int merge(int a, int b) {// 合并操作f[getFather(a)] = getFather(b);
}bool query(int a, int b) {// 查询操作return getFather(a) == getFather(b);
}int main() {init();merge(3, 1); // 3和1是亲戚merge(1, 4); // 1和4是亲戚cout << getFather(3) << endl; // 输出3的团伙代表人+换行cout << query(3, 1) << endl; // 输出3和1是否是亲戚+换行
}

并查集巧妙吧!我们既没有构建图,也没有构建边,自始至终只用到了f数组,又优化了时间。

不要小瞧并查集代码短,在很多时候并查集都会派上用场,比如著名的克鲁斯卡尔算法,就是通过并查集判断两个顶点是否相连的。更重要的是体会并查集的思想,用这种思想来优化代码。

更多精彩推荐
☞微软三杰
☞怎么才能快点学会Java?| 每日趣闻
☞麒麟芯片或“绝版”,华为多系列手机涨价;一加回应“刘作虎回归OPPO”;DBeaver 7.2 发布| 极客头条
☞如何在机器学习的框架里实现隐私保护?
☞窃隐私、放高利贷,输入法的骚操作真不少!
☞建行短暂上线数字货币,可用于发工资,不会替代微信和支付宝
点分享点点赞点在看

漫画:什么是 “并查集” ?相关推荐

  1. 并查集c++代码_[Leetcode 每日精选](本周主题-并查集) 547. 朋友圈

    题目难度: 中等 原题链接 今天继续来做并查集的问题, 这道题仍然比较基础, 而且也是个比较接近现实的问题了. 大家在我的公众号"每日精选算法题"中的聊天框中回复 并查集 就能看到 ...

  2. HDU1811 Rank of Tetris 拓扑排序+并查集 OR 差分约束最短路+并查集

    题目链接 题意:就是给你一堆关系,看能不能排出个确定的顺序 做法: 1. 拓扑排序+并查集 应该很容易想到的一种思路,大于小于建立单向边.对于相等的呢,就把他们缩成一个点.就用并查集缩成一个点就行了 ...

  3. HDU 2586 How far away ? LCA ---tanjar+并查集 离线算法

    tanjar算法离线求LCA的思想主要是利用并查集的思想. 求距离的话就是d[start[i]]+end[en[i]]-2*d[lca[i]]; 首先从根节点dfs,在深度遍历的回溯的过程中不断的更新 ...

  4. POJ - 2513 Colored Sticks 欧拉通路+并查集+静态树

    一开始想用map来搞,但是感觉好复杂,然后想了一下看大佬们用trie做的,感觉十分合理就敲了一发. 一开始re,数组要开到550000 只会静态的字典树,在每个根节点看是否出现过改颜色,如果没有就把该 ...

  5. 关于 并查集(union find) 算法基本原理 以及 其 在分布式图场景的应用

    二月的最后一篇水文-想写一些有意思的东西. 文章目录 环检测在图数据结构中的应用 深度/广度优先 检测环 并查集数据结构 (Union-Find) 基本概念 初始化 合并 union 查找祖先 优化1 ...

  6. 【BZOJ1015】【JSOI2008】星球大战 并查集

    题目大意 给你一张\(n\)个点\(m\)条边的无向图,有\(q\)次操作,每次删掉一个点以及和这个点相邻的边,求最开始和每次删完点后的连通块个数. \(q\leq n\leq 400000,m\le ...

  7. 并查集 HDOJ 1232 畅通工程

    题目传送门 1 /* 2 并查集(Union-Find)裸题 3 并查集三个函数:初始化Init,寻找根节点Find,连通Union 4 考察:连通边数问题 5 */ 6 #include <c ...

  8. 1013 Battle Over Cities(并查集解法)

    关于背景的介绍见1013 Battle Over Cities(图的DFS解法) DFS就是不算特定结点后数连通子图的总数,再减一.我想着那么并查集就是数不算特定节点后,集合元素(根)的个数.但是我弄 ...

  9. 并查集专题练习:好朋友(未完待续)

    有空再把题目补上 输入样例1 4 2 1 4 2 3 样例输出1 2 输入样例2 7 5 1 2 2 3 3 1 1 4 5 6 输出样例2 3 解题思路: 1. 这题放在并查集的专题后面,有查找也有 ...

最新文章

  1. 近期活动盘点:清华大学海外学者短期讲学:创新创业发展课程
  2. 你不知道的阿里人工智能:618机器人客服帮单店挣1亿
  3. 综合LSTM、transformer优势,DeepMind强化学习智能体提高数据效率
  4. Actor IM 中 WebRTC的设定
  5. 解决JBoss只能通过localhost访问不能通过IP的问题
  6. ASP.NET Web实时消息后台服务器推送技术---GoEasy
  7. zblog php 调用缩略图,缩略图插件
  8. 追影windows7 虚拟4桌面
  9. 饭局潜规则,吃饭时的最大忌讳,就是低头玩手机
  10. 航天生物计算机新能源你对哪个领域的课,写作《语言简明》课件.ppt
  11. Typed DataSet的批量操作优化
  12. iframe和response.sendRedirect()跳转到父页面的问题
  13. Dell台式计算机BIOS放电,戴尔BIOS设置电池维修笔记本电脑电池BIOS设置图形方法...
  14. 美国卡内基梅隆大学计算机排名,美国卡内基梅隆大学世界排名情况
  15. 容器化部署openvpn,访问策略配置
  16. linux ubuntu动物,[趣闻]Ubuntu各大发行版的动物代号
  17. oracle 11g 更改sid和dbname
  18. mysqlclient安装失败解决办法
  19. [经典教坛]方法总比问题多(完整版)
  20. 小型元器件介绍:瓷片电容

热门文章

  1. 清华、北大、中科院六位专家同台论道:生物智能的本质与下一代类脑AI
  2. 支付宝AI摘下视觉竞赛世界冠军,能精准区分同种类物体的细微差别
  3. AAAI 2020 | 自动化所:基于对抗视觉特征残差的零样本学习方法
  4. Facebook最新语音算法曝光!自监督语音识别,错误率低至2.43%
  5. 别把引擎当汽车:AutoML不值得……
  6. 教你如何运用可视化理解卷积神经网络(CNNs)的指南
  7. 机器学习笔试题精选(一)
  8. 干货丨人工智能、大数据领域从菜鸟到高手的晋级指南(经典长文,值得收藏)
  9. 循环神经网络(recurrent neural network)(RNN)
  10. 光遗传学离诺奖又双叒进一步!10天后谜底将揭晓 (盘点光遗传学近年来获奖记录)...