论文标题

Simple Contrastive Graph Clustering

论文作者、链接

作者:

Liu, Yue and Yang, Xihong and Zhou, Sihang and Liu, Xinwang

链接:https://arxiv.org/abs/2205.07865


Introduction逻辑(论文动机&现有工作存在的问题)

图学习——深度图聚类,主要分为:生成式,对抗式和对比式——这些方法通过聚类导向的损失函数来使得生成的样本拟合预先生成的聚类分布,于是初始化的簇中心对模型的影响很大——最近,由于对比学习的兴起,设计了更一致和有区别的对比损失函数来取代聚类引导的损失函数用于网络训练——对比学习的损失函数消除了初始化簇中心所带来的人工误差——然而,复杂的数据增广以及图卷积的耗时比较大,使得这些方法的效率比较低下

为了解决上述问题,本文提出了(Simple Contrastive Graph Clustering ,SCGC)方法,从网络架构、数据增广、目标函数的方面来改进聚类能力。网络架构方面,使用孪生网络,由MLP构成。网络训练前独立进行邻域信息聚合过程。这个过程中过滤了高频的噪音,提高了模型的效果以及训练效率。对于数据增广,抛弃了构建相同节点的不同视图,改为使用两个参数不共享的孪生编码器,并且用高斯噪音对节点嵌入进行扰动。本文还是设计了一个面向邻居的对比目标函数,迫使跨视图相似性矩阵去逼近自环邻接矩阵,如此一来使得模型可以保持跨视图一致性。

论文核心创新点

提出了一个简单有效的对比深度图聚类模型

新的数据增广方法

新的面向邻居的对比目标函数


相关工作

深度图聚类

对比深度图聚类


论文方法

标识与问题定义

代表个节点共分为个类别的集合,代表边的集合。以及分别代表特征矩阵和初始的邻接矩阵。代表一个无向图。度矩阵表示为以及。图拉普拉斯矩阵定义为。在GCN中,使用一个重新归一化的技巧,即,对称归一化图拉普拉斯矩阵定义为

深度图聚类的目标是将图中的结点一无监督的方式分配到一系列不相邻的组。具体来说,就是以一种无监督的方式去训练一个神经网络,通过探索结点的特征以及结构信息来对结点进行编码,即。其中,分布代表特征矩阵和原始的邻接矩阵。此外,是学到的结点嵌入,其中是样本的个数,是特征维度。然后,一个聚类算法,比如K-means,谱聚类,聚类神经网络,用来将学到的结点嵌入分到个不相邻的组,即,其中表示对于所有的个结点的簇隶属度矩阵

全局框架

低通降噪操作Low-pass Denoising Operation

近期工作证明了,拉普拉斯滤波器约图卷积的效果相同。于是,本文引入了一个低通的降噪操作来指导邻居信息的聚合,作为一个独立的预处理方法,可以非常高效的将高频噪音进行滤除。

引入一个图拉普拉斯滤波器,即,其中代表对称的归一化图拉普拉斯矩阵。将层的图拉普拉斯滤波器堆叠起来,公式如下

其中表示平滑的特征矩阵,代表堆叠了层的图拉普拉斯滤波器,可以滤除结点特征中的高频噪音。

结构对比模块

本文设计了结构对比模块(Structure Contrastive Module ,SCM)来保持跨视图间的结构一致性,由此来增加网络的辨别能力。

首先对平滑的特征矩阵进行编码,通过参数不共享的MLP编码器,并且用归一化对得到的结点嵌入进行归一化,公式如下:

其中表示学习到的结点嵌入的两个增广的视图。因为两个MLP编码器是不参数共享的,所以可以得到不同的语义信息。

进一步保持两个视图之间的不同性,简单地对其添加高斯噪音,即

其中是从高斯分布中采样的。总的来说,就是通过设计两个参数不共享的编码器构建两个增广视图,并且之间对视图添加噪音而不是使用一些更复杂的操作,如此可以提高训练效率。此外,最近的研究表明,复杂的数据在图上的增强,如边的增加、边的丢弃和图的扩散可能会导致语义漂移。

随后设计了一个源于邻居的对比损失来保持跨视图的结构一致性。计算跨视图的相似性矩阵公式如下:

其中代表第个结点的第一个视图嵌入和第个结点嵌入的第二个视图,的余弦相似性。这迫使跨视图样本的相似性矩阵与自环邻接矩阵相等,公式如下:

其中代表代表。将同一个结点的邻居结点的跨视图对视为正样本对,同时将不相邻的结点视为负样本对。将正样本对聚集起来,将负样本对推远。在公式8中,第一项迫使结点在跨两个不同视图的情况下,与邻居结点相似,同时第二项使得结点与其非邻居结点相似性减小。这种面向邻居的对比目标函数通过保持跨视图结构的一致性,增强了网络的判别能力,从而提高了聚类性能

融合以及聚类

将一个结点的两个增广视图嵌入进行一个线性的融合,公式如下:

其中,表示面向聚类的节点嵌入的融合结果。然后对直接进行K-means得到聚类结果。

算法流程


消融实验设计

低通降噪操作&结构对比模块

本文提出的数据增广

超参敏感度


一句话总结

感觉最大的创新点在于(1)只使用高斯噪音来构建增广(2)参数不共享的编码器

论文好句摘抄(个人向)

论文阅读“Simple Contrastive Graph Clustering”(arxiv)相关推荐

  1. 【论文阅读】Simple Contrastive Graph Clustering

    Simple Contrastive Graph Clustering(简易的对比图聚类) 文章目录 Simple Contrastive Graph Clustering(简易的对比图聚类) 1. ...

  2. 【论文阅读】Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR)

    [论文阅读]Attributed Graph Clustering with Dual Redundancy Reduction(AGC-DRR) 文章目录 [论文阅读]Attributed Grap ...

  3. 【论文阅读】Attributed Graph Clustering: A Deep Attentional Embedding Approach

    [原文]Chun Wang, Shirui Pan, Ruiqi Hu, Guodong Long, Jing Jiang, Chengqi Zhang. Attributed Graph Clust ...

  4. 【GNN】2021 NIPS Multi-view Contrastive Graph Clustering

    目录 简介 提纲 任务 已有的相关工作 新的方法 三个模块 为什么需要图滤波? 实验结果 相关指标对比和消融实验 总结 优势 局限性 未来改进方向 创新 补充(对比表示学习必知的几种训练目标-损失) ...

  5. 【论文阅读】Spatio-Temporal Graph Convolutional Networks:...Traffic Forecasting[时空图卷积网络:用于交通预测的深度学习框架](1)

    [论文阅读]Spatio-Temporal Graph Convolutional Networks: A Deep Learning Framework for Traffic Forecastin ...

  6. 论文阅读 [TPAMI-2022] Incremental Density-Based Clustering on Multicore Processors

    论文阅读 [TPAMI-2022] Incremental Density-Based Clustering on Multicore Processors 论文搜索(studyai.com) 搜索论 ...

  7. 【论文阅读】DEEP GRAPH INFOMAX(DGI)

    DEEP GRAPH INFOMAX(DGI) 摘要 1 Introduction 2 相关工作 2.1 对比方法 2.2 抽样战略 2.3 预测编码 3 DGI Methodology 3.1 基于 ...

  8. 论文阅读 Parallelly Adaptive Graph Convolutional Clustering Model(TNNLS2022)

    论文标题 Parallelly Adaptive Graph Convolutional Clustering Model 论文作者.链接 作者: He, Xiaxia and Wang, Boyue ...

  9. 论文阅读“Twin Contrastive Learning for Online Clustering”(IJCV2022)

    论文标题 Twin Contrastive Learning for Online Clustering 论文作者.链接 作者: Li, Yunfan and Yang, Mouxing and Pe ...

最新文章

  1. AI一分钟 | 贾跃亭这次真的没钱了,法拉第只够发到年底工资;自动驾驶风云:Uber竟被爆料收购窃取Waymo机密的公司
  2. 灰色简约三级CSS下拉菜单代码
  3. 多线程和MsgWaitForMultipleObjects
  4. python闭包修改全局变量_python闭包探究一二
  5. guava限流器RateLimiter原理及源码分析
  6. 【ES6-11(2015-2020)】特性总览与开发环境准备
  7. 看 B 站,可以更快!
  8. Python项目:用所有朋友微信头像做云图图
  9. 查看Oracle的procedures,Oracle通过shell脚本查看procedure的信息
  10. 超 短 高精度 bign 模板
  11. 最简单易懂的SpringCloudSleuth教程(spring cloud体系的链路追踪系统)
  12. Word 从任意页开始设置页码
  13. python 二维码生成器_python二维码生成器
  14. 将网页上的MathJax复制到word中
  15. 摘抄“GPU Programming And Cg Language Primer 1rd Edition” 中文 名“GPU编程与CG语言之阳春白雪下里巴人”
  16. winedit使用教程_latex与winedit入门指导教程.pdf
  17. linux创建桥接接口,Linux创建桥接网络
  18. 做短视频必须要知道的几个视频设置参数,爆款必备。
  19. RLC并联谐振电路分析
  20. ai怎么做波普风圆点_超实用AI描边小技巧:AI画一个圆点组成的圆

热门文章

  1. 关于Unity中天空盒的使用
  2. 抖音21.8版本抓包方法(Android)
  3. (转)被讨厌的勇气--目录
  4. Markdown写出高大上时序图
  5. 离散数学:关系的性质
  6. 佐治亚理工学院计算机科学硕士,佐治亚理工学院
  7. linux下启动,关闭oracle数据库
  8. 产品分析报告—年轻人的体育社区—虎扑
  9. 【Python爬虫练习】虎扑社区步行街版块首页信息爬取(BeautifulSoup+MongoDB)
  10. RPC远程调用(RMI的方式实现RPC、HttpClient实现RPC远程调用)