导读:目前常见的图卷积神经网络一般都是3、4层,本文关注的问题是图卷积神经网络GCN/GNN是否也能和一般的卷积神经网络CNN一样加深到50+层而不会有Vanishing Gradient问题,作者提出了ResGCNs,DenseGCNs和Dilated GCN,MRGCN等结构,甚至能训练收敛152层GCN,并在点云分割任务上取得了比较好的效果。李国豪,中国科学院大学硕士,阿卜杜拉国王科技大学计算机科学博士生一年级。研究方向是计算机视觉、深度学习、无人驾驶、强化学习等,曾在商汤科技研究院实习参与无人驾驶研究项目。在机器人顶会Robotics: Science and Systems(RSS‘2019)发表论文。图卷积网络(GCN)在处理非规则数据的过程中具有CNN无法比拟的优势,但目前的图卷积网络规模较小,在加深深度的过程中由于梯度消失(Vanishing Gradient)和过度平滑(Over Smoothing)问题限制图卷积网络的进一步发展。为了探索图卷积网络深度拓展的潜力,来自阿卜杜拉国王科技大学的研究人员在CNN结构的启发下在图卷积网络中利用残差、稠密连接和膨胀卷积等结构成功将GCN的深度拓展到了56层,在增强模型训练稳定性的基础上大幅度提高了图卷积网络的性能。

图卷积网络

图卷积网络对于真实世界中广泛存在的非欧几里得数据具有强大的优势,它可以处理庞大的社交网络数据,通过将社交网络等效为图来分析人与人之间的关系,也可以通过图的方式来为化学分子结构建模助力新药研发,同时还可以精确地构建用户的交互模式以提升推荐系统的精度与效率,此外在语言处理、复杂的词句关系中都有着广泛的应用。
对于计算机视觉来说,图卷积网络对于场景中各部分的语义关系建模也十分有效,图卷积网络在对于点云的处理方面也涌现了一系列优秀的工作。例如在点云分割和提升深度的探索上研究人员们都进行了一系列探索,但研究发现较深的图卷积网络会引起过度平滑(over-smoothing)的结果,使得局域特征都收敛到相同的值上;此外随着网络的加深还会带来较高的计算复杂度和以及常见的梯度消失问题。
梯度消失、感受野较小、计算复杂度较高…这一系列问题似乎很熟悉?在卷积神经网络发展的初期,人们也面临着相同的问题!那么是不是可以借鉴CNN的发展经验来解决GCN所面临的问题呢?研究人员通过残差、稠密连接和膨胀卷积等新的GCN结构给出了肯定的答案。

深度图卷积网络

图卷积网络通过聚合顶点领域的特征来实现高层信息的抽取。在图网络中,通过与每个顶点相连的特征矢量来表示顶点,整个图就通过衔接这些所有顶点的特征来表达。下面的公式代表了图网络的一般表达形式:其中Gl,Gl+1代表了第l层图网络的输入和输出,图卷积操作包含了聚合操作与更新操作,其中聚合操作用于从邻域的顶点中编码信息,而更新操作则用于将聚合后的信息进行非线性变化以计算出新的表达。这些函数的实现由多种形式,为了突出研究重点研究人员选用了简单的最大池化作为聚合操作函数,多层感知机作为更新函数以便对抽取的特征进行非线性变换。此外,为了进一步提高模型的表达能力,动态图卷积也是十分必要的。在研究中利用k-NN在每一层图卷积层都对顶点间的边进行了重计算来动态改变感受野,同时也有利于缓解较深的网络带来过度平滑的问题。

三管齐下有效加深GCN

为了加深图网络的深度提升模型的表达能力,研究人员在ResNetDenseNet和膨胀卷积的启发下对GCN 进行了一系列改进升级,提出了深度更深、更加稳定、表现更好的图网络。下面让来看看他们是如何将这三种技术引入图网络中的。ResGCN.通常的图卷积网络方法将一个图作为输入,通过映射函数F得到新的图表示。而研究人员则提出一个新的函数H来映射输入图网络与目标网络间的残差:在通常GCN的基础上,研究人员为每一层增加了残差链接,这些链接将为信息和梯度的传输提供了额外的连接通道,将有效解决梯度消失的问题。DenseGCN.稠密的连接提供了一种更为高效特征共享方式和信息流动通道,研究人员在DenseNet的启发下为每层图卷积衔接了先前所有中间层的信息。下面的公式中可以看出每一层的卷积中包含了一直到输入层的信息流。这种方法将有效的融合多级别的特征,为梯度的流动提供了良好的通道,进一步促进特征的复用,缓解梯度消失问题。 膨胀卷积图像领域的研究表明,膨胀卷积(Dilated Aggregation)可以在不损失分辨率的情况下有效扩大模型感受野,研究人员通过k-NN的方式来寻找每一层GCN后需要膨胀的邻域,并构建了膨胀的图结构。例如针对一个膨胀率为d的图,k-NN会在输入图中每隔d个相邻节点来构建k*d的计算区域并返回k-NN结果。

模型架构

在三种新模块的加持下,研究人员构建了下图所示的新型深度图卷积网络结构。整个结构主要包含了图卷积主干网络、特征融合模块和多层感知器预测模块三个主要的部分。其中主干网络用于抽取输入数据的特征。在实验过程中研究人员利用了ResGCN和DenseGCN来构建主干网络;随后利用与PointNet和EdgeConv相同的方法构建了融合模块,对全局和局部特征进行了有效融合;最后利用多层感知机模块对融合后的特征进行处理,针对特定的任务进行处理。
实验过程中使用点云分割任务进行验证,主干网络对输入4096个点进行处理抽取了包含4096个顶点的图特征;随后利用1*1的卷积、池化对特征进行处理,并对全局与局部特征融合,最后利用1*1卷积实现的多层感知机对所有的点进行分类实现点云分割。研究人员首先实现了ResGCN28作为深度图卷积的基础网络,其中包含了28层结构,包含了残差图连接和膨胀卷积。实验结果在mIOU上比目前的结果提升了4%。随后研究人员在S3DIS数据集上以RecGCN28作为基准,对网络的结构、参数进行了一系列改进。通过使用稠密连接、动态k-NN和不同的通道数与深度来分析模型的性能变化,下表总结了各种变体与基准模型的对比。研究人员发现简易实现的稠密连接对于显存的消耗十分巨大,残差连接对于实际应用更加现实。消融性分析更多地针对于残差连接的网络展开。在上表中可以看到膨胀卷积所决定的感受野在性能上贡献了3%,能更好地与残差链接协同工作。而当k-NN的邻域大小变为原来的1/2和1/4时,性能下降了2.5%和3.3%,这意味着较大的感受野有利于模型性能的提升,但这一提升需要建立在模型有充分容量基础上。如果增加邻域的同时减小核的数量就会造成较大的性能损失。
还可以看到更深更宽的模型可以提升网络的性能,这很大程度上意味着模型容量的增加和表达的抽取更为有效,但更深的模型需要在残差和膨胀卷积的配合下才能有效提升。
为了更清晰地展示各种部件对于网络的影响,研究人员还做出了下面的柱状图对各种因素进行了分析。另外,研究人员结合GraphSAGE和EdgeConv的优点提出了更加高效的图卷积模型MRGCN最后一起来看看这种方法在数据集上取得的效果吧,最右边两列是本文提出模型的结果,与没有残差或稠密连接的模型相比显著提高了语义分割的效果:如果想要了解详细信息,可以这一项目的网站:https://sites.google.com/view/deep-gcns
也可以下载代码上手学习一番:https://github.com/lightaime/deep_gcnsref:https://sites.google.com/view/deep-gcnshttps://arxiv.org/abs/1904.03751https://github.com/WangYueFt/dgcnnhttps://github.com/charlesq34/pointnethttps://en.wikipedia.org/wiki/Non-Euclidean_geometryhttps://www.zhihu.com/question/54149221https://dribbble.com/shots/4191976-Icon-illustration-2

gcn语义分割_ICCV Oral 2019:152层GCN大幅加深图卷积网络的方法,点云分割任务效果显著...相关推荐

  1. GCN (Graph Convolutional Network) 图卷积网络

    这几个同时看一下,感觉能理解不少: B站视频:https://www.bilibili.com/video/BV1ta4y1t7EK GCN论文原文和代码:https://github.com/tki ...

  2. 一文读懂简化的图卷积网络GCN(SGC)| ICML 2019

    作者 | yyl424525 来源 | CSDN博客 文章目录 1 相关介绍 1.1 Simple Graph Convolution (SGC)提出的背景 1.2 SGC效果 2 Simple Gr ...

  3. CVPR 2019 | 旷视研究院提出ML-GCN:基于图卷积网络的多标签图像识别模型

    全球计算机视觉三大顶会之一 CVPR 2019 (IEEE Conference on Computer Visionand Pattern Recognition)将于 6 月 16-20在美国洛杉 ...

  4. SGC - Simplifying Graph Convolutional Networks 简化的图卷积网络 论文详解 ICML 2019

    文章目录 1 相关介绍 1.1 Simple Graph Convolution (SGC)提出的背景 1.2 SGC效果 2 Simple Graph Convolution 简化的图卷积 2.1 ...

  5. 图卷积网络GCN(Graph Convolution Network)(一)研究背景和空域卷积

    文章首发于个人站点: 图卷积网络GCN(Graph Convolution Network)(一)研究背景和空域图卷积 | 隐舍 公众号:[DreamHub] 由于文章篇幅较长,因此将其分解为三部分: ...

  6. 生物信息学|利用层注意图卷积网络预测药物-疾病关联

    本篇推文引自:Predicting drug–disease associations through layer attention graph convolutional network 1. 摘 ...

  7. 【GCN】图卷积网络(GCN)入门详解

    机器学习算法与自然语言处理出品 @公众号原创专栏作者 Don.hub 单位 | 京东算法工程师 学校 | 帝国理工大学 图卷积网络(GCN)入门详解 什么是GCN GCN 概述 模型定义 数学推导 G ...

  8. 图卷积网络初探【GCN】

    最近GCN非常火,虽然个人暂时用不到GCN,但还是简单看了下理论,感觉不是特别复杂,但是似乎实现上较为有难度,尤其是高维的图表示,先转载一篇机器之心的文章学习一下,感觉GCN主要是处理复杂的关系网络, ...

  9. gcn 图卷积神经网络_GCN图卷积网络入门详解

    字幕组双语原文:[GCN]图卷积网络(GCN)入门详解 英语原文:Graph Convolutional Networks (GCN) 翻译:听风1996.大表哥 在这篇文章中,我们将仔细研究一个名为 ...

最新文章

  1. Anchor-free目标检测 | 工业应用更友好的新网络(附大量相关论文下载)
  2. mysql中00933错误_ORA-00933: SQL command not properly ended
  3. scala的传值参数和传名参数
  4. 算法面试题解答(七)
  5. 前端学习(1860)vue之电商管理系统电商系统之渲染login组件并且实现路由重定向
  6. Linux fwrite 什么时候刷新,linux的fwrite()使用方法,当前时间写入文本的程序
  7. oracle用户编辑文件中文乱码
  8. [Java] 蓝桥杯PREV-3 历届试题 带分数
  9. MRFC-概念与功能
  10. 实验4-2-8 输出整数各位数字 (15 分)
  11. 已解决:Cannot find ./catalina.sh The file is absent or does not have execute permission This file is ne
  12. SQL Server 中字符串中包含字符串变量的表示方法
  13. [分块][离散化] Bzoj P2724 蒲公英
  14. ARP防火墙 (防如网络执法官、网络剪刀手、局域网终结者限制本机网速)
  15. 迅歌点歌系统服务器过期或不信任怎么办,点歌机常见问题解析
  16. 自学Java网站推荐
  17. 交叉编译工具arm-linux-gccarm-elf-gcc下载地址全集
  18. 江天数据220kV变电站开建 实现更高电能质量和电力可靠性
  19. win8 不显示计算机,Win8电脑插上U盘不显示盘符怎么办?
  20. 第二人生的源码分析(二十)显示人物名称

热门文章

  1. Elasticsearch-6.7.0系列(六)ES设置集群密码
  2. python3 tensorflow 安装
  3. Android深度探索(卷1)HAL与驱动开发读后感---第四章
  4. 基于visual Studio2013解决面试题之0601二叉树深度
  5. 以色列研发出0经验AI,无需训练就能学会抠图
  6. c++面试题之标准模板库
  7. android多线程下载原理,安卓多线程断点续传下载功能(靠谱第三方组件,原理demo)...
  8. linux的磁盘磁头瓷片作用,Linux 磁盘管理
  9. idea使用ant配置_Linux下Jenkins+ant+jmeter[上]
  10. android使用桢布局,Android性能优化UI篇