2020-07-07 10:24:07

作者:Michael Bronstein

编译:ronghuaiyang

导读

介绍了图深度学习取得的一些成果,面对的挑战以及后面的发展之路。

图深度学习,也被称为几何深度学习(GDL),图表示学习(GRL),或关系归纳偏差,最近已成为机器学习领域最热门的话题之一。虽然早期关于图学习的研究至少可以追溯到十年前,毫无疑问,最近几年的进展已经把这个方法从商业领域应用到了机器学习的社区中,甚至到了科学领域。

图是一种强大的数学抽象,它可以描述从生物学、高能物理学到社会科学和经济学等领域中关系和相互作用的复杂系统。如今,由于这些领域中产生的图结构数据数量巨大(突出的例子是Twitter和Facebook等社交网络),应用深度学习技术是非常诱人的,这种技术在其他数据丰富的环境中已经非常成功。

图学习问题有很多种不同的形式,在很大程度上依赖于应用。二分法是node-wise和graph-wise的问题,前者对图中的节点进行预测(比如在社交网络中恶意用户的预测),后者是对整个图的预测(比如预测化学分子的溶解度)。此外,与传统的ML问题一样,我们可以有监督学习和无监督(或自监督)学习的分别,还有转换和归纳问题。

与用于计算机视觉中的卷积神经网络类似,对图进行高效学习的关键是设计具有共享权值的局部操作,并在每个节点及其邻居之间传递消息。与处理网格结构数据的经典深度神经网络相比,主要区别在于,在图上,这些操作是排列不变的,即独立于邻居节点的顺序,因为通常没有规范的方式对它们排序。

尽管有一系列图表示学习的成功的例子,到目前为止我们没有看到任何接近卷积网络在计算机视觉上的成功。在下面,我会概述我的观点,可能的原因以及该领域在未来几年的可能的进展。

标准化的benchmark,像ImageNet这样的标准化benchmark无疑是计算机视觉领域深度学习的关键成功因素之一,一些文章甚至认为,在深度学习革命中,数据比算法更重要。在规模和复杂性方面,我们在图学习社区中还没有类似的ImageNet的基准。2019年推出的Open Graph Benchmark可能是朝着这个目标的第一次尝试,尝试在有趣的真实图结构数据集上引入具有挑战性的图形学习任务。其中一个障碍是,出于对GDPR等隐私法的担忧,利用用户活动生成多样而丰富的图的科技公司不愿分享这些数据。一个值得注意的例外是Twitter,作为RecSys挑战的一部分,在某些隐私保护限制下,Twitter制作了一个1.6亿条tweet的数据集和相应的用户参与图,供研究社区使用。我希望以后有更多的公司也能这样做。

软件库,许多开源的软件库在“民主化”深度学习和使其成为流行工具方面发挥了至关重要的作用。直到最近,图学习的实现主要还是写得很差的一些测试代码的集合,但是如今,有了像PyTorch Geometric或Deep Graph Library (DGL)这样专业团队维护的库。一个新的深度学习架构在arxiv上出现几周后就实现了,这是很常见的。

可扩展性,这限制工业应用的关键因素之一,这些应用经常需要处理非常大的图(想想Twitter社交网络,有数亿个节点和数十亿条边)和低延迟约束。直到最近,学术研究界几乎忽略了这一方面,文献中描述的许多模型完全不适合大规模的情况。此外,GPU与经典深度学习架构的完美结合是它们共同成功的主要推动力之一,但它不一定最适合图形结构数据。从长远来看,我们可能需要专门的硬件来处理图。

动态图,这是文献中很少提及的另一个方面。虽然图是建模复杂系统的常用方法,但是这样的抽象往往过于简单,因为现实世界的系统是动态的,并且随时都在发展。有时是时间行为提供了关于系统的关键见解。尽管最近取得了一些进展,设计能够有效处理以节点或边事件流表示的连续时间图的图神经网络模型仍然是一个有待研究的问题。

高层次结构,如图案,图表,或简单的复合物在复杂的网络中被认为是重要的,例如在生物学应用中描述蛋白质-蛋白质的相互作用。然而,大多数图神经网络仅限于节点和边。将这样的结构合并到消息传递机制中可以为基于图的模型带来更强的表达能力。

理论理解,对图神经网络表达能力的理论理解是相当有限的。这是很常见的,在某些情况下,使用图神经网络在性能上有显著的提高,而在其他情况下几乎没有区别。目前还不完全清楚,图形神经网络在什么时候以及为什么工作良好或失败。这个问题是困难的,因为人们必须同时考虑基础图的结构和其中的数据。图分类问题只关心图的连通性,最近的工作表明,神经网络图等价于Weisfeiler-Lehman图同构测试。这种形式解释了为什么,例如,图神经网络在不能通过简单的测试来区分的非同构图的实例上失败。如何在保持低线性复杂度的同时,超越Weisfeiler-Lehman层次测试结构,使图神经网络如此吸引人,是一个有待研究的问题。

鲁棒性和性能保证,图神经网络在噪声数据存在或受到攻击时的鲁棒性和保证性能是另一个有趣的领域,这在很大程度上也是原始的研究领域。

应用,这可能是这个领域中最令人满意的部分。从事图学习工作多年后,我结识了粒子物理学家、临床医生、生物学家和化学 —— 如果不是在各自领域的应用,我是不可能遇到这些人的。如果我要打赌,在未来几年里,图深度学习可能会产生最大影响的一个领域,我会选结构生物学和化学。在这些领域中,基于图的模型既可以作为分子的低级模型,也可以作为分子之间相互作用的高级模型。结合这些可能是关键的水平是用于制药行业,我们看到最初的迹象,今年的早些时候,使用了图神经网络用来发现了一个新的抗生素,还有预测蛋白质间的相互作用。如果图深度学习实现了它的承诺,那么发现、开发和测试新药这一传统上漫长而昂贵的过程可能永远不会和以前一样了。

英文原文:https://towardsdatascience.com/deep-learning-on-graphs-successes-challenges-and-next-steps-7d9ec220ba8

图深度学习:成功,挑战以及后面的路相关推荐

  1. 深度学习求深度图_关于图的深度学习成功挑战和下一步

    深度学习求深度图 重点 (Top highlight) 图神经网络的下一步是什么? (What is next in store for graph neural networks?) TL;DR T ...

  2. 图深度学习:成果、挑战和未来

    译自:雷锋字幕组 原文:https://towardsdatascience.com/deep-learning-on-graphs-successes-challenges-and-next-ste ...

  3. 图深度学习:成果、挑战和未来[AI前沿技术]

    关注:决策智能与机器学习,深耕AI脱水干货 作者 / McGL 来源 | 知乎 授权转载 图深度学习是近期的研究热点.Michael教授带你了解目前最新成果及未来挑战. Deep learning o ...

  4. 想入门图深度学习?这篇55页的教程帮你理清楚了脉络

    选自arXiv 作者:David Bacciu等 机器之心编译 意大利比萨大学的研究者发表论文,介绍了图深度学习领域的主要概念.思想和应用.与其他论文不同的是,这篇论文更像一份入门教程,既适合初学者作 ...

  5. 【AI初识境】什么是深度学习成功的开始?参数初始化

    文章首发于微信公众号<有三AI> [AI初识境]什么是深度学习成功的开始?参数初始化 这是<AI初识境>第5篇,这次我们说说初始化.所谓初识,就是对相关技术有基本了解,掌握了基 ...

  6. 腾讯AI Lab联合清华,港中文长文解析图深度学习的历史、最新进展到应用

    本文作者: 腾讯:荣钰.徐挺洋.黄俊洲:清华大学:黄文炳:香港中文大学:程鸿 前言 人工智能领域近几年历经了突飞猛进的发展.图像.视频.游戏博弈.自然语言处理.金融等大数据分析领域都实现了跨越式的进步 ...

  7. 推荐收藏!图深度学习发展历史、最新进展与应用

    本文经机器之心授权转载. [导读]本文将分图神经网络历史.图神经网络的最新研究进展和图神经网络的应用进展三大部分归纳总结该课程 Theme II: Advances and Applications ...

  8. 腾讯AI Lab联合清华、港中文带来万字干货解析:图深度学习的历史、最新进展和应用

    作者: 腾讯:荣钰.徐挺洋.黄俊洲:清华大学:黄文炳:香港中文大学:程鸿 前言 人工智能领域近几年历经了突飞猛进的发展.图像.视频.游戏博弈.自然语言处理.金融等大数据分析领域都实现了跨越式的进步并催 ...

  9. 【NAACL2021】Graph4NLP:图深度学习自然语言处理(附ppt)

    来源:专知本文约1500字,建议阅读5分钟 最新图深度学习在自然语言处理应用的概述报告,不可错过! 深度学习已经成为自然语言处理(NLP)研究的主导方法,特别是在大规模语料库中.在自然语言处理任务中, ...

最新文章

  1. 关于Page翻页效果--Page View Controller
  2. L1-044 稳赢 (暴力法)
  3. 如果女朋友突然问你DNS是个啥...
  4. MyBatis配置项--properties
  5. Linux——SSH连接错误【No supported authentication methods available】解决方案
  6. IplImage, CvMat, Mat 的关系和相互转换 再次理解 /(ㄒoㄒ)/~~
  7. 信息学奥赛一本通 2052:【例3.2】范围判断
  8. 笑谈软件工程:烽烟中的敏捷
  9. Map与WeakMap
  10. netty : io.netty.handler.codec.TooLongFrameException
  11. 我选择的是一种生活态度
  12. elementUI 下拉框隐藏时触发相关事件(下拉框下拉显示时不触发)
  13. 接口自动化测试框架搭建(3、excel的设计excel文件的读取)--python+HTMLTestRunnerCN+request+unittest+mock+db
  14. 如何把电脑的计算机固定在桌面上,如何将Win7便签固定在电脑桌面上?
  15. 删除文档中的中文字符---只保留英文字符
  16. VUE之多元素组件过渡+动画封装
  17. 数据结构与算法笔记(青岛大学王卓老师视频)
  18. OBS 进阶 之 高分屏下 屏幕采集不全问题解决
  19. 机器视觉系统图像采集卡功能特点及应用场景介绍
  20. 设一棵树T的度为4,其中度为1,2,3,4的结点个数分别为4,2,1,1。则T中的叶子结点为

热门文章

  1. 苹果cms10的php.ini目录列表,使用苹果CMSV10常见问题整理官方版
  2. MyBatis 环境搭建
  3. BERT不加载预训练模型的理由
  4. txt或者csv数据文件的格式是有要求的,如下shell代码中说明。
  5. 分区文件http://wenku.baidu.com/view/d839d1868762caaedd33d4b7.html
  6. MybatisPlus处理Mysql的json类型
  7. 模型越大,真的越香吗?千亿参数之后是万亿,万亿之后呢?
  8. 这些代码改变了科学界:从Fortran、arXiv到AlexNet
  9. 在疯狂的前端世界,为什么选择学习React
  10. COLING 2018 ⽤对抗增强的端到端模型⽣成合理且多样的故事结尾