https://www.toutiao.com/a6714548481379271176/

【导读】GNN是目前机器学习领域的热门网络之一,肯多研究与技术分享相比不可知的深度学习网络模型,GNN 有哪些吸引我们的优势及硬核实力。然而,GNN 是完美的吗?有什么缺点?在何种情况下,GNN 是无法发挥其能力的?近日,在 arXiv 上发布了一篇论文,专门研究探讨了 GNN 在普适性与学习局限性等问题。

作者 | Andreas Loukas译者 | 凯隐责编 | Jane出品 | AI科技大本营(ID: rgznai100)

本文主要从计算能力有限的角度,来研究GNN在消息传递分布式系统中的图灵普适性和局限性,并得到了两个与图论问题能否解决(impossibility statements)有关的结论:

(1)在一定的充足条件下,GNN是具有图灵普适性的;

(2)而在深度和广度被限制的条件下,GNN的性能会有一定的局限性。

应用第一个结论,可以对一些图论优化问题设置更低的计算复杂度下界,第二个结论则说明在深度和广度的乘积不超过图的大小时,GNN是无法解决其他的一些问题的。

专业术语

为了方便大家后续阅读理解文章,我们先把文中涉及的几个专业问题做简单阐述:

1、图灵普适性(Turing universal)

一个具有图灵普适性的图灵机(Universal Turing machine)能够模拟任何图灵机在任何输入下的情况。

2、一致性问题(Consensus)

即在分布式计算或者多代理(multi-agent)系统中,如何在发生进程故障的情况下保持系统的可靠性(reliability)。这通常需要进程就计算过程中的一些数值或数值操作达成一致,包括如何将提交到数据库,如何识别leader进程,状态机复制(一种故障容忍机制),原子广播等操作。

3、不可能结果(Impossibility result)

这是分布式领域的专业术语,在一个完全异步的消息传递分布式系统中,如果一个进程有故障,那么一致性问题是无法得到解决的,在此基础上,有两个比较著名的 impossibility result:FLP和CAP,详见[1][2]。本文中提出了关于GNN的两个结论都是属于GNN的 impossibility results。简单来说,就是在一定的限制条件下问题能否被解决,那么任务的impossibility result就只有两种情况:能和不能。

4、GNN的深度和广度(depth and width)

深度就是网络层数,广度就是每层的感知域,也就是每个节点的能获取到信息的邻接节点的范围。

模型普适性的研究

机器学习中的一个基本任务是研究哪些内容是一个模型(网络)能学习到,而哪些是不能学习到的,也就是研究模型的普适性,研究其能否解决大部分任务。过去的一些研究通过不变函数或者等效函数来对网络进行等效近似,从而在函数层面研究什么是一个模型能学习到的内容。

通常理论认为,在有充足的训练数据和合适的学习优化算法的情况下,普适性网络能够解决大部分给定的任务,然而这种理解是不全面的,因为在实际应用时要满足充足训练数据和合适优化算法是比较困难的,这种无限制的普适性网络是不能作为实际部署时的网络设计参考的。

因此,可以从问题的对立面,即研究模型的局限性,来间接地研究其普适性,也就是在特定的任务中,特定的限制条件下网络不能学习到的内容。这有助于了解模型和特定任务之间的关系,从而知晓任务能否被解决(impossibility results),进而帮助我们调整模型的参数。例如,在图分类任务中,我们希望模型能学习到同一类图的共同特征,不同类图的区别特征,然而如果GNN模型本身的深度和广度不足以学习到足够的特征,那么这个问题就是impossible的,因此就需要进一步的调整深度和广度。

文章主要贡献

本文所研究的特定任务是图论中的一些优化任务,特定限制条件是 GNN 的深度和广度,将深度和广度与理论计算机科学中的复杂度等度量联系起来,再将计算复杂度作为这些优化任务的完成下界(从 impossible 变为 possible 的最低复杂度要求),从而得到GNN的深度和广度对具体任务的影响,以及对GNN普适性的影响。具体地,关于普适性的研究有以下两个结论。

1、GNN 的图灵普适性

在足够的条件下,GNN 能以图灵机的形式对任意输入函数进行运算,且不限于网络结构。通过建立 GNN 和经典分布式计算模型 LOCAL 之间的图灵等效,来间接的研究其普适性。这里的足够条件是:

(1)有足够的层数

(2)每一层都有足够的广度

(3)节点之间可以相互独立(ids)

(4)每一层计算的函数有足够的表现力

2、GNN 的学习能力局限性

正如前面提到的,在深度和广度都被限制的情况下,GNN是无法表现出其图灵普适性,即应用在具体任务上时,无法解决这个任务。那么如何确定能否完成任务的下界呢?还是通过 LOCAL。任务或问题的 impossiblility result 可以在GNN和LOCAL之间以一定的形式相互转换,因此研究任务在 GNN下能否完成和在LOCAL下能否完成是等效的,进而可以在LOCAL模型下为完成任务的计算复杂度要求设置下界。具体的,文章中提到了四种类型的任务(问题定义详见原论文):

(1)检测(detecting)图G中是否含有特定长度的环(cycle of specific length)

(2)验证(verifying)图G的给定子图是否连通(connected),是否具有环(cycle),是否为生成树(spanning tree,具备树结构,没有环),是否为二分图(bipartite,顶点集合可以分为两个子集,所有边的两个顶点分属于这两个子集),是否为简单路径(simple path,与图的哈密顿循环有关)

(3)计算(computing)两个顶点间的最短路径(shortest path between two vertices),图的最小割(minimum cut),以及最小生成树(the minimum spanning tree)

(4)求图的最大独立集(maximum independent),最小顶点覆盖(minimum vertex cover),或图的顶点着色问题(chromatic coloring)

以上问题都是属于图论中的传统优化问题,虽然不是现在主流研究的顶点分类,图分类问题,但二者之间有密不可分的联系。这些问题的具体计算复杂度下界为:

总结

本文首次对GNN模型提出了 impossible 问题,并通过等效计算的方法,以计算复杂度的形式,给出了 GNN 在部分图论任务中impossible results下界与网络宽度和广度的关系,在一定程度上说明了 GNN 的性能会受到网络本身的宽度和广度的限制。

由于原文中的数学推导过于复杂,因此这里我只介绍文章的基本思想。GNN作为目前机器学习领域的热门研究之一,已经被应用于各种各样的任务,通常在应用一个网络的同时,也要同步地去研究这个网络的内在本质,从而更好的理解,改进它,进而帮助我们在实际应用网络时更好的设置网络的参数,这篇文章就是一个很好的例子。

【参考文献】

[1] https://en.wikipedia.org/wiki/Consensus_(computer_science)

[2] Fischer, M. J.; Lynch, N. A.; Paterson, M. S. (1985). "Impossibility of distributed consensus with one faulty process" (PDF). Journal of the ACM. 32 (2): 374–382. doi:10.1145/3149.214121.

原文链接: https://arxiv.org/abs/1907.03199

什么限制了GNN的能力?首篇探究GNN普适性与局限性的论文出炉相关推荐

  1. 什么限制了GNN的能力?首篇探究GNN普适性与局限性的论文出炉!

    作者 | Andreas Loukas 译者 | 凯隐 责编 | Jane 出品 | AI科技大本营(ID: rgznai100) [导读]GNN是目前机器学习领域的热门网络之一,肯多研究与技术分享相 ...

  2. 刚刚,常温常压超导首被证明理论可行:美顶尖实验室论文出炉

    来源:机器之心 超算掐指一算,感觉超导有戏. 就在全世界的科学家们争相做实验的同时,有人为最近韩国科研团队「常温常压超导」研究提供了理论方面的支持. 几个小时前,美国劳伦斯伯克利国家实验室(LBNL) ...

  3. 全球计算机视觉顶会CVPR 2020论文出炉:腾讯优图17篇论文入选

    全球计算机视觉顶级会议CVPR2020  (IEEE Conference on Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议 ...

  4. 全球计算机视觉顶会CVPR 2019论文出炉:腾讯优图25篇论文入选

    全球计算机视觉顶级会议 IEEE CVPR 2019(Computer Vision and Pattern Recognition,即IEEE国际计算机视觉与模式识别会议) 即将于6月在美国长滩召开 ...

  5. 知网首篇被引破万论文诞生!作者是曾两次“被迫转行”的他

    近日,知网首篇被引量破万的中文论文及其作者备受关注.根据中国知网,截至2021年7月23日,由温忠麟教授等人发表在<心理学报>上2004年05期的学术论文<中介效应检验程序及其应用& ...

  6. 打破校史!这位参与发表学校首篇Science的博士小姐姐,近日一作再发Nature

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要13分钟 Follow小博主,每天更新前沿干货 本文来源:科研大匠综合自西南交大新闻网.官微.扬华研究生新闻中心 转载自:募格学术 导读: 1 ...

  7. 中国首篇Science机器人子刊!北航软体机器人实验室四年成果登上封面长篇

    来源:北航新闻网.机器人大讲堂 概要:通过这三项关键技术,我们成功实现了机器人样机能够像真正的䲟鱼一样牢牢吸附在物体表面,并且通过内部鳍片的主动抬起运动显著增大摩擦力. 重磅 惊喜,北京时间9月21日 ...

  8. 武大上交发布首篇「图像匹配」大领域综述!涵盖 8 个子领域,汇总近 20年经典方法

    原文链接:https://bbs.cvmart.net/topics/3176 专注计算机视觉前沿资讯和技术干货 微信公众号:极市平台 官网:https://www.cvmart.net/ 武汉大学和 ...

  9. 我的首篇博客——记录学习,不忘初心

    Hello,大家好!我是阿冰!今天是2022年12月2日,受疫情影响,我们学校的同学都早早的回家了,今天就是我回家的第五天.其实,这并不算是真正意义的寒假,因为过两天我们还有将近一个月的实训,大约到1 ...

最新文章

  1. Memcache - 一款图形化memcache监控工具
  2. Linux umask 文件默认权限
  3. [route]Add up route for deb rpm and windows / 为RPM系DEB系和Windows添加路由
  4. SAP Cloud for Customer Extensibility的设计与实现
  5. php设置accept,PHP或htaccess通过Accept-Language重写URL?
  6. java wait 释放锁_JAVA锁之wait,notify(wait会释放锁,notify仅仅只是通知,不释放锁)...
  7. tensorflow英语怎么读_英语不行?你可以试试TensorFlow官方中文版教程
  8. 仿造小红书页面代码html,jQuery仿小红书登录页,背景图垂直循环滚动登录页,向上循环滚动的动画,实现一张背景图片的无缝向上循环js滚动...
  9. Qt中文本编辑器实现语法高亮功能(Qscitinlla)
  10. c++笔记(10) 文件输入输出
  11. 今晚7点30,腾讯专家与你共探广告智能创意新可能
  12. 硬盘无法识别怎么办 硬盘无法识别怎么恢复数据
  13. java ognl表达式_ognl 详解 Struts2中的OGNL表达式 | 学步园
  14. x509证书cer格式转pem格式
  15. (译)《科学美国人》:多样的人际网络导致繁荣的本地经济
  16. 论文笔记: FSA-Net
  17. canvas入门教学(5)运动小球屏保特效与下雪特效渲染
  18. 彻底理解nth-child和nth-of-type的区别
  19. MATLAB图像的频域低通滤波(灰度图像滤波+彩色图像滤波)
  20. linux 信号signum.h SIGINT SIGUSR1 SIGUSR2

热门文章

  1. 在Linux添加PYTHONPATH方法以及修改环境变量方法
  2. springEL表达式
  3. 自然语言处理工具类数地工厂
  4. 论坛报名 | AI 时代,新药研发真能告别「十年磨一剑」吗?
  5. 盘点:2020 年机器学习 10 大进展
  6. 《因果科学周刊》第3期:因果助力 Stable Learning
  7. DiscuzX3.2,3.3升级DiscuzX3.4的详细教程!
  8. 幕后我最“牛” | 数据派优秀志愿者风采展
  9. 独家 | 一文了解强化学习的商业应用
  10. 面完字节跳动,才知道自己的数据结构与算法有多薄弱...