点击上方“AI遇见机器学习”,选择“星标”公众号
重磅干货,第一时间送达

编译 | 萝卜皮;图与推荐

随着该领域的成熟,图神经网络论文的数量也在增长,作者仔细研究了一些科学应用,并收集了几篇发表在Nature上的GNN论文。

我们周围的很多信息都可以用图表来表示。一个例子是城市道路网络,其中交叉口是节点,道路是链接。另一个是调控网络,它描述了不同基因如何相互作用以增强或抑制某些细胞功能。图神经网络(GNN)可以处理基于图的信息以进行预测。在在 2022 年 3 月 23 日的《Nature Machine Intelligence》的一篇论文中,Xue Jiawei 团队基于全球 30 个城市的城市道路网络拓扑特征,使用 GNN 研究和预测社会经济特征。

论文链接:https://www.nature.com/articles/s42256-022-00462-y

十多年前,GNN 作为一种处理复杂数据的方法出现了,这些数据最好表示为对象之间的许多链接和依赖关系的图。卷积神经网络(CNN)擅长处理图像、文本或视频等数据。这些可以被认为是简单的图形或固定大小和形状的序列。

但我们周围的大部分数据都采用更复杂的不规则大小和形状的图形形式,例如社交网络、道路网络、基因组数据或分子相互作用。CNN 难以处理这种形式的数据,而这正是 GNN 的用武之地。它们学习对图中每个节点的局部环境信息进行编码。GNN 可以在整个图的级别上执行预测或分类任务,也可以针对每个节点或边执行预测或分类任务。

基于图的深度学习在许多领域都取得了成功,从推荐系统到交通时间预测。但 GNN 也已被证明可用于科学应用,例如基因组学、分子设计、药物开发和物理模拟。在 Schulte-Sasse 团队最近的一篇论文中可以找到一个有前景的基因组学示例。

论文链接:https://www.nature.com/articles/s42256-021-00325-y

在过去的二十年里,高通量测序技术与表观遗传和转录组分子数据相结合,为基因组学提供了丰富的信息,其中一些可以被挖掘来识别致癌基因。

近年来,癌症基因如何导致细胞生长的图景变得更加复杂:癌症可以通过DNA序列水平上基因突变以外的多种途径发生,表观遗传机制或调控区域中间接激活或沉默其他基因的非编码突变也可以发挥作用。多组学数据集可以阐明这些过程。

数据可以建模为生物网络或图形,其中节点代表基因,链接代表基因-基因相互作用。研究人员使用了一种高级类型的 GNN——图卷积网络——它可以根据节点特征向量和网络拓扑对网络中未标记的节点进行分类。通过他们的方法,利用多维多组学节点特征以及蛋白质-蛋白质相互作用网络的拓扑特征,不仅可以识别高度突变的癌症基因,还可以识别包含其他类型改变的基因,或与其他癌症基因相互作用的基因。该研究将来自 16 种癌症类型的基因组数据输入该方法,确定了 165 个可能导致癌症的新候选基因。

Schulte-Sasse 团队使用的机器学习方法——带有图卷积网络的半监督分类——由 Kipf 和 Welling 于 2017 年的一篇开创性论文中被引入。

论文链接:https://arxiv.org/abs/1609.02907

在过去的 5 年里,它刺激了基于图的机器学习的许多进步。Haghir Chehreghani 在 2022 年 3 月 23 日的《Nature Machine Intelligence》发表的一篇新闻与观点文章重点介绍了这篇论文,并讨论了该方法的效率、可解释性和可扩展性。

论文链接:https://www.nature.com/articles/s42256-022-00466-8

分子预测和药物发现是基于图的方法的另一个领域。几十年来,该领域以各种创造性的方式使用机器学习,与表示分子的不同方法相关联。一种方法是将分子表示为线性字符串(也称为「简化的分子输入行输入系统」或「SMILES」),这适用于自然语言处理中的深度学习方法。

或者说,为了保留分子的拓扑信息,可以将它们表示为图,以原子为节点,以键为链接。Wang Yuyang 团队最近的一篇论文。描述了一种基于自我监督 GNN 的方法,以解决与潜在生物活性分子的巨大空间(被认为是 10^60 级)相比,分子标记数据相对稀缺的问题。研究人员的框架在一个包含大约 1000 万个分子的大型未标记数据集上进行了训练,并学习了可用于区分化学性质的分子表示。

论文链接:https://www.nature.com/articles/s42256-022-00447-x

考虑到具有相同拓扑结构的分子的不同异构体可能具有不同的化学性质,可以添加到分子图形表示中的另一个组件是它们的几何结构。Fang xiaomin 团队最近的一篇论文。描述了如何在几何增强的 GNN 方法中对分子的拓扑结构和几何结构进行编码可以改进分子特性预测。

论文链接:https://www.nature.com/articles/s42256-021-00438-4

正如 Chehreghani 所强调的,仍然需要为 GNN 开发一个更好的理论框架,并更好地理解它们的局限性。鉴于越来越多的复杂、高度连接的数据,更基础的理解将刺激 GNN 在许多领域的进一步令人兴奋的应用。

该社论以「The graph connection」为题,于 2022 年 3 月 23 日发布在《Nature Machine Intelligence》。

参考内容:https://www.nature.com/articles/s42256-022-00476-6

干货/资源微信群

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向-城市

(如:小明-浙大-对话系统-北京)

即可申请加入AI算法干货/资源等交流群

AI算法应用与研究社群(知识星球) 是一个面向全体学生和算法工程师/研究员的学习交流平台。旨在分享AI论文解读,资源,求职技巧和个人成长等内容。

目前我们的社群更加专注于NLP和数据挖掘领域,具体来说涉及:NLP中的信息抽取、对话问答、query理解、情感分析、知识图谱等等;数据挖掘中的异常检测、分类回归、时序挖掘、图计算、图神经网络、AI可解释等等等等

来看看几篇Nature上的GNN吧~相关推荐

  1. 度量 数据突变_4篇Nature“霸屏”!史上最大规模人类遗传变异体数据库发布

    以下文章来源于BioWorld ,作者iBioWorld 早在100多年前的19世纪,孟德尔(Gregor Mendel,1822-1884)盯着修道院花园里的豌豆,就开始思考为什么有的豌豆会开出白花 ...

  2. 天才少年曹原再上热搜,25岁,3年5篇Nature一作论文

    点击"开发者技术前线",选择"星标????" 让一部分开发者看到未来 来自:量子位 曹原,知名天才少年,又上热搜了. 原来是因为又发了Nature. 96年出生 ...

  3. 他本科来自普通二本,读博后3年迎来2篇Nature,创造校史!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:高分子科学前沿.Nature官网.华侨大学新闻网.华侨大学 ...

  4. 蛰伏7年!他一天发表两篇Nature,还曾是曹原的师弟!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:搜狐号@科大小郎君.纳米人.iNature.募格课堂此前报 ...

  5. 25 岁“天才少年”曹原再发一篇 Nature!9 个月的第三篇 Nature!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源 | 微算云平台(Sapere Aude).Nature.纳米人 ...

  6. 他24岁,4篇Nature在手,也会关心学不懂C语言怎么办

    鱼羊 白交 发自 凹非寺  量子位 报道 | 公众号 QbitAI 中科大少年班校友.96年出生的曹原,再次连发两篇Nature文章! 最新一期Nature,连发两篇魔角石墨烯的最新进展,来自麻省理工 ...

  7. 半个月3篇Nature/Science,95后曹原3年8篇顶刊,网友:杀疯了杀疯了

    金磊 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI "曹原又中了1篇Science!" "你听错了吧,上周不是中的Nature吗?还是2篇." & ...

  8. 2019年上半年国内学者在植物领域共发表6篇Science, 1篇Nature,1篇Cell!

    iPlants,专注植物最前沿.更多前沿研究,请关注我们! iPlants: 截止2019年6月23日,以国内学者为通讯作者的CNS文章,总共发表了8篇,分别为1篇Nature, 6篇Science, ...

  9. 95后博士生曹原连发两篇Nature,均为一作,网友:这才是真正的后浪

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 石墨烯研究领域的「巨浪」再次掀起! 当地时间 5 月 6 日,中科大 2010 级少年 ...

最新文章

  1. java 文件读写--转载
  2. Linux的项目中积累的实际工作技巧
  3. java httpclient 重定向_用Apache HttpClient实现URL重定向
  4. pythonurllib标准_Python标准库学习笔记 urllib模块
  5. SFTP多用户权限 linux环境 一站式解决方案
  6. 《学习OpenCV3》第10章 滤波与卷积
  7. 关于python装饰器的总结
  8. java demo类_《java语言程序设计》初步学习——各种小Demo
  9. k3修改服务器,金蝶k3客户端修改服务器地址
  10. 上海市计算机二级vb试题及答案,上海计算机二级VB试题
  11. 我的世界服务器存档的文件夹,我的世界存档在哪个文件夹
  12. webpack安装问题(已解决)
  13. 一个点击率10万+的恶搞程序送给大家!
  14. 机器学习苹果识别——python+opencv实现物体特征提取
  15. Android系统快速编译方式ninja
  16. Interpro注释
  17. 适合销售看的书都有哪些?销售方面的经典书籍推荐
  18. 福大软工 · 第八次作业(课堂实战)- 项目UML设计(团队)
  19. BOSS创投社群:要想成为富人,得改变原有思维,谈谈什么是富人思维模式!
  20. 查看所连接局域网内所有ip

热门文章

  1. 正则表达式了解和使用
  2. Lucene 学习资料
  3. js的Prototype属性 解释及常用方法
  4. poj 3275(传递闭包)
  5. 程序员,应该掌握的英语词汇
  6. NeHe OpenGL第十课:3D世界
  7. namenode需要多大内存
  8. Eclipse安装spring tool suite(4.9.0版本)
  9. 16个实用终端命令CLI
  10. css3 局部放大,CSS3/JS 鼠标悬停图片局部放大动效