笔记整理 | 方尹,浙江大学在读博士,研究方向:图表示学习。


论文地址:https://arxiv.org/abs/2012.12533

动机与贡献

现有的对比学习框架中可能存在以下几个弊端:

1.把节点看成一种视图,在节点和图之间进行对比学习,这样可能会限制模型捕获整体信息的能力;

2.把子图看成一种视图,挑选子图的方法比如随机游走或着k-hop邻居很大概率会得到完全没有意义的子图。而依赖于子图结构计数的motif mining方法又不适用于大规模数据集。

 

作者提出了MICRO-Graph框架:

1.自动化找出motif,再找出这个motif下的子图

2.一种子图到图的对比学习框架

模型与算法

整体框架分为三部分:1.找出重要的子图;2.cluster抽出来的子图,并定义主题;3.子图到图的对比学习。

图通过GNN encoder得到节点的表示,再通过segmenter模块抽取子图,子图通过encoder获得子图表示,子图的表示通过motif learner模块学习子图属于哪些主题,更新的参数又会影响segmenter抽取子图的方式和节点表示。把最终生成的子图和整个图进行对比学习。

Motif learner

input graph通过segmenter抽取出N个子图,每个子图通过encoder学习到子图的表示。这里要用到的两个矩阵:S衡量了主题和子图的相似度,Q衡量了子图被分配到某个主题的概率。

E-step的目标就是求解Q,使得子图和它被分配到的主题的相似度最大。

目标函数:最大化 分配矩阵Q和相似度矩阵S乘积的迹 其实就是最大化子图和它被分配到的主题的相似度。因为在进行表示学习时representation会发生变化,可能会导致退化的问题,比如所有的表示都聚到一个cluster。所以这里引入了一个约束H(Q).

M-step的目标是在已知最优Q的情况下,寻找似然函数最大化时对应的参数,更新encoder的参数和motif embedding table。相当于一个label为Q,预测得分为S的K-分类问题。利用负对数似然做损失函数,这里的S做了softmax normalization.

motif learner的作用就是在给定的子图上学习他们的主题。

Motif-guided subgraph segmenter

包含n个节点的graph通过encoder得到每个节点的embedding, 计算了节点两两之间的相似度。通过A,进行谱聚类:将聚类后,组成成分多于3个节点的子结构作为subgraph, 聚合子结构包含的所有节点embedding作为subgraph embedding.

它的训练基于一种直觉:如果子图和主题很相似,那么子图的节点embedding随着update也会相似。Loss:如果子图和任意主题相似度高于某个阈值,就让子图中节点的affinity values更高,这些节点和不在子图中的其他节点的affinity values越低。

经过训练,在下一个sampling回合中,产生出来的motif-like的子图的节点更有可能被分割在一起,这样的子图才会更有意义。

Contrastive learning between graph and subgraphs

图和从这张图中sample出的子图作为positive pairs;这张图和从其他图中sample出的子图作为negative pairs. W是图和子图的相似度矩阵。

Joint training

训练时同时考虑三个模块的损失。

实验与结果

1.两种evaluation protocol:

2.五个最频繁出现的主题,用与他们最相近的subgraph表示:

3.Ablation study

欢迎有兴趣的同学阅读原文。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 网站。

论文浅尝 | 主题驱动的分子图表示对比学习相关推荐

  1. 论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

    随着监督学习在机器学习领域取得的巨大发展,如何减少人工在样本方面的处理工作,以及如何使模型快速适应层出不穷的新样本,成为亟待解决的问题.零样本学习(Zero-Shot Learning, ZSL)的提 ...

  2. 论文浅尝 | 主题感知的问答生成

    Citation: XingC, Wu W, Wu Y, et al. Topic aware neural response generation[C]//Thirty-FirstAAAI Conf ...

  3. 论文浅尝 - ICLR2020 | 用于半监督分类的图形推理学习

    论文笔记整理:周虹廷,浙江大学研究生.研究方向:知识图谱,图表示学习等. 论文链接:https://arxiv.org/pdf/2001.06137.pdf 本文是发表在ICLR2020上针对图数据做 ...

  4. 论文浅尝 | AAAI2020 - 基于规则的知识图谱组合表征学习

    论文笔记整理:康矫健,浙江大学计算机科学与技术系,硕士研究生. 论文链接:https://arxiv.org/pdf/1911.08935.pdf 发表会议:AAAI 2020 Motivation ...

  5. 论文浅尝 | 基于动态记忆的原型网络进行元学习以实现少样本事件探测

    本文转载自公众号:浙大KG. 论文题目:Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event ...

  6. 论文浅尝 | 将字面含义嵌入知识图谱表示学习

    论文笔记整理:吴桐桐,东南大学博士生,研究方向为知识图谱,自然语言处理. 链接:https://arxiv.org/pdf/1802.00934.pdf 本文主要关注知识图谱中的链接预测问题,在既有的 ...

  7. 论文浅尝 | 利用冻结语言模型的多模态少样本学习

    笔记整理 |  李磊,浙江大学硕士,研究方向为自然语言处理 链接:https://arxiv.org/abs/2106.13884 动机 大规模的自回归语言模型(如GPT)在预训练阶段学习到了大量的知 ...

  8. 论文浅尝|简单高效的知识图谱表示学习负样本采样方法

    笔记整理 | 陈名杨,浙江大学在读博士生,主要研究方向为知识图谱表示学习 Introduction 研究知识图谱表示学习(KnowledgeGraph Embedding)可以解决当前很多应用的基本问 ...

  9. 论文浅尝 | 近期论文精选

    本文转载自公众号 PaperWeekly, 对我们近期的论文浅尝进行了精选整理并附上了相应的源码链接,感谢 PaperWeekly! TheWebConf 2018 ■ 链接 | https://ww ...

最新文章

  1. [原创]WildPackets Omnipeek介绍
  2. MYSQL数据库从A表把数据插入B表
  3. Wrong permissions on configuration file, should not be world writable
  4. Silverlight数据加载时,等待图标显示与隐藏(Loading)
  5. GMT 时间日期格式
  6. 标记语言Markdown介绍以及日常使用
  7. Java获取成员变量构造函数信息
  8. 攻击 | 神奇的木马(虚拟机模拟木马入侵)
  9. matlab程序设计课件,《MATLAB程序设计》PPT课件.ppt
  10. t分布em参数估计matlab,参数估计的MATLAB实现.ppt
  11. 如何提高接收机的灵敏度
  12. 想成为硬件工程师,难不?
  13. ZSTU OJ-4454 招兵买马
  14. 链路聚合+MSTP实验
  15. Welcome to Pete Brown's 10rem.net
  16. Nginx+Apache一前一后双引擎驱动的你网站
  17. 专访铃盛(RingCentral)何必苍:以不断创新的MVP赋能未来混合办公
  18. win10防火墙_Win10端,iCloud报错:鉴定过程中发生错误
  19. Orchestrator Lastest Slave选择逻辑“不合理“导致的数据丢失问题
  20. MATLAB画对数坐标

热门文章

  1. MinGW与MSVC编译的区别
  2. 基于STC89C52的韦根数据接收
  3. 调试LCD反被调戏了
  4. c++ doxygen 注释规范_利用Doxygen给C程序生成注释文档
  5. 每日一题(33)——用两个栈实现一个队列的功能?要求给出算法和思路
  6. python刘卫国实验题_MATLAB 程序设计与应用(刘卫国版)习题答案3-4
  7. python中import os_Python常用模块os--与操作系统交互
  8. 数据结构之平衡树:2-3查找树的介绍——16
  9. 天池 在线编程 所有子数组之和(排列组合)
  10. LeetCode 995. K 连续位的最小翻转次数(差分思想)