异构信息网络中的深层集合分类

摘要

在过去十年中,集体分类引起了相当大的关注,在这十年中,一组实例中的标签是相互关联的,应当集体推断,而不是独立地推断。传统的集体分类方法主要集中在开发简单的关系特征(例如计数和存在于相邻节点上的聚合器)。然而,许多现实应用程序涉及到实例之间的复杂依赖关系,这些依赖关系在网络中是模糊的/隐藏的。为了在集体分类中捕获这些依赖关系,我们需要超越简单的关系特性,并提取实例之间的深层依赖关系。本文研究了异构信息网络中的深层次集体分类问题,它涉及到不同类型的自相关,从简单到复杂的关系。与传统的自相关不同,复杂自相关由网络中的链路显式给出,复杂自相关在HIN中是模糊的/隐藏的,应该按照层次顺序从现有链接中推断出来。由于节点间依赖性的多样性和关系特性的复杂性,这一问题具有很高的挑战性。本研究提出了一种深卷积集体分类方法,即图形感知,以了解HIN中的深层关系特征。该方法能自动生成复杂度不同的关系特征层次。通过对四个现实世界网络的大量实验表明,该方法能够通过考虑HINs中的深层关系特征来提高集体分类性能。

1.介绍

集体分类[30]旨在利用一组相互连接的实例之间的标签自相关,并集体预测它们的类标签。在许多关系数据中,不同实例的标签可以是相关的。例如,在书目网络中,由同一作者撰写的论文比由不同作者撰写的论文更有可能共享相似的主题。一个有效的关系数据模型应该能够捕获不同实例之间的依赖关系,并共同进行分类。在这一挑战的推动下,近年来对集体分类进行了广泛的研究[1,23,27,30]

以往关于集合分类的工作主要集中在传统的关系模型上,这在很大程度上依赖于专家对关系特征的设计。一方面,传统的关系特征通常被定义为节点的直接邻居的简单聚合,例如它们的标签的平均值或计数。另一方面,最近关于深度学习模型的研究[19]在许多领域提供了端到端的自动特征学习,如视觉[5]、语音和自然语言处理[32]。然而,目前对深度学习的研究主要集中在内容特征上,如图像数据中的视觉特征。它们还没有被用来在集体分类中提取深层关系特征,在关系学习中捕捉实例间的复杂自相关。

图1:DBLP网络中简单链接和隐藏链接的示例。这里实线表示DBLP网络中存在的简单关系,虚线表示现实世界中存在的隐藏关系,但应该从DBLP网络中推断出来,即合著者(蓝线)、顾问-顾问(粉红线)和共享顾问(红线)。

在本文中,我们研究了HINs中的深层集合分类问题,它涉及到实例之间不同类型的自相关的层次结构。例如,在图1中,我们展示了一个深度关系学习任务,即预测书目网络中作者的研究领域(标签)。不同的作者不仅通过合著关系显式地相互联系,而且通过潜在关系(如顾问-顾问、共享顾问、同事)隐式地联系。图1中的虚线表示真实世界中存在的作者之间的隐式关系,但只能在DBLP网络中进行推断。

尽管HINs中已有关于集体分类的方法[16,37],但由于以下原因,深层集体分类仍然是一个开放且具有挑战性的问题:

  • 深层关系特征:问题的一个主要挑战是HINs可能涉及不同类型自相关的层次结构,从简单到复杂。复杂的关系不是由网络中的链接直接给出的,而是由关系特征的层次结构推断出来的。例如,在图1中的DBLP网络中,作者之间存在共同作者关系(简单关系);顾问-顾问关系(隐藏关系)和共享顾问关系(复杂关系)。复杂关系,例如share advisor,不能直接由浅层关系特征(如合著者关系)建模,但可以从深层关系特征的层次结构中推断出来,从简单关系特征(合著者)、中等关系特征(advisor advise)到复杂关系特征(share advisor),如图2所示。例如,要推断advisor-adise关系,我们可以发现两个作者共享相似的相邻节点(这些邻居很可能是他们的顾问和研究组中的其他学生)。由于异构网络中实例之间的关系复杂而模糊,我们需要一个深层关系学习模型来提取实例之间的深层依赖层次。
  • 关系特征中的混合复杂性:问题的第二个主要挑战是关系特征中复杂程度的多样性。如图1所示,实例之间通常混合了简单依赖和复杂依赖,它们都与集体分类任务相关。在这些网络中,一个简单的关系模型只能捕捉简单的关系,但在复杂的关系上会存在拟合不足。另一方面,传统的深层次学习模型可能只捕捉到复杂的关系,但在简单的关系上会过度拟合。因此,一个理想的模型应该能够自动平衡其模型复杂性与复杂性的混合。
  • 异构依赖性:将深度学习模型应用于集体分类的第三个主要挑战在于HINs中节点类型和链接类型的多样性。不同类型的节点(链路)的性质有很大的不同,这使得直接应用深度学习模型变得困难。例如,图卷积模型[6]假设网络中的每个节点共享相同的卷积核,这在HINs中是站不住脚的。尽管在HINs文献[16,37]中已有一些关于集体分类的研究,但大多是浅层模型,忽略了网络中的深层关系特征。

为了解决上述问题,我们提出了一种用于HINs集合分类的深图卷积模型GraphInception。图3比较了graphiception和其他常规方法之间的差异。考虑到关系特征复杂程度的多样性(有的很简单,有的很复杂),为了更有效地研究关系特征,我们提出了图起始模块来平衡不同复杂度的关系特征。这个模型的灵感来自于inception模块[35],这是一个用于CNN的高效深度卷积模型,参数较少,层次较深。

2准备工作

我们用大写字母表示矩阵,用粗体小写字母表示向量,用手写字母表示集合。运算符⊗用于表示卷积运算。我们总结了表1中的所有符号。

2.1异构信息网络

在许多实际应用中,网络包括多种类型的节点和链路,称为异构信息网络[34]。

定义1。异构信息网络是一种特殊的信息网络,它可以表示为有向图G=(V,E)  表示节点集,包括m类型:,…, ,其中表示第i个类型实例。E⊆V×V  表示 V中节点之间的链路,涉及多种链路类型。

例如,如图1所示,DBLP网络包括三种类型的节点,例如作者、论文、会议,它们通过两种类型的链接连接,例如authoredBy、PublishedIn。

2.2 HINs中的集体分类

本文主要研究一类节点上的集体分类问题,而不是在HIN中对它们进行分类。其原因是不同类型节点的标签空间相差很大,因此,假设所有类型的节点共享同一组标签概念是不合理的。例如,在电影网络中,例如IMDB[9],电影类型分类任务的标签概念仅在电影节点上定义,而不是导演节点或演员节点。在特定的推理任务中,我们通常只关心一种类型节点上的推理结果。

在不丧失一般性的前提下,我们假设HIN

【论文翻译】异构信息网络中的深层集合分类相关推荐

  1. KDD 2019论文解读:异构信息网络上的对抗生成学习

    前言 网络表示学习是一种在低维空间中表示网络数据的方法,在异构信息网络分析中得到了广泛的应用.现有的异构信息网络表示学习方法虽然在一定程度上实现了性能的提高,但仍然存在一些主要的不足.最重要的是,它们 ...

  2. 【论文翻译】KDD19 -HeGAN: Adversarial Learning on Heterogeneous Information Networks 异构信息网络中的对抗学习

    文章目录 摘要 1 引言 2 定义 3 所提方法:HeGAN 3.1 整体框架 3.2 HeGAN中的生成器和鉴别器 4 实验 4.1 实验设置 4.2 实验分析 5 相关工作 6 结论 论文链接: ...

  3. 【论文翻译】HCGN:面向集体分类的异构图卷积网络深度学习模型

    HCGN:面向集体分类的异构图卷积网络深度学习模型 摘要 集合分类是研究网络数据的一项重要技术,旨在利用一组具有复杂依赖关系的互联实体的标签自相关性.随着各种异构信息网络的出现,集合分类目前正面临着来 ...

  4. 《异构信息网络挖掘: 原理和方法》—— 1.3 本书的内容组织

    本节书摘来自华章出版社<异构信息网络挖掘: 原理和方法法>一 书中的第1章,第1.3节,作者( 美)孙艺洲(Yizhou Sun),(美)韩家炜(Jiawei Han),更多章节内容可以访 ...

  5. 【论文翻译】异构信息网络挖掘的活动边缘中心多标签分类

    异构信息网络挖掘的活动边缘中心多标签分类 摘要 异构信息网络的多标签分类在社会网络分析中受到了新的关注.本文提出了一个以活动边缘为中心的多标签分类框架,用于分析具有三个独特特征的异构信息网络.首先,我 ...

  6. 【论文翻译】SHINE 一个用于特定领域实体与异构信息网络链接的通用框架

    SHINE 一个用于特定领域实体与异构信息网络链接的通用框架 摘要 由多种类型的互联对象组成的异构信息网络正变得越来越流行,例如社交媒体网络和书目网络.在异构信息网络中,将从非结构化文本中检测到的命名 ...

  7. 【论文翻译】HeteSim:异构网络中相关性度量的通用框架

    原文链接:https://blog.csdn.net/Mrong1013967/article/details/115330139 HeteSim:异构网络中相关性度量的通用框架 摘要 相似性搜索是许 ...

  8. 论文阅读——个性化实体推荐: 一种异构信息网络方法

    论文名称:<Personalized Entity Recommendation: A Heterogeneous Information Network Approach> 作者:Xia ...

  9. KDD 18 AAAI 19 | 异构信息网络表示学习论文解读

    作者丨崔克楠 学校丨上海交通大学博士生 研究方向丨异构信息网络.推荐系统 本文要介绍的两篇论文在 metric learning 和 translation embedding 的角度对异构信息网络中 ...

最新文章

  1. C# 实现简单打印(二)-打印一个文本文档,打印的内容是多行的
  2. QTP11补丁下载 – 完美支持FIREFOX 9~10
  3. Dynamics CRM中跨域调用Web API 2
  4. mysql 外键有啥用途_Mysql外键是什么?有哪些用处?(图文+视频)
  5. python 美化输出 错误 警告等信息_OpenCV抑制、隐藏或禁用输出到屏幕的错误或警告消息...
  6. ajax 原理----初级篇
  7. 容器化单页面应用中RESTful API的访问
  8. vscode 结束_21 个VSCode 快捷键,让代码更快,更有趣
  9. select scope_identity()
  10. php操作xml类,PHP实现的XML操作类【XML Library】
  11. h5难做吗_还在担心H5太难做?介绍一个H5制作工具给你!
  12. 联系实际谈谈管理者的沟通协调能力建设
  13. Android BINDER详解
  14. 字节码指令之类型转换指令
  15. C语言———求”完数“
  16. sql实现根据身份证计算年龄
  17. 小白必看的经典机器学习入门项目
  18. Magic-api介绍及使用
  19. 苏州大学 软件工程基础
  20. 企业网盘到底应该怎么选?

热门文章

  1. JMX : MXBean
  2. Chia官方矿池测试版正式上线!?
  3. 总监的烦恼:技术丢了怎么办?
  4. android 拨打多个电话号码,和多号如何使用副号打电话/发短信
  5. mysql数据存储过程添加数据_Mysql 存储过程 自动插入数据
  6. 计算机夏令营英语自我介绍,夏令营英语自我介绍
  7. xe android 摄像头,玩就要出彩 佳明VIRB XE运动摄像机评测
  8. 关于洛谷哪些题目(入门)
  9. Mac OS X在终端中打开文件夹窗口
  10. 美国大厂新员工薪资曝光! 微软最高近30万美元,TikTok低至时薪30美元