Attributed Network Embedding for Learning in a Dynamic Environment 在2017年发表于CIKM

提出了DANE,一种将网络拓扑与节点特征相结合的动态网络表征学习(Dynamic NRL)方法

论文连接:https://arxiv.xilesou.top/pdf/1706.01860


目录

1 常用符号

2 整体架构

3 DANE模型

3.1 离线模型

(1)各自的嵌入向量

(2)共识向量的学习

3.2 在线模型

3.3 计算复杂性分析

4 实验

4.1 数据集

4.2 实验设定

4.3 无监督 网络聚类 实验结果

4.4 有监督 节点分类 实验结果

4.5 效率


现实网络:网络结构会随时间而不断演化(节点/边的增加或删除);节点有着丰富的属性,且属性值也会发生变化。

动态属性网络(Dynamic Attributed Networks):网络结构或节点属性都会随时间改变的网络

动态属性网络的嵌入是一项艰巨的任务,因为:

  1. 尽管网络拓扑和节点属性是两种不同的数据表示,但其本质上是相关的;另外,原始数据可能是充满噪声的或甚至是不完整的。因此,寻找一种抗噪声的共识(consensus)嵌入来捕捉它们各自的属性与相关性非常重要。
  2. 在每个time step上都从头开始应用离线嵌入方法非常耗时,并且无法捕捉及时出现的模式(不是很理解这句话,放上原文:cannot seize the emerging patterns timely)。因此,设计一种可以迅速给出嵌入表示的高效在线算法很有必要。

对此,提出了一种用于动态属性网络的新的嵌入框架DANE(Dynamic Attributed Networks Embedding):

  • 提出了一种离线嵌入方法作为基本模型,从网络结构和节点属性两个方面保留节点的近似度,以实现共识嵌入表示
  • 为了在网络结构和节点属性发生改变时及时获得更新的嵌入表示,提出了一种在线模型,基于矩阵扰动理论更新共识嵌入

1 常用符号

\mathcal{U}^{(t)}=\{u_1, u_2, ..., u_n\}表示属性网络\mathcal{G}^{(t)}在时刻 t 的 n 个节点的集合

A^{(t)}\in R^{n\times n}

每个节点有 d 维属性\mathcal{F}=\{f_1, f_2, ..., f_n\}

X^{(t)}\in R^{n\times d}


2 整体架构

作者假设节点的个数是不会随时间发生变化的,但也提到了该方法可以扩展到有节点增加/删除的场景。

DANE可以分解为以下两个子问题:

  1. DANE在时刻 t 的离线模型:输入网络拓扑A^{(t)} 和节点属性X^{(t)},输出所有节点的属性网络嵌入Y^{(t)}
  2. DANE在时刻 t+1 的在线模型:输入网络拓扑A^{(t+1)} 、节点属性X^{(t+1)} 、时刻 t 的嵌入结果Y^{(t)} ,输出所有节点的属性网络嵌入Y^{(t+1)}

整体入图所示:


3 DANE模型

3.1 离线模型

核心思想:先学习网络拓扑和节点属性各自的嵌入向量,再结合两者学习共识嵌入。

  • 网络拓扑和节点属性以不同的节点属性表示,且都可能是不完整的或有噪声的
  • 两种表示的可以互补达到共识嵌入,以实现更好的嵌入,而噪声的存在会削弱共识嵌入的学习
  • 在学习共识嵌入之前,需削弱噪声

(1)各自的嵌入向量

a 对于网络拓扑:

A^{(t)}:邻接矩阵

D^{(t)}(i, j)=\sum _{j=1}^{n}A^{(t)}(i, j):对角矩阵

L_{A}^{(t)}=D_{A}^{(t)}-A^{(t)}:Laplacian矩阵

根据谱图理论,将网络中的每个节点映射到 k 维嵌入空间(y_i\in \double{R}^k,k远远小于n),网络中的噪声会大大降低。

嵌入Y_A^{(t)}=[y_1, y_2, ..., y_n]'\in R^{n\times k}的合理选择(目标函数)是最小化损失函数:,保证了相连的函数在嵌入空间中相聚很近。

此时,这个问题归结为了广义特征问题a_1, a_2, ..., a_n为特征值0= \lambda_1 \leq \lambda_2 \leq...\leq \lambda_n对应的特征向量。

网络结构的k维嵌入即为从a_2 开始的前 k 个特征向量,即Y_A^{(t)}=[a_2, a_3, ..., a_k, a_{k+1}]

b 对于节点属性

以类似的方式减少节点属性中的噪声

首先归一化每个节点的属性,获得consine相似度矩阵W^{(t)}

得到W^{(t)}对应的前k个特征向量作为对应的节点属性的嵌入Y_X^{(t)}=[b_2, b_3, ..., b_k, b_{k+1}]

由此,解决了噪声问题

(2)共识向量的学习

  • 利用 Y_A^{(t)} 和 Y_X^{(t)}学习共识向量
  • 为捕捉二者的相互依赖性使其互补,应最大化其相关性,或最小化其分歧性
  • 试图寻找两个投影向量 p_A^{(t)} 和 p_X^{(t)},满足投影之后 Y_A^{(t)} 和 Y_X^{(t)}的相关性最大,等价于解决下述优化问题:

  • p_A^{(t)} 和 p_X^{(t)}的最优解对应于以下广义特征问题,取广义特征问题的前 l 个特征向量,并连接在一起得到了P^{(t)}\in R^{2k\times l}

  • 最终的共识嵌入表示为

3.2 在线模型

  • 动态属性网络在两个time step间的演化是平滑的
  • \Delta A\Delta X表示网络结构扰动和节点属性扰动
  • 对角矩阵和Laplacian矩阵也会平滑的演化

  • 离线模型集中于找到广义特征问题中最小特征值对应的特征向量
  • 在线模型的核心思想为:找到一种有效的方式来个更新最大特征向量与对应的特征值

以网络拓扑为例:

  • 根据矩阵扰动理论:网络结构在新的time step的嵌入有公式:
  • 对于特定的特征对儿(\lambda_i, a_i)
  • 问题则变成了如何利用\Delta D\Delta L计算(\Delta \lambda_i, \Delta a_i)

特征值的改变\Delta \lambda_i

特征向量的改变\Delta a_i

整体更新过程如算法1所示:

节点属性的过程类似

3.3 计算复杂性分析

  • T个time step上的在线embedding算法的时间复杂性为
  • T个time step上的离线embedding算法的时间复杂性为

4 实验

4.1 数据集

  • BlogCatalog
  • Flickr
  • Epinions
  • DBLP

4.2 实验设定

任务:无监督网络聚类、有监督节点分类

Baseline:DeepWalks, LINE, DANE-N, DANE-A, CCA, LCMF, DANE-O

4.3 无监督 网络聚类 实验结果

4.4 有监督 节点分类 实验结果

4.5 效率

不同Time Step的运行时间

不同嵌入维度的加速率

有任何错误欢迎留言讨论

论文链接已在开头给出

转载请联系我授权,并注明出处。

【论文解读】Attributed Network Embedding for Learning in a Dynamic Environment相关推荐

  1. 论文 | 属性网络嵌入 Attributed Network Embedding

    论文 | 属性网络嵌入 Attributed Network Embedding 前言 Why this article? Network Embedding相关工作 Network Embeddin ...

  2. 【论文阅读|深读】DANE:Deep Attributed Network Embedding

    目录 前言 Abstract 1 Introduction 2 Related Works 2.1 Plain Network Embedding 2.2 Attributed Network Emb ...

  3. [论文解读] Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey

    Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey 文章目录 Adversaria ...

  4. 【论文导读】- E-LSTM-D: A Deep Learning Framework for Dynamic Network Link Prediction(动态网络链接预测)

    文章目录 论文信息 摘要 论文贡献 问题定义 动态网络 动态网络链接预测 E-LSTM-D 框架 Encoder–Decoder结构 1. 编码器(Encoder) 2. 解码器(Decoder) 堆 ...

  5. 【论文解读 ASONAM 2019】Semi-Supervised Learning and Graph Neural Networks for Fake News Detection

    论文题目:Semi-Supervised Learning and Graph Neural Networks for Fake News Detection 论文链接:https://ieeexpl ...

  6. 论文解读|2020TPAMI|Deep High-Resolution Representation Learning for Visual Recognition

    用于视觉识别的深度高分辨率表征学习 github:https://github.com/HRNet 论文地址:https://arxiv.org/pdf/1908.07919 摘要 高分辨率表示对于位 ...

  7. 【论文阅读】FSADA:Joint network embedding of network structure and node attributes via deep autoencoder

    目录 简介 论文简介 abstract 1. Introduction 2. Related work 2.1. Structure preserving network embedding 2.2. ...

  8. Associative Embedding: End-to-End Learning forJoint Detection and Grouping论文笔记

    一.介绍 在进行多人姿态估计的bottom-top方法时,一个直观的想法是能不能得到一个表示归属的标签,类似id,同一个人的不同点都应该是同一个标签值.但是我们无法预知输入中可能会出现几个人,而且也不 ...

  9. 【异构图笔记,篇章3】GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding

    [异构图笔记,篇章3]GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding 上期回顾 论文信息概览 论 ...

最新文章

  1. 工业互联网的十大关键传感器
  2. java jar 配置_java jar包与配置文件的写法
  3. 为什么单击用户账户没有反应_为什么您的网站没有流量?是因为用户搜不到你!...
  4. Android学习笔记
  5. 【华为云技术分享】【Python算法】分类与预测——决策树
  6. bzoj1304 [CQOI2009]叶子的染色 dfs+树形dp
  7. App个人信息保护合规十大常见问题及处置策略
  8. webrtc项目编译报错(image not found)
  9. 足球比赛两强相遇概率
  10. 【杂谈】路由器在AP模式下使用多账号连接校园网(电脑)
  11. mxplayer battle游戏接入
  12. PCL:getCircumcircleRadius ❤️ 计算三角形外接圆半径
  13. 用友U8V10.1软件安装教程
  14. 只言片语 —— eFPGA
  15. VSCode绿豆沙主题,爱护你的眼睛,丢掉深色背景
  16. MAF 项目创建流程
  17. 单纯版九九乘法口诀表
  18. 【转】现学现用WPS,小技巧大帮助
  19. 记一次频繁YoungGC生产问题排查思路及解决方案
  20. 【干货收藏】数据分析师必备的20种分析思维

热门文章

  1. matlab求内切圆,MATLAB:定位手掌最大内切圆
  2. 关于移动应用在线开发平台AppCan:内行看门道外行看热闹
  3. Django框架(十七:session和cookie)
  4. 正则表达式与“三贱客”
  5. 冲杀职场的10只魔戒
  6. uniAPP 原生插件测试 提示 未配置AppKey或配置错误问题排查
  7. 西门子s7 200smart与3台欧姆龙E5cc温控器通讯控 功能:可以直接应用现场!实现西门子s7 200smart对3台欧姆龙E5cc温控器进行485通讯控制
  8. 【原创】反调试技巧总结-原理和实现(1)(2)(3)(4)(5)(6)......
  9. Linux虚拟机新增磁盘分区格式化和挂载
  10. 【CheatSheets】AI速查表集合 一图胜千言