【论文解读】Attributed Network Embedding for Learning in a Dynamic Environment
Attributed Network Embedding for Learning in a Dynamic Environment 在2017年发表于CIKM
提出了DANE,一种将网络拓扑与节点特征相结合的动态网络表征学习(Dynamic NRL)方法
论文连接:https://arxiv.xilesou.top/pdf/1706.01860
目录
1 常用符号
2 整体架构
3 DANE模型
3.1 离线模型
(1)各自的嵌入向量
(2)共识向量的学习
3.2 在线模型
3.3 计算复杂性分析
4 实验
4.1 数据集
4.2 实验设定
4.3 无监督 网络聚类 实验结果
4.4 有监督 节点分类 实验结果
4.5 效率
现实网络:网络结构会随时间而不断演化(节点/边的增加或删除);节点有着丰富的属性,且属性值也会发生变化。
动态属性网络(Dynamic Attributed Networks):网络结构或节点属性都会随时间改变的网络
动态属性网络的嵌入是一项艰巨的任务,因为:
- 尽管网络拓扑和节点属性是两种不同的数据表示,但其本质上是相关的;另外,原始数据可能是充满噪声的或甚至是不完整的。因此,寻找一种抗噪声的共识(consensus)嵌入来捕捉它们各自的属性与相关性非常重要。
- 在每个time step上都从头开始应用离线嵌入方法非常耗时,并且无法捕捉及时出现的模式(不是很理解这句话,放上原文:cannot seize the emerging patterns timely)。因此,设计一种可以迅速给出嵌入表示的高效在线算法很有必要。
对此,提出了一种用于动态属性网络的新的嵌入框架DANE(Dynamic Attributed Networks Embedding):
- 提出了一种离线嵌入方法作为基本模型,从网络结构和节点属性两个方面保留节点的近似度,以实现共识嵌入表示
- 为了在网络结构和节点属性发生改变时及时获得更新的嵌入表示,提出了一种在线模型,基于矩阵扰动理论更新共识嵌入。
1 常用符号
表示属性网络在时刻 t 的 n 个节点的集合
每个节点有 d 维属性
2 整体架构
作者假设节点的个数是不会随时间发生变化的,但也提到了该方法可以扩展到有节点增加/删除的场景。
DANE可以分解为以下两个子问题:
- DANE在时刻 t 的离线模型:输入网络拓扑 和节点属性,输出所有节点的属性网络嵌入
- DANE在时刻 t+1 的在线模型:输入网络拓扑 、节点属性 、时刻 t 的嵌入结果 ,输出所有节点的属性网络嵌入
整体入图所示:
3 DANE模型
3.1 离线模型
核心思想:先学习网络拓扑和节点属性各自的嵌入向量,再结合两者学习共识嵌入。
- 网络拓扑和节点属性以不同的节点属性表示,且都可能是不完整的或有噪声的
- 两种表示的可以互补达到共识嵌入,以实现更好的嵌入,而噪声的存在会削弱共识嵌入的学习
- 在学习共识嵌入之前,需削弱噪声
(1)各自的嵌入向量
a 对于网络拓扑:
:邻接矩阵
:对角矩阵
:Laplacian矩阵
根据谱图理论,将网络中的每个节点映射到 k 维嵌入空间(,k远远小于n),网络中的噪声会大大降低。
嵌入的合理选择(目标函数)是最小化损失函数:,保证了相连的函数在嵌入空间中相聚很近。
此时,这个问题归结为了广义特征问题,为特征值对应的特征向量。
网络结构的k维嵌入即为从 开始的前 k 个特征向量,即
b 对于节点属性
以类似的方式减少节点属性中的噪声
首先归一化每个节点的属性,获得consine相似度矩阵
得到对应的前k个特征向量作为对应的节点属性的嵌入
由此,解决了噪声问题
(2)共识向量的学习
- 利用 和 学习共识向量
- 为捕捉二者的相互依赖性使其互补,应最大化其相关性,或最小化其分歧性
- 试图寻找两个投影向量 和 ,满足投影之后 和 的相关性最大,等价于解决下述优化问题:
- 和 的最优解对应于以下广义特征问题,取广义特征问题的前 个特征向量,并连接在一起得到了
- 最终的共识嵌入表示为
3.2 在线模型
- 动态属性网络在两个time step间的演化是平滑的
- 用和表示网络结构扰动和节点属性扰动
- 对角矩阵和Laplacian矩阵也会平滑的演化
- 离线模型集中于找到广义特征问题中最小特征值对应的特征向量
- 在线模型的核心思想为:找到一种有效的方式来个更新最大特征向量与对应的特征值
以网络拓扑为例:
- 根据矩阵扰动理论:网络结构在新的time step的嵌入有公式:
- 对于特定的特征对儿有
- 问题则变成了如何利用和计算
特征值的改变
特征向量的改变
整体更新过程如算法1所示:
节点属性的过程类似
3.3 计算复杂性分析
- T个time step上的在线embedding算法的时间复杂性为
- T个time step上的离线embedding算法的时间复杂性为
4 实验
4.1 数据集
- BlogCatalog
- Flickr
- Epinions
- DBLP
4.2 实验设定
任务:无监督网络聚类、有监督节点分类
Baseline:DeepWalks, LINE, DANE-N, DANE-A, CCA, LCMF, DANE-O
4.3 无监督 网络聚类 实验结果
4.4 有监督 节点分类 实验结果
4.5 效率
不同Time Step的运行时间
不同嵌入维度的加速率
有任何错误欢迎留言讨论
论文链接已在开头给出
转载请联系我授权,并注明出处。
【论文解读】Attributed Network Embedding for Learning in a Dynamic Environment相关推荐
- 论文 | 属性网络嵌入 Attributed Network Embedding
论文 | 属性网络嵌入 Attributed Network Embedding 前言 Why this article? Network Embedding相关工作 Network Embeddin ...
- 【论文阅读|深读】DANE:Deep Attributed Network Embedding
目录 前言 Abstract 1 Introduction 2 Related Works 2.1 Plain Network Embedding 2.2 Attributed Network Emb ...
- [论文解读] Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey
Adversarial Attacks on Deep Learning Models in Natural Language Processing: A Survey 文章目录 Adversaria ...
- 【论文导读】- E-LSTM-D: A Deep Learning Framework for Dynamic Network Link Prediction(动态网络链接预测)
文章目录 论文信息 摘要 论文贡献 问题定义 动态网络 动态网络链接预测 E-LSTM-D 框架 Encoder–Decoder结构 1. 编码器(Encoder) 2. 解码器(Decoder) 堆 ...
- 【论文解读 ASONAM 2019】Semi-Supervised Learning and Graph Neural Networks for Fake News Detection
论文题目:Semi-Supervised Learning and Graph Neural Networks for Fake News Detection 论文链接:https://ieeexpl ...
- 论文解读|2020TPAMI|Deep High-Resolution Representation Learning for Visual Recognition
用于视觉识别的深度高分辨率表征学习 github:https://github.com/HRNet 论文地址:https://arxiv.org/pdf/1908.07919 摘要 高分辨率表示对于位 ...
- 【论文阅读】FSADA:Joint network embedding of network structure and node attributes via deep autoencoder
目录 简介 论文简介 abstract 1. Introduction 2. Related work 2.1. Structure preserving network embedding 2.2. ...
- Associative Embedding: End-to-End Learning forJoint Detection and Grouping论文笔记
一.介绍 在进行多人姿态估计的bottom-top方法时,一个直观的想法是能不能得到一个表示归属的标签,类似id,同一个人的不同点都应该是同一个标签值.但是我们无法预知输入中可能会出现几个人,而且也不 ...
- 【异构图笔记,篇章3】GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding
[异构图笔记,篇章3]GATNE论文阅读笔记与理解:General Attributed Multiplex HeTerogeneous Network Embedding 上期回顾 论文信息概览 论 ...
最新文章
- 工业互联网的十大关键传感器
- java jar 配置_java jar包与配置文件的写法
- 为什么单击用户账户没有反应_为什么您的网站没有流量?是因为用户搜不到你!...
- Android学习笔记
- 【华为云技术分享】【Python算法】分类与预测——决策树
- bzoj1304 [CQOI2009]叶子的染色 dfs+树形dp
- App个人信息保护合规十大常见问题及处置策略
- webrtc项目编译报错(image not found)
- 足球比赛两强相遇概率
- 【杂谈】路由器在AP模式下使用多账号连接校园网(电脑)
- mxplayer battle游戏接入
- PCL:getCircumcircleRadius ❤️ 计算三角形外接圆半径
- 用友U8V10.1软件安装教程
- 只言片语 —— eFPGA
- VSCode绿豆沙主题,爱护你的眼睛,丢掉深色背景
- MAF 项目创建流程
- 单纯版九九乘法口诀表
- 【转】现学现用WPS,小技巧大帮助
- 记一次频繁YoungGC生产问题排查思路及解决方案
- 【干货收藏】数据分析师必备的20种分析思维
热门文章
- matlab求内切圆,MATLAB:定位手掌最大内切圆
- 关于移动应用在线开发平台AppCan:内行看门道外行看热闹
- Django框架(十七:session和cookie)
- 正则表达式与“三贱客”
- 冲杀职场的10只魔戒
- uniAPP 原生插件测试 提示 未配置AppKey或配置错误问题排查
- 西门子s7 200smart与3台欧姆龙E5cc温控器通讯控 功能:可以直接应用现场!实现西门子s7 200smart对3台欧姆龙E5cc温控器进行485通讯控制
- 【原创】反调试技巧总结-原理和实现(1)(2)(3)(4)(5)(6)......
- Linux虚拟机新增磁盘分区格式化和挂载
- 【CheatSheets】AI速查表集合 一图胜千言