通过近段时间的学习,自己发现无论基于多层图一般方法还是基于随机游走,还是模糊,所以这次查阅了相关资料,其中有包含随机游走的介绍。

1 为什么引入图?

我们身处的世界关系都可以建模为图的结构,用图的节点或节点属性表示真实网络系统中的实体或实体标签,用图中的边表示真实网络中的实体关系。因此,通过图嵌入方法可以提高效率等优势。

2 图的特点

  • 海量
  • 高维
  • 稀疏
  • 异构
  • 复杂
  • 动态
    图嵌入是一种图表示学习方法,需要将高维向量映射到低维空间。

3 图嵌入问题及定义

【图嵌入】将图的节点或边映射到一个低维的向量空间,即将海量、高维、异构、复杂和动态的数据表示为 统一、低维、稠密的向量,用以保存图的结构和性质,旨 在实现节点分类与聚类、链接预测、图的重构和可视化 等,提供一种具有更低计算复杂度的方法.

【定义】
定义1(图)图通常表示为 G =(V,E),其中V 表示节点集,E 表示边集。

定义2(静态图)给定图 G =(V,E),如果节点和边的状态不随时间变化,图G 为静态图。

定义3(动态图)动态图可以按时间分成一系列演化图 G =(G1, G2,⋯, GT),T 表示演化图的数量。每个演化图 Gt=(Vt,Et) 表示节点和边在 t 时刻的状态。

动态图包含快照型和连续时间型(见下图所示)。快照型动态图按时间序列将动态图分解为等间隔的静态图;连续时间型用多个时间戳标记每条边来保留节点间的连接变化。

定义4(一阶相似度)一阶相似度描述节点之间的成对邻近度。如果节点 vi 和 vj 的一阶相似度为边权重 wij和 vj 之间存在一条边,vi ;如果在 vi和 vj 之间没有边,一阶相似度为0。

定义5(二阶相似度)二阶相似度描述节点邻域 = [wi1,wi2,⋯,win] 表示节点 vi 和 vj 的二阶相似结构的相似度。假设 wi与其他节点的一阶相似度,那么 vi 度由 wi 和 wj 的相似程度决定。

定义6(图嵌入)图嵌入将每个节点映射成低维向量表示(如下图所示),同时保留了原始图中某些关键信 息。映射函数通常定义为 f: vi嵌入向量的维度。

图嵌入内容体系

图嵌入模型分类汇总

常用符号及定义

4 图嵌入方法

  • 基于矩阵分解的图嵌入方法
  • 基于随机游走的图嵌入方法
  • 基于深度学习的图嵌入方法

//这篇主写随机游走,下篇整理深度学习

4.1 基于随机游走图嵌入方法

通常采用不同的游走策略获取图的局部结构和全局结构,并且生成节点序列,再利用Skip-gram算法完成图中节点的降维嵌入。图的结构分为同构和异构图,因此基于随机游走的图嵌入方法也各有千秋。

4.1.1 同构网络中的随机游走

(1)深度游走( DeepWalk) 是基于 Word2vec 提出的一种图嵌入方法,是语言模型和无监督学习从单词序列到图上的一种扩展,首先随机生成网络中节点的邻居节点、形成定长的随机游走序列,再用 Skip-Gram 模 型对生成的定长节点序列映射成低维嵌入向量.该方法能学习到节点对的关系信息,时间复杂度为 O( log | V| ) ,实现了动态图的增量学习.

【缺点】

  • 不适合带权图,只能保持图的二阶相似性;
  • 有限的步长会影响上下文信息的完整性;
  • 面对大规模的图,调整超参数较复杂,且游走步数超过2^5 后嵌入效果不够显著。

(2) 节点-向量模型(Node2vec)

通过分别调整广度优先游走( Breadth-First Search,BFS) 和 深度优先游走 ( Depth-First Search,DFS ) 策略的参数,来获取图的全局结构和局部结构.

【具体步骤】

  1. 计算转移概率,结合 BFS 和 DFS 生成随机游走序列,
  2. 用 Skip-Gram 模型对生成的游走序列进行嵌入.

【优点】每一步都能可并行处理,能保持语义信息和结构信息。

【缺点】对于含有特定属性的节点嵌入效果仍有待提高.

4.1.2 异构网络中的随机游走

元路径-向量模型(Metapath2vec)

采用基于元路径的随机游走策略得到的嵌入效果, 明显优于基于同构网络的随机游走方法在异构网络上的嵌入效果.

【 具体步骤】:

  1. 对网络中的节点建立元路径,根据节点在元路径中的距离和节点之间的语义关系生成游走序列
  2. 对节点序列采用 Skip-Gram 模型实现节点嵌入.

【缺点】该方法在大规模图上的嵌入效果不佳,且不能自动学习有意义的元路径,也不能实现节点嵌入的增量更新.

4.2 基于随机游走的静态图嵌入

基于随机游走的静态图嵌入模型通过随机游走获得训练语料库,然后将语料库集成到Skip-Gram获得节点的低维嵌入表示。

(1)Deepwalk
Deepwalk使用随机游走对节点进行采样,生成节点序列,再通过Skip-Gram最大化节点序列中窗口 w 范围内节点之间的共现概率,将节点 vj 映射为嵌入向量Yj。

公式为:
生成的嵌入Y 将节点之间的关系编码在低维向量空间,用于捕捉邻域相似性和社区结构,学习节点的潜在特征。
【Deepwalk模型优点】Deepwalk不仅在数据量较少时有较好的表现,还可以扩展到大型图的表示学习。
【DeepWalk模型缺点】优化过程中未使用明确的目标函数,使得模型保持网络结构的能力受到限制。

(2)Node2vec
node2vec在Deepwalk的基础上,引入有偏的随机游走,增加邻域搜索的灵活性,生成质量更高、信息更多的嵌入表示。通过设置 p 和 q 两个参数,平衡广度优先搜索(breadth-first sampling,BFS)和深度优先搜索(depth-first sampling,DFS)策略,使生成的嵌入能够保持社区结构等价性或邻域结构等价性。
【优点】node2vec能够保持更多的一阶相似度和二阶相似度信息
【缺点】缺少明确的目标函数来保持全局网络结构。

【Deepwalk & node2vec遇到的问题】
Deepwalk和node2vec采用随机游走探索节点局部邻域,使得学习到的低维表示无法保留图的全局结构,同时使用随机梯度下降求解非凸的目标函数, 使生成的嵌入可能陷入局部最优解。

4.3 基于随机游走的动态图嵌入

基于随机游走的动态图嵌入模型将每条边与对应时刻相关联,使随机游走序列由一系列包含递增时刻的边所连接的节点构成,最后利用Skip-Gram模型将每个节点映射成 d 维向量。

5 参考文献

[1] 袁立宁,李欣,王晓冬,刘钊. 图嵌入模型综述[J].计算机科学与探索,2022,16(01):59-87.
[2] 祁志卫,王笳辉,岳昆,乔少杰,李劲. 图嵌入方法与应用:研究综述[J]. 电子学报,2020,48(04):808-818
[3] GOYAL P,FERRARA E. Graph embedding techniques,applications,and performance: A survey[J]. KnowledgeBased Systems,2018,151: 78 - 94.
[4] CAI H,ZHENG V,CHANG C. A comprehensive survey of graph embedding: problems,techniques and applications [J]. IEEE Transactions on Knowledge and Data Engineering,2018,30 ( 9) : 1616 - 1637.
[5] CUI P,WANG X,PEI J,et al. A survey on network embedding[J]. IEEE Transactions on Knowledge and Data Engineering,2019,31( 5) : 833 - 852.
[6] HAMILTON W,YING R,LESKOVEC J. Representation learning on graphs: methods and applications[J]. IEEE Data Engineering Bulletin,2017,40 ( 1) : 52 - 74.
[7] 涂存超,杨成,刘知远,等. 网络表示学习综述[J]. 中国 科学: 信息科学,2017,47 ( 8) : 980 - 996. TU Cunchao,YANG Cheng,LIU Zhiyuan,et al. Network representation learning: an overview[J]. SCIENTIA SINICA Informationis,2017,47 ( 8) : 980 - 996. ( in Chinese)

图嵌入综述整理(上)相关推荐

  1. 图嵌入综述 (arxiv 1709.07604) 译文第一、二章

    原文:A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications (arxiv 1709.0760 ...

  2. 图嵌入综述 (arxiv 1709.07604) 译文五、六、七

    应用 图嵌入有益于各种图分析应用,因为向量表示可以在时间和空间上高效处理. 在本节中,我们将图嵌入的应用分类为节点相关,边相关和图相关. 节点相关应用 节点分类 节点分类是基于从标记节点习得的规则,为 ...

  3. 图嵌入综述 (arxiv 1709.07604) 译文 4.1 ~ 4.2

    原文:A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications (arxiv 1709.0760 ...

  4. 图嵌入综述 (arxiv 1709.07604) 译文第三章

    原文:A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications (arxiv 1709.0760 ...

  5. 知识表示学习与图嵌入综述

    文章目录 一.任务的介绍与背景 1.1 表示空间 1.2 打分函数 1.3 编码模型 1.4 结合辅助信息 1.5 图表示学习 二.典型方法 三.各方法综述和性能比较 3.1 基于矩阵特征向量计算 3 ...

  6. Facebook开源了超大规模图嵌入算法,上亿个节点也能快速完成

    https://www.toutiao.com/a6675562914365047300/ 图,是很有用的数据结构,用节点 (Node) 和边 (Edge) 织成一张网.比如,知识图谱就是这样的网. ...

  7. 图嵌入综述 (arxiv 1709.07604) 译文 4.3 ~ 4.7

    原文:A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications (arxiv 1709.0760 ...

  8. 【推荐系统】基于图嵌入技术的推荐系统长文综述

    |作者:邓月 | 单位:电子科技大学 | 研究方向:图嵌入技术.推荐系统 近几年,基于图嵌入技术的推荐系统已成为一个热门的研究焦点,并将随着图嵌入技术的不断发展而持续.近日发布的<基于图嵌入技术 ...

  9. 随机邻域嵌入_图嵌入(Graph embedding)综述

    最近在学习Embedding相关的知识的时候看到了一篇关于图嵌入的综述,觉得写的不错便把文章中的一部分翻译了出来.因自身水平有限,文中难免存在一些纰漏,欢迎发现的知友在评论区中指正. 目录 一.图嵌入 ...

  10. 随机邻域嵌入_[读综述] 图嵌入的应用

    [读综述] 图嵌入的应用 论文原文:Graph Embedding Techniques, Applications, and Performance: A Survey (图嵌入技术.应用与性能:综 ...

最新文章

  1. 月薪3万的程序员都避开了哪些坑
  2. LOJ#2302 整数
  3. wcf客户端动态嗅探服务实例
  4. 批量域更改客户端本地administrator密码
  5. conda pip安装在哪里_TensorFlow 2.0 安装指南
  6. Intel提供的面向机器学习和深度学习的优化工具和框架
  7. 五分钟快速过完Verilog HDL基本概念(3)语法讲解
  8. C语言读取文件输入输出
  9. 智能优化算法——蝙蝠算法(PythonMatlab实现)
  10. Android手势密码解锁设计
  11. Excel自定义格式千分符
  12. 让天底下没有难接的支付|支付宝网银直连转账到银行卡对接故事续集 支付对接不是一个单纯技术问题 网银直连转账到银行卡开通方式揭晓
  13. 父亲节华为P40软文营销广告
  14. unity如何调用另一个脚本中的变量
  15. AutoMapper源码解析
  16. 数据结构中树的直径问题
  17. BIND9手册【转】
  18. 阿里巴巴CEO马云曾经注册过的N个搞笑商标 只有你想不到
  19. 优雅炫酷的WordPress 导航主题 适合做小众化导航站 源码下载
  20. Windows上ffmpeg使用GPU硬件加速多路rtsp转HLS直播流

热门文章

  1. 产品级Flutter开源项目FunAndroid,Provider MVVM的最佳实践
  2. Oracle VM VirtualBox不能正常运行(电脑强行关机后,Linux不能正常运行)
  3. 互联网日报 | 5月18日 星期二 | 中国移动启动A股上市;京东物流启动全球招股;快手发布首款自研手游产品...
  4. MySQL--- 有哪些“饮鸩止渴”提高性能的方法?
  5. Excel数组与数组公式
  6. Docker问题:ERROR: Pool overlaps with other one on this address space
  7. 加载网页时弹出div
  8. 凸包(convex hull),凸包络面(convex envelope), 凸低估计量(convex underestimator), 图上方(epigraph),
  9. qq等级查询php源码,基于PHP的QQ等级计算器
  10. 我所热爱的多触摸系统 bill buxton