Embedding

  • 定义:Embedding在数学上是一个函数,即将一个空间的点映射到另一个空间,通常是从高维抽象空间映射到低维的具象空间
  • 意义:高维数据转换到低维有利于算法的处理,同时解决one-hot向量长度随样本变化而变化以及无法表示两个实体之间的相关性这一问题。
  • 常用方法:word2vec,根据语料库中单词的共线关系求出每个单词的embedding。常用的word2vec模型有cbow和skip-gram两种,其中cbow根据上下文预测中心词,skip-gram根据中心词预测上下文。

Graph Embedding


图1. Graph Embedding的常见几种分类

DeepWalk

  • 方法:将节点视为单词并生成短随机游走作为句子来弥补网络嵌入和单词嵌入之间的差距。
  • 优点:1. 可以按需生成随机游走。2. 可拓展,生成随机游走的过程高效且平凡的并行化。3. 引入了深度学习图形的范例。


skip-gram模型参考。

Node2vec

在DeepWalk的基础上,定义了一个bias random walk的策略生成序列,仍然用skip gram去训练。

  • 核心思想:采用Random Walk来代替DFS或BFS。通过定义参数在BFS和DFS中平衡。
  • 不足:硬要用skipgram或者wordvec的想法在networks上做显得比较牵强。因为存在Neighborhood概念在Graph上并不是很直观的定义。
  • 具体应用:腾讯的lookalike算法。

LINE

LINE也是一种基于领域的相似假设算法,与DeepWalk使用的DFS构造领域不同,LINE可以看作是一种使用BFS构造领域的算法。此外,LINE还可以运用在带权图中。

同时,LINE对顶点的相似度定义不同。

first-order proximity

1阶相似度用于描述图中成对顶点之间的局部相似度,即若两个点之间存在直连边,则边劝即为两点之间的相似度,若不存在直连边,则1阶相似度为0。
如上图,6和7之间存在直连边,且边权较大,则认为两者相似且1阶相似度较高,而5和6之间不存在直连边,则两者间的1阶相似度为0。

second-order proximity

如上图所示,虽然5和6不存在直连边,但是有许多相似的邻居顶点(1,2,3,4),也可以表示5和6是相似的,而2阶相似度就是用来描述这种关系的。
同样,若两个顶点之间不存在相同的邻居顶点,则2阶相似度为0。

目标是让NRL前后节点间相似度不变,即如果节点表示学习前如果两个节点比较相似,那么embedding后的两个节点表示向量也要相似。本文中用的是KL散度来衡量两个概率分布之间的距离。

图嵌入(Graph Embedding)方法小结相关推荐

  1. 图嵌入 (Graph Embedding)

    图嵌入 Random Walk Matrix Fractorization Meta Paths Deep Learning Others 开放资源 开源实现 论文列表和评测 图(Graph / Ne ...

  2. 深度学习中不得不学的Graph Embedding方法

    原文链接:https://zhuanlan.zhihu.com/p/64200072 深度学习中不得不学的Graph Embedding方法 王喆 ​ 数据挖掘等 3 个话题下的优秀答主 ​ 关注他 ...

  3. 【图嵌入】Graph Embedding 方法之 LINE 原理解读

    LINE 出自论LINE: Large-scale Information Network Embedding,与 DeepWalk 相比,比较明显的区别在于: DeepWalk 使用的深度优先搜索策 ...

  4. python画平行坐标图_Python实现平行坐标图的两种方法小结

    怎么用python实现一个坐标图的平移和缩放最容易想到的应该是DP算法,即取初始轨迹的起点A和终点B连线,计算每个点到这条线的距离,距离最大的点C若小于要分享误差则结束: 否则将C点加入压缩后的数据集 ...

  5. 主流图嵌入模型的原理和应用

    作者:蒋铭和全聪,腾讯 PCG 应用研究员 本文梳理了近几年主流的图嵌入(Graph Embedding)模型,并辅以相应的工业界应用,旨在通过算法原理+业务应用的方式更好地帮助大家了解这一领域的发展 ...

  6. 基于图嵌入的兵棋联合作战态势实体知识表示学习方法

    基于图嵌入的兵棋联合作战态势实体知识表示学习方法 人工智能技术与咨询 来源:<指挥控制与仿真>,作者王保魁等 摘 要:为将基于离散符号的兵棋联合作战态势实体知识表示为机器更加容易学习.处理 ...

  7. 流形结构、流形学习、图嵌入

    PCA. MNF 和 LDA 等方法是以统计学原理为基础,并根据统计学的某一优化准则,构建一个最佳模型,属于线性特征提取方法.此类方法的优点是模型确定.易于理解.处理方便和扩展性好等,但忽略了数据的空 ...

  8. 深入理解深度学习——图嵌入(Graph Embedding)

    分类目录:<深入理解深度学习>总目录 前面的文章介绍了由Word Embedding延伸出的Item Embedding等,这些延伸都建立在它们有序列特性的基础上.其实,可延伸的领域还有很 ...

  9. 【推荐算法】Graph Embedding——引入更多结构信息的图嵌入技术

    在互联网背景下,数据对象之间更多的是以图结构的方式呈现的,典型的例子就是由用户行为序列产生的物品关系图,以及由属性和实体之间组成的知识图谱(knowledge graph).在面对图结构时候,传统的序 ...

最新文章

  1. matlab中fprintf函数的具体使用方法
  2. linux ps aux 结果解释
  3. rust种的南瓜为什么老是消失_冷天早餐别将就,用南瓜和萝卜这样做,鲜香松软,营养好吃又管饱...
  4. flash特效原理:图片滑动放大效果(2)
  5. python 聚类_聚类算法中的四种距离及其python实现
  6. 安全研究公司Gauntlet称轻量级区块链协议Mina的攻击成本很高
  7. matlab查表svpwm,SVPWM的查表生成方式代码
  8. 做自媒体4大免费网站,帮助我们更快上手运营
  9. 计算机无法安装hp网络打印机,hp打印机驱动安装失败怎么办 hp打印机驱动安装失败的解决办法...
  10. java前景以及职业发展方向
  11. R语言中同比增长和环比增长
  12. 十步会用IOCOMP–iplotx控件
  13. 《2022年Java开发者生产力报告》出炉啦
  14. 电脑饥荒服务器未响应,《饥荒》联机版常见问题及解决方法一览
  15. 在谷歌浏览器上面安装AxueRP插件。
  16. mysql的安装后;Navicat连接出现1103详细解决方式
  17. 计算机应用基础网络统考操作,(全套)知识点练习-计算机应用基础-(网络统考-操作题-共152题)...
  18. GitHub超6.8万星,最全Python入门算法来了
  19. AltiumDesigner99——常用快捷键
  20. jsp未正确拼写字 mysql_(转)MySQL5.0中文问题及JDBC数据库连接和JSP汉字编码问题解决方法总结...

热门文章

  1. java利用FFMpeg将mp4转换为gif
  2. zephir-基本语法
  3. php 兼容火狐,HTML_总结CSS中火狐浏览器与IE浏览器的兼容代码,如何让你写的代码更兼容火狐 - phpStudy...
  4. cs231n资源入口总结
  5. 天使与海豚的爱情故事
  6. 计算机net是什么意思翻译,net是什么意思_net的翻译_音标_读音_用法_例句_爱词霸在线词典...
  7. Docker 搭建 EK 环境
  8. java.打印菱形_利用java程序打印空菱形
  9. LTE 随机接入 --(1)流程
  10. 阐述游戏AI设计的两个禁忌及解决方法