呆萌的图模型学习——基本概念(一)
图的基本概念
节点
节点可以分为两类:隐含节点和观测节点。边可以分为有向边或无向边。从概率论的角度来看,概率图模型是一个概率分布,图中的节点对应于随机变量,边对应于随机变量的相关性关系。给定一个实际问题,我们通常会观测到一些数据,并且希望能够挖掘出隐含在数据中的知识。那么怎样才能使用概率图模型挖掘这些隐藏知识呢?通常情况下我们会构建一个图:用观测节点表示观测到的数据,用隐含节点表示潜在的知识,用边来描述知识与数据的相互关系,最后获得一个概率分布。给定概率分布之后,通过进行两个任务获取知识:即推断 (给定观测节点,推断隐含节点的后验分布)和学习 (学习概率分布的参数)
想了解概率图模型?你要先理解图论的基本定义与形式: https://zhuanlan.zhihu.com/p/26133450
边
- 有向 Directed
- 方向
- 出度 out-degree:自己指向别人的边的数量
- 入度 in-degree:别人指向自己的边的数量
- 连接性
- 强连接 Strongly connected:A可以到B,B可以到A(A指向B,B指向C,C指向A,即AB之间为强链接);如果一部分节点之间都可以形成强链接,这部分节点可以组成一个“最大连接部分”(Strongly connected components)
- 弱连接 Weakly connected:不是强连接,即为弱连接
- 方向
- 无向 Undirected
- 度:这个节点与其他节点相连的边的数量
- 连通分量:无向图中的极大连通子图
- 有向 Directed
有向图也称为贝叶斯网络(有向无圈),也称信度网络或信念网络;无向图也称为马尔科夫网络。
概率图模型体系:HMM、MEMM、CRF: https://zhuanlan.zhihu.com/p/33397147
二部图 Bipartite graph:两个主体,既有内部的连接(一个主体内部的节点之间有链接),也有外部的连接(两个主体相互的链接)
其他概念:
联通性:
- 连通图:任意两个节点都可以通过边相连,没有孤立节点
- 非连通图:不是连通图
图直径:图中两两节点之间的最短路径的最大值
当前节点的度中心性=
节点的度/(全图的节点数量-1)
特征向量中心性:整个图的领接矩阵 -> 计算矩阵的特征值与特征向量 -> 选择特征值最大的特征向量
得出的特征向量中的值越大,表示这个节点的度越大,或相连的节点度越大,即更可能是图的中心
中介中心性:当前节点的中介中心性=
(图中其余节点,两两节点之间,经过该节点的最短路径,之和)/(图中其余节点,两两节点之间,最短路径的条数)
连接中心性:当前节点的连接中心性=
(图中全部节点数-1)/当前节点到其余节点的最短路径之和
图在计算机中使用邻接图表示
特殊结构的网络
随机图:随机图是指由随机过程产生的图 https://zh.wikipedia.org/wiki/%E9%9A%8F%E6%9C%BA%E5%9B%BE
无尺度网络:https://zh.wikipedia.org/wiki/%E6%97%A0%E5%B0%BA%E5%BA%A6%E7%BD%91%E7%BB%9C
衡量网络的一些指标
- 度的分布:degree distribution
度的基本概念:一个节点上连了多少条边,它的度就是多少。
度的分布:两个节点之间有链接,则度为1,否则为0。因此n个节点之间有n-1个连接关系,服从二项分布。当n取正无穷,则度的分布服从幂律分布 https://zh.wikipedia.org/wiki/%E5%BA%A6%E5%88%86%E5%B8%83
- 路径长度、图的直径:path length
概念:图中任意两点之间的最小距离,其中有向图中 d(u,v)不一定等于d(v,u)
- 聚合系数(积聚因子):clustering coefficient
计算公式是:N个节点的总边数/N个节点之间可以连接的最大边数
,其中最大边数一般是N的阶乘
- 连接的组件:connected components
基于图结构的图表示学习
核心思想是使用图论、数据挖掘等方法使学习后的向量尽可能多的保留图中的拓扑信息,以前的思想是使用1-hot或n-hot,但是复杂度高,容易组合爆炸(维度爆炸),因此现在主要使用随机游走采样获得一大堆序列(向量)来表示图。
deepwalk
使用随机游走的方法等概率跳
node2vec
使用人工权重取代等概率跳转
struc2vec
根据已有的图,在保留局部特征的前提下构建新图,然后做随机游走
metapath2vec
在异构图中学习特征
基于图特征的图表示学习
GCN,GNN等
- Basic gnn
- self-loops GNN
参考资料
随机图:
- http://www.qzu5.com/r.htm
- https://zh.wikipedia.org/wiki/%E9%9A%8F%E6%9C%BA%E5%9B%BE
- https://blog.csdn.net/qq_34213260/article/details/107472115
呆萌的图模型学习——基本概念(一)相关推荐
- 呆萌的图模型学习——使用networkx计算node2vec,得到节点与边的embedding(三)
networkx基本操作请参考:[呆萌的图模型学习--图基本信息 & Networkx基本操作(二)](呆萌的图模型学习--图基本信息 & Networkx基本操作(二)) node2 ...
- 呆萌的图模型学习——图基本信息 Networkx基本操作(二)
Networkx是python常用的处理图模型的工具包,可以方便的处理图模型: Github项目主页:https://github.com/networkx/networkx 官网基本教程:https ...
- 图表示学习和异质信息网络
图表示学习和异质信息网络 图表示学习 基本概念 相关技术 基于降维解析的方法 基于矩阵分解的方法 基于随机游走的方法 基于深度学习的方法 异质信息网络 基本概念 语义探索方法 元路径 受限元路径 加权 ...
- ICLR 2019计算机视觉、NLP、图模型、对抗学习、表示学习和元学习
https://www.toutiao.com/a6703123631590867459/ 原作者:Marina Vinyes 深度学习与NLP编译 关键词:Computer Vision, Natu ...
- 百度图神经网络学习——day02:图游走类模型
文章目录 一.DeepWalk和node2vec 1.DeepWalk 2.node2vec 二.methpath2vec及其变种 三.编程实践 1.DeepWalk实现 2.SkipGram模型训练 ...
- 图的概念与主要类型、图模型的应用场景
前言 图(Graph)是一个常见的数据结构,现实世界中有很多任务都可以抽象成图问题,比如社交网络,蛋白体结构,交通路网数据,以及很火的知识图谱等,甚至规则网络结构数据(如图像,视频等)也是图数据的一种 ...
- 图神经网络学习记录:《图神经网络综述:模型与应用》
Graph Neural Networks: A Review of Methods and Applications 摘要:大 ...
- 图模型+Bert香不香?完全基于注意力机制的图表征学习模型Graph-Bert
作者 | Jiawei Zhang.Haopeng Zhang.Congying Xia.Li Sun 译者 | 凯隐 编辑 | Jane 出品 | AI科技大本营(ID:rgznai100) [导读 ...
- 深度学习时代的图模型,清华发文综述图网络
选自arXiv 作者:张子威.崔鹏.朱文武 机器之心编译 参与:路.晓坤 深度学习在多个领域中实现成功,如声学.图像和自然语言处理.但是,将深度学习应用于普遍存在的图数据仍然存在问题,这是由于图数据的 ...
最新文章
- 面向对象 面向你(二)
- undefined reference to 'pthread_mutex_trylock'
- AspectJ切入点语法详解
- PAT 1042. 字符统计
- 使用 vue-qrcode 生成二维码
- Android应用进入爆发期 手机游戏仍是市场重心
- 基于链表的两个集合的差集
- bzoj 1082: [SCOI2005]栅栏(二分+DFS)
- MySQL-快速入门(1)基本数据库、表操作语句
- java 时间轮_惊艳的时间轮定时器
- AdapterView(一)
- win10安装IIS及操作使用
- bat脚本中如何多次键盘输入并判断_bat教程[282] @
- Windows图标显示异常解决方法。桌面图标异常,开始菜单图标异常,任务栏图标异常。图标缓存位置。
- 关于插件open-browaer-webpack-plugin
- 小米、维沃等知名企业启用“.CN”“.中国”域名
- 记一次 Cause: java.sql.SQLException: The user specified as a definer (‘XXX‘@‘%‘) does not exist的解决办法
- Jva实现银行系统的简写
- 策城软件服务器维护,策城智慧景区管理系统,景区系统软件
- BBB板 --重装操作系统