CS224W 图机器学习(二)--图上的传统机器学习方法
图上的传统机器学习方法
- 一. Tradtion Feature-based Methods Node
一. Tradtion Feature-based Methods Node
传统机器学习方法,我们希望训练一个模型,在给定一个新节点,新链接或图的情况能够获取它的特征并做出预测。
在图的特征提取过程,我们将它转化成一个d维的向量,特征对象可以是节点,边,完整的图,节点集。这里我们考虑的图为无向图。
所以我们要解决的问题就是在给定 G=(V,E),如何学习节点V的特征来学习目标函数。
首先我们考虑节点水平上的任务,如上图所示做一个节点分类,我们希望从左图中学习到一些东西进而预测节点类别来得到右图。这些东西就是节点的特征。观察上图可知,红色节点只有一条边相连,绿色节点有多条边相连,即红色节点的度为1,绿色节点的度大于1,根据节点的度这个特征,我们就可以做出一个简单的分类。
一般有这4种常见的节点特征:
1.节点度
2.节点中心性
3.局部聚集系数
4.图元
但是节点度有一个缺点,当两个节点的度相同时,模型会认为是相同的特征,而不会考虑节点在图中的位置关系和节点的重要性,节点度只考虑节点邻居节点的数量。
节点中心性考虑到图中的节点的重要性,根据不同方式有以下三种:
1.特征向量中心性
2.中介中心性
3.紧密中心性
上述方程以递归形式计算,转化成矩阵形式可以看出,所求即为特征向量,该邻接矩阵中,若两节点之间有边,则为1
第二种是中介中心性,定义为一个节点位于其他节点之间的许多最短路径上,说明它具有重要性。如图,对节点 A, B, E来说,A,E不是任何路径的中间节点,B是路径 C-B-D的中间节点,但是该路径不是最短路径,所以都为0。对于C存在以上所示3条最短路径,Cv=1/1+1/1+1/1=3。因为在上述例子中节点之间的最短路径为1,所以分母为1。
紧密中心性,定义为如果一个节点对所有其他节点的最短路径长度都很小,说明具有重要性。上述公式分母为该节点为起始的最短路径的长度和。
局部聚集系数,分子为邻居节点之间构成的边数量,分母为邻居节点所能构成的最大边数量。以图2为了,邻居节点之间构成3条边,4个邻居节点所能构成最大边数量为6,所以聚集系数为0.5。聚集系数越大代表该节点所处位置更密集,更接近图网络中心。
图元:有根连接的非同构子图。如上图3个节点的图元,3节点链式的有2种情况,三角形只有一种,因为其他位置是同构的。
GDV: 一个图元度向量是以该给定节点为根的图元的计数向量
图元度向量的计算:对于示例给定的图,我们使用三种图元,共4种情况(a,b,c,d),也是GDV的长度。考虑节点v:
a:2种位置情况
b:一种
c:与b同构,不重复计算
d:2中位置情况
所以节点v的GDV为 [2, 1, 0, 2]
1. 考虑2-5个节点的图元可以得到73种结构。最多获取其相互连接到4跳的距离,对于5个节点,一个节点到另一个节点的最长链路为4。
2. 图元度向量提供了一个节点的局部网络拓扑的度量:提供了比节点度或聚类系数更详细的局部拓扑相似性的度量。
基于节点重要性的特征可用于预测图中有影响的节点,如预测社交网络中的名人用户。
基于结构的特征可用于预测节点在图中扮演的特定角色,如预测蛋白质-蛋白质相互作用网络中的蛋白质功能。
CS224W 图机器学习(二)--图上的传统机器学习方法相关推荐
- 图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)
图机器学习(GML)&图神经网络(GNN)原理和代码实现(PGL)[前置学习系列二] 上一个项目对图相关基础知识进行了详细讲述,下面进图GML networkx :NetworkX 是一个 P ...
- A.图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)
图学习图神经网络算法专栏简介:主要实现图游走模型(DeepWalk.node2vec):图神经网络算法(GCN.GAT.GraphSage),部分进阶 GNN 模型(UniMP标签传播.ERNIESa ...
- 手撕图机器学习,图神经网络
手撕图机器学习,图神经网络 写在前面 & 配套链接(访者必读) 图的基本表示 图的基本参数 图的类别 节点连接数(Node degree) 图的矩阵表示(邻接矩阵) 连接列表和邻接列表 其他图 ...
- 初识图机器学习(part2)--图数据
学习笔记,仅供参考 学习资料:图机器学习教程 文章目录 图机器学习 图数据 图数据常见的描述形式 邻接矩阵的特点 邻接列表的特点 无向图的图数据 带权图的图数据 二部图 广度优先搜索(BFS) 深度优 ...
- 初识图机器学习(part3)--图数据挖掘
学习笔记,仅供参考,有错必纠 文章目录 图数据挖掘 数据挖掘 图数据挖掘的对象 PageRank 简单的例子 PageRank中的问题 python实现 图数据挖掘 数据挖掘 数据挖掘是一个跨学科的计 ...
- 初识图机器学习(part1)--图的概述
学习笔记,仅供参考 学习资料:图机器学习教程 文章目录 图机器学习 图的概述 什么是图 图的分类 图数据的特点 人工构图的方法及缺陷 为什么要用图来表述数据 图结构 图的主要成分 如何正确的建图 不同 ...
- Stanford机器学习---第六讲. 怎样选择机器学习方法、系统
本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归.Octave Tutorial.Logistic Regression.Regularization.神经网络.机器学 ...
- 12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!
点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 12 月 9 日,一本机器学习新书上线了,它就是<Limitations of Inte ...
- 初识图机器学习(part5)--图表示学习2.0
学习笔记,仅供参考,有错必纠 文章目录 图表示学习2.0 图表示学习2.0 的 分类 基于分解的方法 例子(推荐系统) 基于随机游走的方法 基于深度学习的方法 基于深度学习的图表示一定比基于分解和随机 ...
最新文章
- java复制文件_java多种文件复制方式以及效率比较
- python 生意_本周互联网关注(2015515):劳动人民的生意经、python好还是go好
- python-文件和流
- js组装知识(待续……)
- Unicode 与 UTF-8 之间的转换
- Oracle autotrace使用说明
- 财经管理中的计算机应用 课后答案,财经管理中的计算机应用
- 计算机硬件设备论文题目,计算机硬件维护论文题目大全 计算机硬件维护论文题目选什么比较好...
- python数据导入spss_Python/Excel/SPSS/SQL数据处理方法比较之1 - 数据导入
- python笔记1——基础
- 12306html布局,12306无法登陆怎么办
- 蹦迪--我的黑白玫瑰~!
- Windows 11 首次开机OOBE阶段跳过连接网络及登录微软账户,使用本地账号登录的方法
- 聚类分析在用户行为中的实例_聚类分析案例之市场细分
- http协议及apache配置
- sql语句(select,create,drop,alter,delete,insert,update,grant)
- Git创建新分支并提交到github
- C语言基本数据类型之整型变量
- 深圳腾讯计算机打鱼的游戏,腾讯欢乐捕鱼
- 【shell】判断语句、循环语句