图上的传统机器学习方法

  • 一. Tradtion Feature-based Methods Node

一. Tradtion Feature-based Methods Node


传统机器学习方法,我们希望训练一个模型,在给定一个新节点,新链接或图的情况能够获取它的特征并做出预测。


在图的特征提取过程,我们将它转化成一个d维的向量,特征对象可以是节点,边,完整的图,节点集。这里我们考虑的图为无向图。
所以我们要解决的问题就是在给定 G=(V,E),如何学习节点V的特征来学习目标函数。


首先我们考虑节点水平上的任务,如上图所示做一个节点分类,我们希望从左图中学习到一些东西进而预测节点类别来得到右图。这些东西就是节点的特征。观察上图可知,红色节点只有一条边相连,绿色节点有多条边相连,即红色节点的度为1,绿色节点的度大于1,根据节点的度这个特征,我们就可以做出一个简单的分类。

一般有这4种常见的节点特征:
1.节点度
2.节点中心性
3.局部聚集系数
4.图元


但是节点度有一个缺点,当两个节点的度相同时,模型会认为是相同的特征,而不会考虑节点在图中的位置关系和节点的重要性,节点度只考虑节点邻居节点的数量。

节点中心性考虑到图中的节点的重要性,根据不同方式有以下三种:
1.特征向量中心性
2.中介中心性
3.紧密中心性



上述方程以递归形式计算,转化成矩阵形式可以看出,所求即为特征向量,该邻接矩阵中,若两节点之间有边,则为1


第二种是中介中心性,定义为一个节点位于其他节点之间的许多最短路径上,说明它具有重要性。如图,对节点 A, B, E来说,A,E不是任何路径的中间节点,B是路径 C-B-D的中间节点,但是该路径不是最短路径,所以都为0。对于C存在以上所示3条最短路径,Cv=1/1+1/1+1/1=3。因为在上述例子中节点之间的最短路径为1,所以分母为1。


紧密中心性,定义为如果一个节点对所有其他节点的最短路径长度都很小,说明具有重要性。上述公式分母为该节点为起始的最短路径的长度和。

局部聚集系数,分子为邻居节点之间构成的边数量,分母为邻居节点所能构成的最大边数量。以图2为了,邻居节点之间构成3条边,4个邻居节点所能构成最大边数量为6,所以聚集系数为0.5。聚集系数越大代表该节点所处位置更密集,更接近图网络中心。


图元:有根连接的非同构子图。如上图3个节点的图元,3节点链式的有2种情况,三角形只有一种,因为其他位置是同构的。

GDV: 一个图元度向量是以该给定节点为根的图元的计数向量

图元度向量的计算:对于示例给定的图,我们使用三种图元,共4种情况(a,b,c,d),也是GDV的长度。考虑节点v:
a:2种位置情况
b:一种
c:与b同构,不重复计算
d:2中位置情况
所以节点v的GDV为 [2, 1, 0, 2]


1. 考虑2-5个节点的图元可以得到73种结构。最多获取其相互连接到4跳的距离,对于5个节点,一个节点到另一个节点的最长链路为4。
2. 图元度向量提供了一个节点的局部网络拓扑的度量:提供了比节点度或聚类系数更详细的局部拓扑相似性的度量。


基于节点重要性的特征可用于预测图中有影响的节点,如预测社交网络中的名人用户。

基于结构的特征可用于预测节点在图中扮演的特定角色,如预测蛋白质-蛋白质相互作用网络中的蛋白质功能。

CS224W 图机器学习(二)--图上的传统机器学习方法相关推荐

  1. 图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)

    图机器学习(GML)&图神经网络(GNN)原理和代码实现(PGL)[前置学习系列二] 上一个项目对图相关基础知识进行了详细讲述,下面进图GML networkx :NetworkX 是一个 P ...

  2. A.图机器学习(GML)图神经网络(GNN)原理和代码实现(前置学习系列二)

    图学习图神经网络算法专栏简介:主要实现图游走模型(DeepWalk.node2vec):图神经网络算法(GCN.GAT.GraphSage),部分进阶 GNN 模型(UniMP标签传播.ERNIESa ...

  3. 手撕图机器学习,图神经网络

    手撕图机器学习,图神经网络 写在前面 & 配套链接(访者必读) 图的基本表示 图的基本参数 图的类别 节点连接数(Node degree) 图的矩阵表示(邻接矩阵) 连接列表和邻接列表 其他图 ...

  4. 初识图机器学习(part2)--图数据

    学习笔记,仅供参考 学习资料:图机器学习教程 文章目录 图机器学习 图数据 图数据常见的描述形式 邻接矩阵的特点 邻接列表的特点 无向图的图数据 带权图的图数据 二部图 广度优先搜索(BFS) 深度优 ...

  5. 初识图机器学习(part3)--图数据挖掘

    学习笔记,仅供参考,有错必纠 文章目录 图数据挖掘 数据挖掘 图数据挖掘的对象 PageRank 简单的例子 PageRank中的问题 python实现 图数据挖掘 数据挖掘 数据挖掘是一个跨学科的计 ...

  6. 初识图机器学习(part1)--图的概述

    学习笔记,仅供参考 学习资料:图机器学习教程 文章目录 图机器学习 图的概述 什么是图 图的分类 图数据的特点 人工构图的方法及缺陷 为什么要用图来表述数据 图结构 图的主要成分 如何正确的建图 不同 ...

  7. Stanford机器学习---第六讲. 怎样选择机器学习方法、系统

    本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归.Octave Tutorial.Logistic Regression.Regularization.神经网络.机器学 ...

  8. 12 月机器学习新书:《可解释机器学习方法的局限》,免费下载!

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 12 月 9 日,一本机器学习新书上线了,它就是<Limitations of Inte ...

  9. 初识图机器学习(part5)--图表示学习2.0

    学习笔记,仅供参考,有错必纠 文章目录 图表示学习2.0 图表示学习2.0 的 分类 基于分解的方法 例子(推荐系统) 基于随机游走的方法 基于深度学习的方法 基于深度学习的图表示一定比基于分解和随机 ...

最新文章

  1. java复制文件_java多种文件复制方式以及效率比较
  2. python 生意_本周互联网关注(2015515):劳动人民的生意经、python好还是go好
  3. python-文件和流
  4. js组装知识(待续……)
  5. Unicode 与 UTF-8 之间的转换
  6. Oracle autotrace使用说明
  7. 财经管理中的计算机应用 课后答案,财经管理中的计算机应用
  8. 计算机硬件设备论文题目,计算机硬件维护论文题目大全 计算机硬件维护论文题目选什么比较好...
  9. python数据导入spss_Python/Excel/SPSS/SQL数据处理方法比较之1 - 数据导入
  10. python笔记1——基础
  11. 12306html布局,12306无法登陆怎么办
  12. 蹦迪--我的黑白玫瑰~!
  13. Windows 11 首次开机OOBE阶段跳过连接网络及登录微软账户,使用本地账号登录的方法
  14. 聚类分析在用户行为中的实例_聚类分析案例之市场细分
  15. http协议及apache配置
  16. sql语句(select,create,drop,alter,delete,insert,update,grant)
  17. Git创建新分支并提交到github
  18. C语言基本数据类型之整型变量
  19. 深圳腾讯计算机打鱼的游戏,腾讯欢乐捕鱼
  20. 【shell】判断语句、循环语句

热门文章

  1. 服务器怎么设置程序自动开启,服务器安全狗 定时任务设置图文教程
  2. 吃鸡游戏计算机配置,畅玩主流游戏吃鸡LOL组装电脑配置清单
  3. 揭秘LOL背后的IT基础架构丨SDN解锁新基础架构
  4. 重庆北大青鸟沙坪坝校区A08班学员作品——漫画书城网站
  5. java车架公模,碳纤维车架是如何制成的,读完这一篇你就明白了
  6. 苹果助手开发随笔系列:0、前言
  7. BUU UPLOAD COURSE 1 1(一句话木马+蚁剑)
  8. BZOJ3155 Preprefix sum
  9. 低代码开源项目 Designable 应用和源码浅析
  10. 基于JAVA的学院管理系统(OA管理系统)