GNN 系列:Graph 基础知识介绍
点击上方“Datawhale”,选择“星标”公众号
第一时间获取价值内容
【导读】图卷积神经网络(Graph Convolutional Network)作为最近几年兴起的一种基于图结构的广义神经网络结构,因为其独特的计算能力,而受到广泛学者的关注与研究。传统深度学习模型 LSTM 和 CNN 在欧几里得空间数据(语言,图像,视频等)上取得了不错的成绩,但是在对非欧几里得空间数据(eg:社交网络、信息网络等)进行处理上却存在一定的局限性。针对该问题,研究者们引入了图论中抽象意义上的图(Graph)来表示非欧几里得结构化数据。并利用图卷积网络对来图(Graph)数据进行处理,以深入发掘其特征和规律。本文首先分别介绍了欧几里得结构化数据和非欧几里得结构化数据特点;然后,针对非欧几里得结构化数据的表示问题,引入了图论中抽象意义上的图(Graph)概念,并对图(Graph)中一些表示形式进行介绍;最后,通过一个简单的例子,对图(Graph)数据的应用进行介绍,以帮助读者加深对图(Graph)的理解。
目录
1.欧几里得结构化数据
欧几里得空间
常见的欧几里得结构化数据
2.非欧几里得结构化数据
非欧几里得空间
非常见的欧几里得结构化数据
3.图(Graph)
图(Graph)的引入
图(Graph)的定义测试
图(Graph)的表示形式
(1)、邻接矩阵(Adjacency matrix)
(2)、度矩阵( Degree matrix)
(3)、邻域( Neighborhood)
4.图上的学习任务
5.图数据应用举例
6.系列规划
正文
1.a. 欧几里得空间
欧几里德空间(Euclidean Space),简称为欧氏空间(也可以称为平直空间),在数学中是对欧几里德所研究的2维和3维空间的一般化。这个一般化把欧几里德对于距离、以及相关的概念长度和角度,转换成任意数维的坐标系。如下图所示。
图 a 表示二维欧几里得空间
图 b 表示三维欧几里得空间
1.b.常见的欧几里得结构化数据
将数据转换到欧几里得空间中,所得到的数据称为欧几里得结构化数据。
常见的欧几里得结构化数据主要包含:
1D:声音,时间序列等;
2D:图像等;
3D:视频,高光谱图像等;
2.a.非欧几里得空间
科学研究中并不是所有的数据都能够被转换到欧几里得空间中(eg:社交网络、信息网络等),对于不能进行欧几里得结构化的数据,我们将其称为非欧几里得结构化数据。
2.b.非常见的欧几里得结构化数据
1D:社交网络(eg:Facebook,Twitter等)等;
2D:生物网络(基因,分子,大脑连接)等;
3D:基础设施网络(eg:能源,交通,互联网,通信等)等;
3.a.图(Graph)的引入
针对非欧几里得结构化数据表示问题,研究者们引入了图论中抽象意义上的图(Graph)来表示非欧几里得结构化数据。
3.b.图(Graph)的定义测试
3.c.(1)图的表示形式——邻接矩阵(Adjacency matrix)
3.c.(2)图的表示形式——度矩阵( Degree matrix)
3.c.(3)图的表示形式——邻域( Neighborhood)
4.图上的学习任务
介绍完图的基本术语之后,我们来看看有了图结构数据,我们可以进行哪些机器学习的任务
1、图节点分类任务:图中每个节点都有对应的特征,当我们已知一些节点的类别的时候,可以设计分类任务针对未知节点进行分类。我们接下来要介绍的 GCN、GraphSAGE、GAT模型都是对图上的节点分类。
2、图边结构预测任务:图中的节点和节点之间的边关系可能在输入数据中能够采集到,而有些隐藏的边需要我们挖掘出来,这类任务就是对边的预测任务,也就是对节点和节点之间关系的预测。
3、图的分类:对于整个图来说,我们也可以对图分类,图分类又称为图的同构问题,基本思路是将图中节点的特征聚合起来作为图的特征,再进行分类。
5.图数据应用举例
对于一个简单的电商的图,其包含卖家,商品和用户三个关键节点,其中,商品节点关联商品类别节点,用户节点关联注册 IP 节点和 注册地址节点。当用户在购买商品时,用户节点和商品节点就会关联交易节点,同时,交易节点也会关联用户下单时所对应的 IP 节点以及收获地址节点,对应的图结构如下图所示。
从图数据中节点间的关系以及特征,我们可以进行反欺诈以及商品推荐的操作。
1、节点分类—反欺诈:因为图中每个节点都拥有自己的特征信息。通过该特征信息,我们可以构建一个风控系统,如果交易节点所关联的用户 IP 和收货地址与用户注册 IP 和注册地址不匹配,那么系统将有可能认为该用户存在欺诈风险。
2、边结构预测—商品推荐:图中每个节点都具有结构信息。如果用户频繁购买某种类别商品或对某种类别商品评分较高,那么系统就可以认定该用户对该类商品比较感兴趣,所以就可以向该用户推荐更多该类别的商品。
总而言之,图数据的丰富应用价值促使更多的研究者加入图数据的研究当中,但是对图数据进行数据分析时,我们需要同时考虑到节点的特征信息以及结构信息。如果靠手工规则来提取,必将失去很多隐蔽和复杂的模式,那么有没有一种方法能自动化地同时学到图的特征信息与结构信息呢?这就是近年来兴起的机器学习的一个热点方向—图神经网络(Graph Neural Networks)。接下来我们将以一个系列的文章介绍它们。
6.系列规划
本文为GNN教程 [第一章 基础:三剑客] 的第一篇文章 [01 基础知识],下图展示了我们在这一系列的规划,接下来我们将会介绍图神经网络的三个基本模型,使大家对他们有所了解。
GNN 系列:Graph 基础知识介绍相关推荐
- UICC 之 USIM 详解全系列——UICC基础知识介绍
本人就职于国际知名终端厂商,负责modem芯片研发. 在5G早期负责终端数据业务层.核心网相关的开发工作,目前牵头6G算力网络技术标准研究. UICC 之 USIM 详解全系列--UICC(TS102 ...
- 硬件安全系列 逻辑电路基础知识介绍(一)
前言 我带着新的系列又来了,之前的自动化代码审计工具还会在之后分享实际编写的过程思路以及代码. 新的系列是硬件安全,非常庞大的知识体系,我只是分享部分我所学习到的.会包括VLSI Testing ,H ...
- 硬件安全系列 逻辑电路基础知识介绍(三)
前言 这一篇是逻辑电路基础知识的最后一篇. Don't Care Don't Care 可以称作冗余,在电子电路中,他有不同的类型对应不同的表现形式. 首先,我们从例子的角度探索一下冗余是怎么产生的. ...
- 硬件安全系列 逻辑电路基础知识介绍(二)
前言 第二部分 逻辑表示方式以及处理算法 Boolean Representation via BDDs and SAT BDD Binary Decision Diagrams BDD是什么.Bin ...
- MapboxGL系列(一)基础知识介绍
MapboxGL基础知识介绍 文章目录 MapboxGL基础知识介绍 前言 一.Mapbox是什么? 二.Mapbox常用服务工具介绍 1.mapboxgl.js 2.mapbox studio 3. ...
- 视频编解码的理论和实践1:基础知识介绍
近几年,视频编解码技术在理论及应用方面都取得了重大的进展,越来越多的人想要了解编解码技术.因此,网易云信研发工程师为大家进行了归纳梳理,从理论及实践两个方面简单介绍视频编解码技术. 相关阅读推荐 &l ...
- JMeter-01-性能测试基础知识介绍
JMeter-01-性能测试基础知识介绍 开篇词 性能测试常见分类 Web服务的主要指标 前端页面的主要指标 数据库的主要指标 开篇词 参加工作这些年来,性能测试做过不少,主要用的LoadRunner ...
- PID温控实验平台搭建(一)——PID基础知识介绍
PID温控实验平台搭建 (一)PID基础知识介绍 (二)PID进阶知识介绍及源码分享 (三)从零开始搭建STM32温控实验平台 (四)PID温控系统代码讲解 (五)最终实验现象与总结 文章目录 前言 ...
- 经典考题回顾系列——证券市场基础知识180题
经典考题回顾系列--证券市场基础知识180题 [中华证券学习网]http://www.1000zq.com/Detail.aspx?id=180022 内容介绍>> 证券从业资格考试经典考 ...
最新文章
- 人工神经网络背后的数学原理!
- 中介者模式小记【原创】
- 2019年第十届蓝桥杯 - 省赛 - C/C++大学C组 - B. 矩形切割
- chrome浏览器设置网页快速到顶部和到底部的方法
- Redis数据结构之简单动态字符串SDS
- 数据库 数据库SQL语句一
- java list for循环遍历_详解Java中list,set,map的遍历与增强for循环
- 谷歌Chrome浏览器保存网页为PDF
- 听我的!千万别学前端开发!
- 用函数画出可爱的卡通猫
- WordPress实现关注微信公众号回复关键字获取验证码查看网站隐藏内容
- 布线前,布局这步极为关键!分享一些PCB设计布线注意要点
- 微信小程序注册/登陆,若依后台获取token
- Chips交互操作和集合论
- Android学习之期末复习重点整理
- 过滤器,监听器,拦截器的区别
- 拿什么拯救你——王阿姨的少女心!
- 为什么学完这个他们都跳槽/涨薪了?
- 借条上的字迹消失了,怎么办?
- 物联网改善我们生活的 6 种方式