图(graph)神经网络学习(四)--代码解析(Model_2)
【2】Model_2: 1stChebNet(2017)-github:gcn (https://github.com/tkipf/gcn) (tensorflow)
{Semi-Supervised Classification with Graph Convolutional Networks}基于图卷积网络的半监督分类
文章:https://www.colabug.com/5231014.html
Graph Convolutional Networks
这是一个用tensorflow框架实现的图卷积神经网络,用来完成图中的节点类型分类,即是一个分类模型。
两篇论文:
【1】Semi-Supervised Classification with Graph Convolutional Networks (ICLR 2017)
【2】Graph Convolutional Networks (2016)
从github下载代码,上传到服务器上(尽量保证你的服务能连接外网,因为在调试程序时需要从外网中下载所需的数据,尽量保证你的服务器有GPU,因为有的代码常常会用GPU来加速),解压:unzip gcn-master.zip
查看虚拟环境名:conda env list
选择一个虚拟环境激活:source activate your_env_name
查看python版本:python (python3)
安装:python setup.py install
成功安装
查看requirements
·tensorflow(>0.12)
·networkx
运行模型:
cd gcn
python train.py 或者自定数据集运行 python train.py --dataset citeseer
正常运行结果:
现在开始在本地pycharm中分析源代码
setup.py可以看到作者Thomas Kipf已经他写的图卷积网络gcn做成了安装包,刚才运行的python setup.py install就是将该gcn模型安装到python的lib目录下。
运行模型命令: python train.py
以下是train.py代码,我们主要关心模型的输入数据格式。
train.py代码
以下截图是train.py的代码,从中可以看出,数据集有三个可选,模型种类有三个可选。
数据集:'cora','citeseer','pubmed'
模型:'gcn','gcn_cheby','dense'
论文数据集介绍
train.py代码
程序中的数据集,有三个整理好的数据集:'cora','citeseer','pubmed'
utils.py代码
utils.py代码
我们自己的数据集,处理成这个模型可用的格式。
·N*N的邻接矩阵 (N是图节点的个数)
·N*D的特征矩阵 (D是节点特征向量的维度)
·N*E 的分类标签矩阵 (E是类别个数)
详细理解一下数据:
ind.dataset_str.x文件 是train训练集实例的特征向量,按scipy.sparse.csr.csr_matrix稀疏矩阵存储的。
ind.dataset_str.tx文件 是test测试集实例的特征向量,按scipy.sparse.csr.csr_matrix稀疏矩阵存储的。
ind.dataset_str.allx文件 是所有(有标签和无标签)的train训练实例特征向量,按scipy.sparse.csr.csr_matrix稀疏矩阵存储的。 (半监督方法,一些标签数据,一些无标签数据)
ind.dataset_str.y文件 是train训练数据集的one-hot类型的标签向量,按numpy.ndarray形式存储的。
ind.dataset_str.ty文件 是test测试数据集的one-hot类型的标签向量,按numpy.ndarray形式存储的。
ind.dataset_str.ally文件 是所有有标签数据的one-hot类型标签向量,按numpy.ndarray形式存储的。
ind.dataset_str.graph文件 是一个字典{index:[index_of_neighbor_nodes]}
ind.dataset_str.test.index文件 是测试数据集的index
以上数据都用pickle存储。
读取pickle数据显示如下:
ind.cora.x数据 train训练数据
ind.cora.y数据 train数据集的标签one-hot向量
ind.cora.tx数据 test测试数据
ind.cora.ty数据 test数据集的标签one-hot向量
ind.cora.allx数据 所有(有标签和无标签)的train训练集
ind.cora.ally数据 所有有标签数据的one-hot类型标签向量
ind.cora.graph数据 字典
再理解load_data()函数
load_data()函数 图1
load_data()函数 图2
oad_data()函数 图3
GCN的实验效果
这个框架还支持多个图形实例(可能具有不同大小)的批量分类,每个实例具有一个邻接矩阵。 最好连接各个特征矩阵并构建(稀疏)块对角矩阵,其中每个块对应于一个图实例的邻接矩阵。 对于池化(在图形级输出而不是节点级输出的情况下),最好指定一个简单的池化矩阵,该矩阵从各自的图形实例中收集特征,如下所示:
图(graph)神经网络学习(四)--代码解析(Model_2)相关推荐
- 数据结构--图(Graph)详解(四)
数据结构–图(Graph)详解(四) 文章目录 数据结构--图(Graph)详解(四) 一.图中几个NB的算法 1.普里姆算法(Prim算法)求最小生成树 2.克鲁斯卡尔算法(Kruskal算法)求最 ...
- Selenium学习 - 库代码解析
Selenium学习 - 库代码解析 一.selenium/common exceptions.py 定义了一个继承自Exception类的WebDriverException基础异常类,然后通过它扩 ...
- 材料科学中的数据挖掘:晶体图神经网络解读与代码解析
©PaperWeekly 原创 · 作者|张玮玮 学校|东北大学硕士 研究方向|情绪识别 论文标题: Crystal Graph Neural Networks for Data Mining in ...
- 对比学习 ——simsiam 代码解析。
Python微信订餐小程序课程视频 https://blog.csdn.net/m0_56069948/article/details/122285951 Python实战量化交易理财系统 https ...
- monodepth无监督卷积神经网络深度估计代码解析(三)
最后我们来看一下主函数 论文解析:https://blog.csdn.net/bofu_sun/article/details/89206531 1. 首先是调用一些库函数,同时设置运行文件时的参数 ...
- 对比学习 ——simsiam 代码解析。:
目录 1 : 事先准备 . 2 : 代码阅读. 2.1: 数据读取 2.2: 模型载入 3 训练过程: 4 测试过程: 5 :线性验证 6 : 用自己数据集进行对比学习. 第一: 改数据集 : 2 ...
- monodepth无监督卷积神经网络深度估计代码解析(一)
论文解析:https://blog.csdn.net/bofu_sun/article/details/89206531 近期在做深度估计相关的毕业设计,发现monodepth项目比较不错,决定尝试一 ...
- matlab与机器学习(三)以辛烷值含量预测为例BP神经网络(含代码解析)
在BP神经网络中,单个样本有个输入,有个输出,在输入层和输出层之间通常还有若干个隐含层.实际上,1989 Robert Hecht-Nielsen证明了对于任何闭区间内的一个连续函数都可以用一个隐含层 ...
- spark学习-29-源代码解析从start-all.sh脚本开始
1.概述 1.先总体看一下启动脚本 2.start-all.sh if [ -z "${SPARK_HOME}" ]; thenexport SPARK_HOME="$( ...
- Gradient Episodic Memory for Continual Learning 论文阅读+代码解析
一. 介绍 在开始进行监督学习的时候我们需要收集一个训练集 D t r = { ( x i , y i ) } i = 1 n D_{tr}=\{(x_i,y_i)\}^n_{i=1} Dtr={( ...
最新文章
- 香港大学工程学院计算机教授,香港大学郑振刚教授访问软件园校区
- 富交互Web应用中的撤销和前进
- m3u直播源_教你创建电视直播源
- access工具_工具篇之pycharm小技巧-httpclient
- 如何JQ将下拉列表的值传送给php,JQuery设置获取下拉菜单某个选项的值(比较全)...
- 是时候开始好好考虑自己的职业定位了
- Multisim 安装、破解、汉化、卸载教程
- 2023年天津理工大学中环信息学院专升本机械设计考试大纲
- python输入名字、输出_Python输入输出
- 视频动态滚动水印制作,滚动的水印字幕
- JeecgBoot商业版源码下载
- 信息系统项目管理师学习笔记3—项目立项管理
- MDK5的watch窗口变量删除问题
- 自监督学习中的 Contrastive Learning 对比学习(持续更新)
- 解决: Mac外接4K显示器刷新频率只有30Hz,例如(P2415Q,30赫兹->60赫兹)
- C语言热电阻温度查表,PT100热电阻值与温度对照表
- 第1章第7节:如何通过大纲级别批量创建幻灯片 [PowerPoint精美幻灯片实战教程]
- 新手敲代码经常犯的低级错误(持续更新ing)
- 浏览器中访问网页、回退及前进模拟
- 从Palantir上市看智能决策平台发展前景