【模型复现】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」
【模型复现 】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」
极链AI云 注册链接
关注极链AI云公众号,学习更多知识!
文章目录
- 【模型复现 】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」
- 一、模型详情
- 1.1 模型简介:
- 1.2 关键词:
- 1.3 应用场景:
- 1.4 结构:
- 1.5 论文地址:
- 1.6 模型来源:
- 二、效果展示
- 三、平台环境准备
- 3.1 打开极链AI云平台
- 3.2 点击模型
- 3.3 选择并创建实例
- 3.4 使用jupyterlab连接
- 四、模型复现
- 4.1 环境配置
- 4.2 模型推断
- 4.3 模型训练
- 4.4 模型测试
一、模型详情
1.1 模型简介:
RNN模型在机器翻译,语言模型,问答系统中取得了非凡的成就,由于RNN的结构,当前的层输入为前一层的输出,所有RNN比较适合时间序列问题,但也正是由于这种串行结构,限制了RNN模型的训练速度,与CNN相比,RNN并不能进行并行化处理。而SRU网络结构的提出就是为了解决这个问题,SRU(simple recurrent units)将大部分运算放到进行并行处理,只是将有具有小量运算的步骤进行串行。
1.2 关键词:
并行运算
1.3 应用场景:
图像分类
1.4 结构:
1.5 论文地址:
https://arxiv.org/pdf/1709.02755.pdf
1.6 模型来源:
https://github.com/DLHacks/SRU
二、效果展示
效果仅供参考
下面就是该模型的具体复现流程
三、平台环境准备
3.1 打开极链AI云平台
极链AI云
3.2 点击模型
3.3 选择并创建实例
进入模型列表,选择SRU模型
选择使用的显卡,此处以RTX 2080 ti为例
选择模型及镜像
点击下一步创建即可
3.4 使用jupyterlab连接
四、模型复现
4.1 环境配置
进入jupyterlab后,可以看见模型使用文档
点击左上角“+”,打开终端界面
在终端中执行以下代码,完成环境配置
cd ../..
# 进入根目录
cp -r /datasets/MNIST ../../user-data
# 将复现所需的公开数据集复制到指定文件夹下
cp -r modelsets/model_SRU ../../user-data
# 将复现所需的预训练权重文件复制到指定文件夹下
4.2 模型推断
在终端,进入root/SRU(默认)路径下,运行以下命令:
python interface.py
推断过程需要约3分钟
4.3 模型训练
在终端,进入root/SRU(默认)路径下,运行以下命令:
python train.py
训练需要约4小时(基于RTX 2080 Ti)
4.4 模型测试
在终端,进入root/SRU(默认)路径下,运行以下命令:
python test.py
测试需要约3分钟
以上就是SRU模型复现的全部流程,该模型在极链AI云官网已上架,同时极链AI云还拥有其他热门模型,简单步骤即可实现复现。
快点击 极链AI云 来尝试一下吧
【模型复现】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」相关推荐
- 极链AI云丨高速优化NLP模型OenNMT的快速复现
高速优化NLP模型OenNMT的快速复现 极链AI云 关注极链AI云公众号,学习更多知识! 目录 高速优化NLP模型OenNMT的快速复现 一.模型详情 1.模型简介 2.关键词 3.应用场景 4.模 ...
- 极链AI云丨图像转换代表作CycleGAN快速复现
图像转换代表作CycleGAN快速复现 极链AI云 关注极链AI云公众号,学习更多知识! 目录 图像转换代表作CycleGAN快速复现 一.模型详情 1.模型简介 2.关键词 3.应用场景 4.模型结 ...
- 用gpu跑_免费用GPU跑深度学习模型——如何获得极链AI云A100显卡
如果你刚开始接触深度学习,还没准备好买什么显卡,那么你唯一的选择就是按需付费的GPU租赁服务.虽然很多平台都提供GPU显卡的体验,但数量有限,时间限制也很大,反正我去了几次都没用上.更重要的是,性能限 ...
- 可视化神经机器翻译模型(基于注意力机制的Seq2seq模型)
可视化神经机器翻译模型(基于注意力机制的Seq2seq模型) 序列到序列模型是深度学习模型,在机器翻译.文本摘要和图像字幕等任务中取得了很大的成功.谷歌翻译在2016年底开始在生产中使用这样的模型 ...
- R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化
R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录
- 机器学习笔记之概率图模型(四)基于贝叶斯网络的模型概述
机器学习笔记之概率图模型--基于贝叶斯网络的模型概述 引言 基于贝叶斯网络的模型 场景构建 朴素贝叶斯分类器 混合模型 基于时间变化的模型 特征是连续型随机变量的贝叶斯网络 动态概率图模型 总结 引言 ...
- 基于RNN实现古诗词生成模型
我们知道,RNN(循环神经网络)模型是基于当前的状态和当前的输入来对下一时刻做出预判.而LSTM(长短时记忆网络)模型则可以记忆距离当前位置较远的上下文信息. 在此,我们根据上述预判模型来进行 古诗词 ...
- [Linux]生产者消费者模型(基于BlockQueue的生产者消费者模型 | 基于环形队列的生产者消费者模型 | 信号量 )
文章目录 生产者消费者模型 函数调用角度理解生产者消费者模型 生活角度理解生产者消费者模型 为什么要使用生产者消费者模型 生产者消费者模型优点 321原则 基于BlockingQueue的生产者消费者 ...
- 基于matlab/simulink同步发电机电路模型仿真,基于MATLAB_SIMULINK同步发电机电路模型仿真.pdf...
第 18 卷第 3 期 青 岛 大 学 学 报 Vol . 18 No . 3 2 0 0 3 年 9 月 JOURNAL OF QINGDAO UNIVERSITY Sep . 2 0 0 3 ( ...
最新文章
- 数学--数论--欧拉降幂和广义欧拉降幂(实用好理解)
- php 跨区域,如何构造PHP的内容包括在非安全(http://)和安全(https://)区域以及跨多个目录使用?...
- 低代码发展专访系列之七:低代码的火爆需要不一样的声音么?
- Halcon 轮廓合并算子
- 学习Scala: 初学者应该了解的知识
- java web 编程技术 pdf_Java WEB编程技术.pdf
- linux usb免驱麦克风,Android无驱usb音频实现
- 生意人没有“攀比”的目标,会过的很迷茫
- 对自定义UITableViewCell的理解
- idea-Java文件结构
- 【精选】Nginx负载均衡学习笔记(一)实现HTTP负载均衡和TCP负载均衡(官方和OpenResty两种负载配置)...
- 数据分析的升级版本--excel数据对比--整体思路
- Atitit 代码的艺术 attilax 艾提拉著作 1. 代码就像一首歌,一个文章,一个绘画	1 2. 代码就像文章	2 2.1. ,要流畅读出来,使用dsl 方法连模式	2 2.2. 段落划分与
- ZZULIOJ-1047,对数表(Python)
- Sketch 67.2 简体中文版 最佳Mac产品原型设计工具
- LaTeX下载安装与使用
- win10计算机网络共享设置密码,win10局域网设置密码如何设置_win10局域网怎么设置访问密码-win7之家...
- SQL数据分析-淘宝用户行为
- Tacotron以及Tacotron2详解
- i春秋首届全国数据安全大赛部分复盘