【模型复现 】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」

极链AI云 注册链接
关注极链AI云公众号,学习更多知识!


文章目录

  • 【模型复现 】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」
  • 一、模型详情
    • 1.1 模型简介:
    • 1.2 关键词:
    • 1.3 应用场景:
    • 1.4 结构:
    • 1.5 论文地址:
    • 1.6 模型来源:
  • 二、效果展示
  • 三、平台环境准备
    • 3.1 打开极链AI云平台
    • 3.2 点击模型
    • 3.3 选择并创建实例
    • 3.4 使用jupyterlab连接
  • 四、模型复现
    • 4.1 环境配置
    • 4.2 模型推断
    • 4.3 模型训练
    • 4.4 模型测试

一、模型详情

1.1 模型简介:

RNN模型在机器翻译,语言模型,问答系统中取得了非凡的成就,由于RNN的结构,当前的层输入为前一层的输出,所有RNN比较适合时间序列问题,但也正是由于这种串行结构,限制了RNN模型的训练速度,与CNN相比,RNN并不能进行并行化处理。而SRU网络结构的提出就是为了解决这个问题,SRU(simple recurrent units)将大部分运算放到进行并行处理,只是将有具有小量运算的步骤进行串行。

1.2 关键词:

并行运算

1.3 应用场景:

图像分类

1.4 结构:

1.5 论文地址:

https://arxiv.org/pdf/1709.02755.pdf

1.6 模型来源:

https://github.com/DLHacks/SRU


二、效果展示


效果仅供参考

下面就是该模型的具体复现流程


三、平台环境准备

3.1 打开极链AI云平台

极链AI云

3.2 点击模型

3.3 选择并创建实例

进入模型列表,选择SRU模型

选择使用的显卡,此处以RTX 2080 ti为例

选择模型及镜像

点击下一步创建即可

3.4 使用jupyterlab连接


四、模型复现

4.1 环境配置

进入jupyterlab后,可以看见模型使用文档

点击左上角“+”,打开终端界面


在终端中执行以下代码,完成环境配置

cd ../..
# 进入根目录
cp -r /datasets/MNIST ../../user-data
# 将复现所需的公开数据集复制到指定文件夹下
cp -r modelsets/model_SRU ../../user-data
# 将复现所需的预训练权重文件复制到指定文件夹下

4.2 模型推断

在终端,进入root/SRU(默认)路径下,运行以下命令:

python interface.py

推断过程需要约3分钟

4.3 模型训练

在终端,进入root/SRU(默认)路径下,运行以下命令:

python train.py

训练需要约4小时(基于RTX 2080 Ti)

4.4 模型测试

在终端,进入root/SRU(默认)路径下,运行以下命令:

python test.py

测试需要约3分钟

以上就是SRU模型复现的全部流程,该模型在极链AI云官网已上架,同时极链AI云还拥有其他热门模型,简单步骤即可实现复现。

快点击 极链AI云 来尝试一下吧

【模型复现】基于RNN优化的并行计算模型-SRU的快速复现「极链AI云 」相关推荐

  1. 极链AI云丨高速优化NLP模型OenNMT的快速复现

    高速优化NLP模型OenNMT的快速复现 极链AI云 关注极链AI云公众号,学习更多知识! 目录 高速优化NLP模型OenNMT的快速复现 一.模型详情 1.模型简介 2.关键词 3.应用场景 4.模 ...

  2. 极链AI云丨图像转换代表作CycleGAN快速复现

    图像转换代表作CycleGAN快速复现 极链AI云 关注极链AI云公众号,学习更多知识! 目录 图像转换代表作CycleGAN快速复现 一.模型详情 1.模型简介 2.关键词 3.应用场景 4.模型结 ...

  3. 用gpu跑_免费用GPU跑深度学习模型——如何获得极链AI云A100显卡

    如果你刚开始接触深度学习,还没准备好买什么显卡,那么你唯一的选择就是按需付费的GPU租赁服务.虽然很多平台都提供GPU显卡的体验,但数量有限,时间限制也很大,反正我去了几次都没用上.更重要的是,性能限 ...

  4. 可视化神经机器翻译模型(基于注意力机制的Seq2seq模型)

    可视化神经机器翻译模型(基于注意力机制的Seq2seq模型)   序列到序列模型是深度学习模型,在机器翻译.文本摘要和图像字幕等任务中取得了很大的成功.谷歌翻译在2016年底开始在生产中使用这样的模型 ...

  5. R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理、构建词袋模型、构建xgboost文本分类模型、基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化

    R语言构建文本分类模型并使用LIME进行模型解释实战:文本数据预处理.构建词袋模型.构建xgboost文本分类模型.基于文本训练数据以及模型构建LIME解释器解释多个测试语料的预测结果并可视化 目录

  6. 机器学习笔记之概率图模型(四)基于贝叶斯网络的模型概述

    机器学习笔记之概率图模型--基于贝叶斯网络的模型概述 引言 基于贝叶斯网络的模型 场景构建 朴素贝叶斯分类器 混合模型 基于时间变化的模型 特征是连续型随机变量的贝叶斯网络 动态概率图模型 总结 引言 ...

  7. 基于RNN实现古诗词生成模型

    我们知道,RNN(循环神经网络)模型是基于当前的状态和当前的输入来对下一时刻做出预判.而LSTM(长短时记忆网络)模型则可以记忆距离当前位置较远的上下文信息. 在此,我们根据上述预判模型来进行 古诗词 ...

  8. [Linux]生产者消费者模型(基于BlockQueue的生产者消费者模型 | 基于环形队列的生产者消费者模型 | 信号量 )

    文章目录 生产者消费者模型 函数调用角度理解生产者消费者模型 生活角度理解生产者消费者模型 为什么要使用生产者消费者模型 生产者消费者模型优点 321原则 基于BlockingQueue的生产者消费者 ...

  9. 基于matlab/simulink同步发电机电路模型仿真,基于MATLAB_SIMULINK同步发电机电路模型仿真.pdf...

    第 18 卷第 3 期 青 岛 大 学 学 报 Vol . 18 No . 3 2 0 0 3 年 9 月 JOURNAL OF QINGDAO UNIVERSITY Sep . 2 0 0 3 ( ...

最新文章

  1. 数学--数论--欧拉降幂和广义欧拉降幂(实用好理解)
  2. php 跨区域,如何构造PHP的内容包括在非安全(http://)和安全(https://)区域以及跨多个目录使用?...
  3. 低代码发展专访系列之七:低代码的火爆需要不一样的声音么?
  4. Halcon 轮廓合并算子
  5. 学习Scala: 初学者应该了解的知识
  6. java web 编程技术 pdf_Java WEB编程技术.pdf
  7. linux usb免驱麦克风,Android无驱usb音频实现
  8. 生意人没有“攀比”的目标,会过的很迷茫
  9. 对自定义UITableViewCell的理解
  10. idea-Java文件结构
  11. 【精选】Nginx负载均衡学习笔记(一)实现HTTP负载均衡和TCP负载均衡(官方和OpenResty两种负载配置)...
  12. 数据分析的升级版本--excel数据对比--整体思路
  13. Atitit 代码的艺术 attilax 艾提拉著作 1. 代码就像一首歌,一个文章,一个绘画 1 2. 代码就像文章 2 2.1. ,要流畅读出来,使用dsl 方法连模式 2 2.2. 段落划分与
  14. ZZULIOJ-1047,对数表(Python)
  15. Sketch 67.2 简体中文版 最佳Mac产品原型设计工具
  16. LaTeX下载安装与使用
  17. win10计算机网络共享设置密码,win10局域网设置密码如何设置_win10局域网怎么设置访问密码-win7之家...
  18. SQL数据分析-淘宝用户行为
  19. Tacotron以及Tacotron2详解
  20. i春秋首届全国数据安全大赛部分复盘

热门文章

  1. QQ邮箱的正则表达式
  2. CodeForces 6D Lizards and Basements 2(DFS)
  3. Unity: 如何设置Material属性
  4. java中的insert函数_11g中利用listagg函数实现自动拼接INSERT语句
  5. 微信小程序 界面从右边滑出_微信小程序侧边栏滑动特效(左右滑动)
  6. python矩阵转置_867. 矩阵转置(Python)
  7. docker集群搭建
  8. 不得不看的经典搞笑名言名句
  9. 队列的Python实现与实例分析
  10. dnf过年服务器维护否,dnf维护公告大全