【Dual-Path-RNN-Pytorch源码分析】Dual_RNN_Block
Dual_RNN_Block应该是整个网络中最重要的部分了。
这里,每一个Block相当于网络内部的一层 ,源码中默认设置4层Dual_RNN_Block。
每一个Dual_RNN_Block又分为intra_rnn(块内rnn)和inter_rnn(块间rnn)
intra_rnn和inter_rnn是dual的灵魂,但是刚开始接触很难理解这个概念。
结合代码和原论文的配图,可以理解为对Dual_RNN_Block的3D上对K和S维度训练
输入张量
输入的张量shape为[B, N, K, S], 具体的来源可以参考这里。
其中B为batch-size,每一个batch里的N,K,S,如下图。(K=2P)
intra_rnn
RNN是最最后一维做训练,但是与其他维度也有关联。尤其是-2维度。
intra_rnn是针对K的训练,K是形容block的变量,即在这个维度上理解为intra
下图为intra_rnn block的流程图
inter_rnn
intra_rnn是针对S的训练,S是形容block个数的变量,是block与block之间的关系,即在这个维度上理解为inter
下图为inter_rnn block的流程图
双剑合璧 Dual_RNN_Block
上述两个intra_rnn + inter_rnn就是dual_rnn了。
但是有点细节:
- intra_rnn的结果是加上了输入张量x 再送到 inter_rnn计算
- inter_rnn的结果是加上了intra_rnn的结果再输出
最后,把paper中的图贴在这里方便大家理解。
【Dual-Path-RNN-Pytorch源码分析】Dual_RNN_Block相关推荐
- PyTorch 源码分析:Optimizer类
PyTorch对Optimizer类的实现大部分都在Python上,只有计算用到了C++的部分,所以还是可以继续分析的. 总览 Optimizer类是所有具体优化器类的一个基类.下面一幅图表示一下. ...
- Pytorch源码分析
目录 命名空间/类/方法/函数/变量 torch.autograd.Function中的ctx参数 DDP(DistributedDataParallel)的构造函数 torch.floor(inpu ...
- Pytorch Mobile 之Android Demo源码分析
现如今,在边缘设备上运行机器学习/深度学习变得越来越流行,它需要更低的时延. 而从Pytorch 1.3开始,我们就可以使用Pytorch将模型部署到Android或者ios设备中. Pytorch官 ...
- PyTorch 源码解读之 torch.serialization torch.hub
作者 | 123456 来源 | OpenMMLab 编辑 | 极市平台 导读 本文解读基于PyTorch 1.7版本,对torch.serialization.torch.save和torch.hu ...
- Transformer-XL解读(论文 + PyTorch源码)
前言 目前在NLP领域中,处理语言建模问题有两种最先进的架构:RNN和Transformer.RNN按照序列顺序逐个学习输入的单词或字符之间的关系,而Transformer则接收一整段序列,然后使用s ...
- 【Android SDM660源码分析】- 03 - UEFI XBL GraphicsOutput BMP图片显示流程
[Android SDM660源码分析]- 03 - UEFI XBL GraphicsOutput BMP图片显示流程 1. GraphicsOutput.h 2. 显示驱动初化 DisplayDx ...
- NeRF 源码分析解读(一)
NeRF 源码解读(一) 前言 NeRF 是三维视觉中新视图合成任务的启示性工作,最近领域内出现了许多基于 NeRF 的变种工作.本文以pytorch 版 NeRF 作为基础对 NeRF 的代码进行分 ...
- TCP拥塞控制算法BBR源码分析
BBR是谷歌与2016年提出的TCP拥塞控制算法,在Linux4.9的patch中正式加入.该算法一出,瞬间引起了极大的轰动.在CSDN上也有众多大佬对此进行分析讨论,褒贬不一. 本文首先对源 ...
- 【Golang源码分析】Go Web常用程序包gorilla/mux的使用与源码简析
目录[阅读时间:约10分钟] 一.概述 二.对比: gorilla/mux与net/http DefaultServeMux 三.简单使用 四.源码简析 1.NewRouter函数 2.HandleF ...
- ELMo解读(论文 + PyTorch源码)
ELMo的概念也是很早就出了,应该是18年初的事情了.但我仍然是后知后觉,居然还是等BERT出来很久之后,才知道有这么个东西.这两天才仔细看了下论文和源码,在这里做一些记录,如果有不详实的地方,欢迎指 ...
最新文章
- powerDesigner 正向工程生成sql注释问题 (mysql注释问题)
- php采用fpdf生成中文pdf
- React Native组件开发指南
- leetcode刷题 2.两数相加
- exo文件_您在eXo平台上的第一个Juzu Portlet
- ubuntu下软件中心闪退问题解决
- 公众号第三方平台开发 - 教程五 代公众号发起网页授权源码
- latex ht在下一页_告诉我们在下一本出色的领导力著作中要包括的内容
- 线段树——最大数——洛谷——1198
- 搭建开发环境之串口线的选择
- 认真分析mmap:what? why? how?
- Asp.net MVC权限设计思考 (二)逻辑部分实现
- 基于Echarts5实现的动态排序柱状图
- apo打印接口json参数_接口测试大全
- AAAI 2020上的NLP有哪些研究风向?
- 农村三资管理平台app_农村集体经济管理平台、“三资”信息公开手机APP招标公告...
- [附源码]java毕业设计卡通动漫商城系统
- 《赖氏经典英语语法》第四集
- 矩阵满秩分解原理解释
- 中文短文本分类实例十四-LEAM(Joint Embedding of Words and Labels for Text Classification)
热门文章
- AAAI | 深度生成模型—NEVAE
- Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台
- unix mysql命令大全_mySql的一些常用命令
- 宏基因组合种树,2-4天领证,1/2号车满员,3号车成立,机会来了
- 如何压缩PDF文件大小,满足各种上传大小要求
- 走进科学-小菌株大作为—枯草芽孢杆菌替代畜牧业抗生素添加
- QIIME 2用户文档. 16纵向和成对样本比较q2-longitudinal(2019.7)
- 宏基因组理论教程5宏基因组功能组成
- Basic005. Intro to statistics basic terms统计名词介绍
- 易生信-扩增子教程02-真菌引物选择