序列建模:时间卷积网络取代RNN(An Empirical Evaluation of Generic Convolutional and Recurrent)论文 pdf
下载地址:https://u20150046.ctfile.com/fs/20150046-376633283
作者:Shaojie Bai, J. Zico Kolter, Vladlen Koltun
论文摘要
对于大多数深度学习实践者来说,序列建模与循环网络是同义词。然而,最近的研究结果表明,卷积架构在语音合成和机器翻译等任务上的表现优于循环网络。给定一个新的序列建模任务或数据集,应该使用哪种架构?我们对序列建模的一般卷积和循环架构进行了系统的评价。我们在广泛的标准任务中评估这些模型。我们的结果表明,一个简单的卷积架构在不同的任务和数据集上的表现优于LSTM等典型的循环网络。我们的结论是,需要重新考虑序列建模和循环网络之间的共同关联,卷积网络应该被视为序列建模任务的一个自然起点。我们提供了相关代码:http://github.com/locuslab/TCN
概要总结
本文的作者质疑了一个常见假设,即循环架构应该是序列建模任务的默认起点。他们的结果表明,时间卷积网络(TCNs)在多个序列建模任务中明显优于长短期记忆网络(LSTMs)和门控循环单元网络(GRUs)等典型的循环架构。
核心思想
1.时间卷积网络(TCN)是基于最近提出的最佳实践(如扩张卷积和残差连接)设计的,它在一系列复杂的序列建模任务中表现得明显优于通用的循环架构。
2.TCN表现出比循环架构更长的记忆,因此更适合需要较长的历史记录的任务。
最重要的成果
1.在序列建模任务上提供了卷积架构和循环架构的广泛、系统的比较。
2.设计了一个卷积架构,它可以作为序列建模任务的一个方便且强大的起点。
AI社区的评价
在使用RNN之前,一定要先尝试CNN。你会惊讶于你能走多远。——特斯拉人工智能主管Andrej Karpathy。
未来研究方向
为了提高TCN在不同序列建模任务中的性能,需要进一步精化架构和算法。
可能的应用
TCN的提出可以提高依赖于循环架构的AI系统的序列建模能力,包括:
1.机器翻译;
2.语音识别;
3.音乐和语音产生。
序列建模:时间卷积网络取代RNN(An Empirical Evaluation of Generic Convolutional and Recurrent)论文 pdf相关推荐
- An Empirical Evaluation of Generic Convolutional and Recurrent Networks(中文版+注释)(时序预测)(TCN时域卷积网络)
TCN (An Empirical Evaluation of Generic Convolutional and Recurrent Networks 中文版+注释)百度网盘链接一般卷积和递归网络的 ...
- 时间卷积网络(TCN)在 NLP 多领域发光,RNN 或将没落
也就是从 2014.15 年起,我们基于深度神经网络的应用就已经在文本和语音识别领域达到 95% 的准确率,可以用来开发新一代的聊天机器人.个人助理和即时翻译系统等. 卷积神经网络(Convoluti ...
- TCN(Temporal Convolutional Network,时间卷积网络)
1 前言 实验表明,RNN 在几乎所有的序列问题上都有良好表现,包括语音/文本识别.机器翻译.手写体识别.序列数据分析(预测)等. 在实际应用中,RNN 在内部设计上存在一个严重的问题:由于网络一次只 ...
- 时间卷积网络(TCN)在唇语识别中的应用
目录 前言 一.TCN的发展与应用 二.TCN详解 三.MS-TCN用于唇语识别 四.DC-TCN用于唇语识别 总结 前言 唇语识别是深度学习领域极具挑战性的课题,主要表现在两方面:一是技术的复杂性, ...
- 【CV】膨胀卷积详解以及时间卷积网络TCN论文笔记和源码实现
这篇博文分为两部分.第一部分详细讲解了TCN模型(Temporal Convolutional Network)中涉及的1D卷积,因果卷积,膨胀卷积中设计的计算,非常值得一看,有醍醐灌顶的作用.第二部 ...
- 从一维卷积、因果卷积(Causal CNN)、扩展卷积(Dilation CNN) 到 时间卷积网络 (TCN)
来源: AINLPer微信公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2022-09-30 引言 卷积神经网络 (CNN) 尽管通常与图像分类任务相关,但经过改 ...
- 【Python项目实战】基于时间卷积网络(Temporal Convolution Network ,TCN)的发动机剩余寿命预测
摘要航空发动机结构复杂,状态变量多且相互之间存在着严重非线性特征,传统的基于物理失效模型的方法难以精确地预测发动机的剩余寿命(RUL).针对此问题,采用时间卷积网络(Temporal Convolut ...
- 时间卷积网络TCN:时间序列处理的新模型
这篇文章回顾了基于TCN的解决方案的最新创新.我们首先介绍了一个运动检测的案例研究,并简要回顾了TCN架构及其相对于传统方法的优势,如卷积神经网络(CNN)和递归神经网络(RNN).然后,我们介绍了一 ...
- 【论文解读】一种基于时间卷积网络的知识驱动股票趋势预测方法
写在前面 下面这篇文章的内容主要是来自论文<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Convol ...
最新文章
- js网页如何获取手机屏幕宽度
- Android中的Fragment
- Python十分适合用来开发网页爬虫
- C#关键字详解第二节
- 非线性回归模型(part1)--神经网络
- linux 视频编辑 ffmpeg,ffmpeg转码视频真的好用!(ffmpeg的简单使用方法)
- linux中用shell获取昨天、明天或多天前的日期
- 微信小程序全局分享设置
- [python]一个遍历多层文件夹,然后替换文件内容和目录名称的案例
- 企业应用大数据探索发展新路径
- 从Visual SourceSafe (VSS)服务器下载文件(C#)
- 数字藏品NFT用的国内联盟链有哪些?
- APP Launch 优化
- C语言视频教程-谭浩强版-小甲鱼主讲—P18
- php格式视频怎么下载链接,php – 如何找到vimeo视频的下载链接?
- 方寸微 T630 USB3.0超高速接口芯片
- 国内一些比较大型的外包公司
- Java面对对象程序设计:第一章 面对对象
- 微型计算机三包针对的对象是单选题,微型计算机三包规定???
- Blender图解教程:高仿版超级马里奥(二)头部建模(附模型下载)