下载地址:https://u20150046.ctfile.com/fs/20150046-376633283

作者:Shaojie Bai, J. Zico Kolter, Vladlen Koltun

论文摘要

对于大多数深度学习实践者来说,序列建模与循环网络是同义词。然而,最近的研究结果表明,卷积架构在语音合成和机器翻译等任务上的表现优于循环网络。给定一个新的序列建模任务或数据集,应该使用哪种架构?我们对序列建模的一般卷积和循环架构进行了系统的评价。我们在广泛的标准任务中评估这些模型。我们的结果表明,一个简单的卷积架构在不同的任务和数据集上的表现优于LSTM等典型的循环网络。我们的结论是,需要重新考虑序列建模和循环网络之间的共同关联,卷积网络应该被视为序列建模任务的一个自然起点。我们提供了相关代码:http://github.com/locuslab/TCN

概要总结

本文的作者质疑了一个常见假设,即循环架构应该是序列建模任务的默认起点。他们的结果表明,时间卷积网络(TCNs)在多个序列建模任务中明显优于长短期记忆网络(LSTMs)和门控循环单元网络(GRUs)等典型的循环架构。

核心思想

1.时间卷积网络(TCN)是基于最近提出的最佳实践(如扩张卷积和残差连接)设计的,它在一系列复杂的序列建模任务中表现得明显优于通用的循环架构。

2.TCN表现出比循环架构更长的记忆,因此更适合需要较长的历史记录的任务。

最重要的成果

1.在序列建模任务上提供了卷积架构和循环架构的广泛、系统的比较。

2.设计了一个卷积架构,它可以作为序列建模任务的一个方便且强大的起点。

AI社区的评价

在使用RNN之前,一定要先尝试CNN。你会惊讶于你能走多远。——特斯拉人工智能主管Andrej Karpathy。

未来研究方向

为了提高TCN在不同序列建模任务中的性能,需要进一步精化架构和算法。

可能的应用

TCN的提出可以提高依赖于循环架构的AI系统的序列建模能力,包括:

1.机器翻译;

2.语音识别;

3.音乐和语音产生。

序列建模:时间卷积网络取代RNN(An Empirical Evaluation of Generic Convolutional and Recurrent)论文 pdf相关推荐

  1. An Empirical Evaluation of Generic Convolutional and Recurrent Networks(中文版+注释)(时序预测)(TCN时域卷积网络)

    TCN (An Empirical Evaluation of Generic Convolutional and Recurrent Networks 中文版+注释)百度网盘链接一般卷积和递归网络的 ...

  2. 时间卷积网络(TCN)在 NLP 多领域发光,RNN 或将没落

    也就是从 2014.15 年起,我们基于深度神经网络的应用就已经在文本和语音识别领域达到 95% 的准确率,可以用来开发新一代的聊天机器人.个人助理和即时翻译系统等. 卷积神经网络(Convoluti ...

  3. TCN(Temporal Convolutional Network,时间卷积网络)

    1 前言 实验表明,RNN 在几乎所有的序列问题上都有良好表现,包括语音/文本识别.机器翻译.手写体识别.序列数据分析(预测)等. 在实际应用中,RNN 在内部设计上存在一个严重的问题:由于网络一次只 ...

  4. 时间卷积网络(TCN)在唇语识别中的应用

    目录 前言 一.TCN的发展与应用 二.TCN详解 三.MS-TCN用于唇语识别 四.DC-TCN用于唇语识别 总结 前言 唇语识别是深度学习领域极具挑战性的课题,主要表现在两方面:一是技术的复杂性, ...

  5. 【CV】膨胀卷积详解以及时间卷积网络TCN论文笔记和源码实现

    这篇博文分为两部分.第一部分详细讲解了TCN模型(Temporal Convolutional Network)中涉及的1D卷积,因果卷积,膨胀卷积中设计的计算,非常值得一看,有醍醐灌顶的作用.第二部 ...

  6. 从一维卷积、因果卷积(Causal CNN)、扩展卷积(Dilation CNN) 到 时间卷积网络 (TCN)

    来源: AINLPer微信公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2022-09-30 引言 卷积神经网络 (CNN) 尽管通常与图像分类任务相关,但经过改 ...

  7. 【Python项目实战】基于时间卷积网络(Temporal Convolution Network ,TCN)的发动机剩余寿命预测

    摘要航空发动机结构复杂,状态变量多且相互之间存在着严重非线性特征,传统的基于物理失效模型的方法难以精确地预测发动机的剩余寿命(RUL).针对此问题,采用时间卷积网络(Temporal Convolut ...

  8. 时间卷积网络TCN:时间序列处理的新模型

    这篇文章回顾了基于TCN的解决方案的最新创新.我们首先介绍了一个运动检测的案例研究,并简要回顾了TCN架构及其相对于传统方法的优势,如卷积神经网络(CNN)和递归神经网络(RNN).然后,我们介绍了一 ...

  9. 【论文解读】一种基于时间卷积网络的知识驱动股票趋势预测方法

    写在前面 下面这篇文章的内容主要是来自论文<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Convol ...

最新文章

  1. js网页如何获取手机屏幕宽度
  2. Android中的Fragment
  3. Python十分适合用来开发网页爬虫
  4. C#关键字详解第二节
  5. 非线性回归模型(part1)--神经网络
  6. linux 视频编辑 ffmpeg,ffmpeg转码视频真的好用!(ffmpeg的简单使用方法)
  7. linux中用shell获取昨天、明天或多天前的日期
  8. 微信小程序全局分享设置
  9. [python]一个遍历多层文件夹,然后替换文件内容和目录名称的案例
  10. 企业应用大数据探索发展新路径
  11. 从Visual SourceSafe (VSS)服务器下载文件(C#)
  12. 数字藏品NFT用的国内联盟链有哪些?
  13. APP Launch 优化
  14. C语言视频教程-谭浩强版-小甲鱼主讲—P18
  15. php格式视频怎么下载链接,php – 如何找到vimeo视频的下载链接?
  16. 方寸微 T630 USB3.0超高速接口芯片
  17. 国内一些比较大型的外包公司
  18. Java面对对象程序设计:第一章 面对对象
  19. 微型计算机三包针对的对象是单选题,微型计算机三包规定???
  20. Blender图解教程:高仿版超级马里奥(二)头部建模(附模型下载)

热门文章

  1. lvm讲解和磁盘故障案例
  2. 【VMC实验室】在QCloud上创建您的SQL Cluster(1)
  3. powerDesign设计随笔
  4. ios关于用xib创建的cell 自动返回cell的高度问题!
  5. 关于比特币现金升级问题讨论不断升温
  6. Gulp快速入门教程
  7. 【Linux探索之旅】第二部分第五课:用户和权限,有权就任性
  8. Linux下设置进程使用指定核的CPU
  9. 获取保存在沙盒中plist文件的用户的字典信息
  10. T-SQL WITH 分号问题