因果卷积(causal)与扩展卷积(dilated)之An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling

author:gswycf

  最近在看关于NLP(自然语言处理)方面的文章,(其实不是自己要看),anyway,看了一个“An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling“,讲到了:虽然人们现在都在用RNN和LSTm去处理序列问题(sequence modeling),但是明显最近几年这些模型在这些问题上出现了瓶颈,你们之前都说CNN不适合处理sequence modeling问题,但其实并不是的,作者提出了一个普适的CNNN模型,在多个序列问题上和之前的RNN和LSTM比较,结果发现,CNN在这方面的能力确实是被低估了,CNN建立的model要比之前人们之前用的RNN要好很多,而且简洁。

  这篇blog并不是要讲那篇文章,我可能会单独写一篇(看有没有时间),这篇blog主要是结束那篇文章中提出的两个概念:因果卷积(causal)与扩展卷积(dilated)

  

  因果卷积:

  因为要处理序列问题(即要考虑时间问题,)就不能使用普通的CNN卷积,必须使用新的CNN模型,这个就是因果卷积的作用,看下面一个公式,对与序列问题(sequence modeling),主要抽象为,根据x1......xt和y1.....yt-1去预测yt,使得yt接近于实际值

  

  我们根据图片来看下因果卷积的样子,下面这个图片来自:https://deepmind.com/blog/wavenet-generative-model-raw-audio/

  上面的图片可以详细的解释因果卷积,但是问题就来,如果我要考虑很久之前的变量x,那么卷积层数就必须增加(自行体会)。。。卷积层数的增加就带来:梯度消失,训练复杂,拟合效果不好的问题,为了决绝这个问题,出现了扩展卷积(dilated)

  因果卷积:

  对于因果卷积,存在的一个问题是需要很多层或者很大的filter来增加卷积的感受野。本文中,我们通过大小排列来的扩大卷积来增加感受野。扩大卷积(dilated convolution)是通过跳过部分输入来使filter可以应用于大于filter本身长度的区域。等同于通过增加零来从原始filter中生成更大的filter。

这就可以解决因果卷积带来的问题,在示意图中,卷积感受野扩大了1,2,4,8倍。扩大卷积(dilated convolution)可以使模型在层数不大的情况下有非常大的感受野。

转载于:https://www.cnblogs.com/fantastic123/p/9389128.html

因果卷积(causal)与扩展卷积(dilated)相关推荐

  1. 因果卷积(causal Convolutions)和扩展卷积(Dilated Convolutions)

    背景 对于序列问题(Sequence Modeling)的处理方法,通常采用RNN或者LSTM,例如处理一段视频/音频,往往会沿着时间方向(时序)进行操作.通常CNN网络都被认为适合处理图像数据而不适 ...

  2. 从一维卷积、因果卷积(Causal CNN)、扩展卷积(Dilation CNN) 到 时间卷积网络 (TCN)

    来源: AINLPer微信公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2022-09-30 引言 卷积神经网络 (CNN) 尽管通常与图像分类任务相关,但经过改 ...

  3. 场景分割:MIT Scene Parsing 与DilatedNet 扩展卷积网络

    MIT Scene Parsing Benchmark简介 Scene parsing is to segment and parse an image into different image re ...

  4. 因果卷积,膨胀卷积,混合膨胀卷积

    因果卷积: 常常用于CNN网络来处理序列问题,针对序列问题x1,...xt,和y1,...,yt-1来预测yt. 时间t的状态预测依赖于前t-1个状态,具有因果关系. 如果考虑很久之前的变量x,就会导 ...

  5. DL之CNN:卷积神经网络算法简介之卷积矩阵、转置卷积(反卷积Transpose)、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略

    DL之CNN:卷积神经网络算法简介之卷积矩阵.转置卷积(反卷积Transpose).膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略 目录 卷积矩阵的简介 卷积.转置卷积--Tran ...

  6. 一文读懂 12种卷积方法(含1x1卷积、转置卷积和深度可分离卷积等)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 我们都知道卷积的重要性,但你知道深度学习领域的卷积究竟是什么,又有 ...

  7. 图卷积神经网络4-空域卷积:空域卷积局限性分析和过平滑解决方案

    知乎主页https://www.zhihu.com/people/shuang-shou-cha-dai-53https://www.zhihu.com/people/shuang-shou-cha- ...

  8. 卷积神经网络四种卷积类型

    卷积神经网络四种卷积类型 https://www.toutiao.com/a6631333810287936013/ 一般卷积 首先,我们需要就定义卷积层的一些参数达成一致. 卷积核大小(Kernel ...

  9. 【深度学习】讲一个深度分离卷积结构和空洞卷积的应用

    [深度学习]讲一个深度分离卷积结构和空洞卷积的应用 文章目录 前言:看一张图像 1 概述1.1 正常卷积1.2 Depth可分离卷积 2 深度可分离卷积的优点 3 空洞(扩张)卷积(Dilated/A ...

最新文章

  1. 影著协公布的使用费收取标准
  2. postgresql数据库的备份与恢复
  3. 什么是mysql的游标_MySQL游标概念是什么 MySQL游标概念与用法介绍
  4. 转:巧用搜狗输入法输入英文单词
  5. 太古鸿蒙诀正式版v1.07,百变队长安崎:台上小辣椒,台下情歌王
  6. response 200是什么意思 python_鹿晨晖一组做了200次坐姿腿屈伸,他什么意思?
  7. 32怎么将mcu内的代码擦除_8位和32位MCU该如何选择?
  8. python中分支语句elif与else的区别_浅谈对python中if、elif、else的误解
  9. C#用串口接收事件接不全数据的处理
  10. 如何从 Mac 上的“照片”中导出照片、视频和幻灯片放映?
  11. ubuntu14安卓phalcon
  12. 【TWVRP】基于matalb粒子群算法求解带时间窗的车辆路径规划问题【含Matlab源码 1272期】
  13. 计算机原理寻址方式试题,计算机组成原理试题和答案
  14. 20210525电力通信网
  15. 嵌入式开发日记(3)——利用Python接收并处理JY61传感器数据
  16. W10系统下 获取 TrustedInstaller 高级权限.
  17. 动词ing形式的5种用法_加ing的形式有哪几种?怎样用
  18. 1星《微信软文营销实战技巧》:标题党,作者没有实战经验
  19. 安全扫描工具-appscan
  20. 神经网络怎么学,怎么学神经网络

热门文章

  1. MOBA游戏草丛系统的个人思路
  2. dll占的究竟是谁的空间?——浅谈Windows内存机制
  3. 新技能get!用 Python 高效背单词!
  4. c31 rotc_百度百科
  5. c语言点菜菜单程序大学一,数据结构实训报告 c语言点餐系统 net
  6. dwcs6连接不上access数据库_在DW中实现与ACCESS数据库连接方法
  7. 毕业设计-基于SpringBoot幼儿园管理系统
  8. 专注儿童编程,核桃编程招人啦~
  9. 第七章·【第一次上岗:核桃编程】
  10. Summer School实验