我:pytorch里想让输入原封不动输出应该用什么模块呀
群友A:1*1的卷积核
我:万一我输入是多通道的呢
群友A:1*1*N呗
群友B:conv2d(input_ch, input_ch, 1),输入输出通道保持一致。但1*1有点类似全连接。
复制代码

看到这里,我已经开始笑了——看来大家跟我一样,对这些基础知识的理解并不是特别透彻。而除此之外,跟其他同学聊到卷积时,我也能感觉到卷积尤其是1*1卷积是一个误解的重灾区。因此,今天打算把之前的思考整理下来,以便回顾。Python学习资料点击免费领取

卷积操作

卷积神经网络主要用于图像数据的处理,所以我们本次重点讨论的是图像卷积。作为一个选修过信号与系统课程的学生,我对卷积有着更原始、更初级,但也更准确的认识。对两个函数的卷积操作可以理解为是对其中一个函数翻转、移位,再测量它们之间的重叠。而在卷积神经网络中,卷积层严格来说是个错误的叫法,所谓卷积操作其实是互相关运算,而不是卷积,李沐老师在《动手学深度学习》中指出了这一点,本文暂且按下不表。

我们看下《动手学深度学习》中对二维卷积的定义:

在二维互相关运算中,卷积窗口从输入张量的左上角开始,从左到右、从上到下滑动。 当卷积窗口滑动到新一个位置时,包含在该窗口中的部分张量与卷积核张量进行按元素相乘,得到的张量再求和得到一个单一的标量值,由此我们得出了这一位置的输出张量值。

先从上面这个对话说起。

群友A最初的回复1*1的卷积核,乍一看是正确答案,因为对于一个单通道的输入而言,1*1的卷积核确实能保证不改变输入。不过我很快反问多通道输入的场景,群友的回复是1*1*N,另一位群友给出了代码和更准确的解释,但这其实是不对的。

对于多通道的卷积,卷积核的层数要与输入的层数一致,才能进行互相关运算,但是如果只有一个卷积核,那么输出的通道数就只会是1,如果用1*1*N的卷积核(滤波器),就相当于把输入的N个通道全部对应相加,最后得到了一个求和之后的单通道矩阵,而且这种损坏是不可逆的,我们也无法从中还原出输入前的N个通道各自的本来面貌。

卷积层与通道数的关系

进一步,按照群友所说的,输入输出通道数保持一致,这样就需要多组卷积核。关于输入通道与输出通道,这其实是很多同学模糊不清的第一个地方。在卷积操作中,输入通道数等于每个滤波器中卷积核的个数,输出通道数等于滤波器的个数。

首先我们先看下卷积层的构成,如图:

我们把中间核函数所对应的这部分称为一个卷积层。在一个卷积层中包含单个或多个滤波器,而每个滤波器又有多层,所谓的卷积核个数,就是每个滤波器有多少层。在上图中,每个滤波器中卷积核的个数为3,滤波器的个数为232也分别对应输入通道数和输出通道数。

回到群消息,如果输入输出通道数保持一致,那么则需要一个1*1*N*N的滤波器,但问题在于,这N个卷积核各自的值应该如何设定?如果全部设置成一样的,那么最终会把N通道输入变成N个一模一样的输出,显然是不正确的。不过我承认,如果N个卷积核全部设置为不同值,只要滤波器中的值能构成一个N*N的可逆矩阵,那么是可以从输出中将输入反解出来的,但这样就南辕北辙了。总之,想利用卷积操作将多通道的输入原封不动地输出是不可行的。

1*1卷积和全连接层有什么关系

这又是一个容易误解的地方,我见过不止一个人觉得1*1卷积本质上就是全连接层。虽然是很基础的问题,没什么意义,但既然都写到这了,我还是顺便把我的思考也记录一下吧。

1*1卷积和全连接层虽然没什么关系,但也有互通之处。全连接层可以用一种特殊的卷积层代替,假设输入为7*7*512,全连接层为长为4096的向量,如果用卷积层来代替这个全连接层,则在该卷积层中:

  • 4096个滤波器
  • 每个滤波器有512层(512个卷积核)
  • 每层的大小为7*7

这样输出的维度也是1*1*4096,因此可以通过卷积层来实现该全连接运算。

①3000多本Python电子书有
②Python开发环境安装教程有
③Python400集自学视频有
④软件开发常用词汇有
⑤Python学习路线图有
⑥项目源码案例分享有

如果你用得到的话可以直接拿走,在我的QQ技术交流群里(技术交流和资源共享,广告勿入)可以自助拿走,群号是895937462。

图像卷积的常见误区与个人思考相关推荐

  1. HTML文件撰写的注意事项有哪些,CSS及HTML 常见误区和注意事项(一)

    CSS及HTML 常见误区和注意事项(一) 为什么要设置HTML和body的高度 开始思考这个问题的起因: 有一次写练习,当我想设置一个div元素的垂直居中布局时,设置为以下CSS代码: positi ...

  2. 图像卷积与滤波知识点整理(2)

    本文参考博文: http://blog.csdn.net/yangtrees/article/details/8740933 1.图像卷积(模板) (1).使用模板处理图像相关概念: 模板:矩阵方块, ...

  3. 图像卷积详细解释 常用卷积核解释说明

    神经网络中的卷积层,它的原理就来源于图像卷积 概述 卷积在信号处理领域有极其广泛的应用, 也有严格的物理和数学定义. 本文只讨论卷积在数字图像处理中的应用. 在数字图像处理中, 有一种基本的处理方法: ...

  4. 收集:现场救人、抗震救援、灾后心理援助、地震和救灾的常见误区、地震时使用手机报平安办法...

    一.地震现场救人的三条经验 这几丢,我一直在打红十字舍的电话,想把这个建议转达灾区救援队,但一直占线.请相信我  我是唐山人,是亲历者,请四川的同胞想办法能把我的建议转达最好. 1.教人工具:一大颗直 ...

  5. 【python+opencv】图像卷积及滤波

    目录 1.噪声的分类 2.图像卷积 2.1单次卷积操作 2.2对整幅图像卷积 2.3完整卷积过程 3.opencv中的卷积-filter2D函数 4.卷积中的padding填充(边界填充) 5.pad ...

  6. OpenCV学习笔记(十)——图像卷积(cv.filter2D()、矩阵旋转cv.filp())

    目录 1 图像卷积过程 2 cv.filter2D() 3 cv.filp() 卷积运算在信号处理中十分常见,而图像信息可以看成一种信号.例如,图像的每一行可以看出测量亮度变化的信号,而每一列可以看作 ...

  7. 【说透区块链系列】区块链有哪些常见误区?

    经过了我前面几篇文章的铺垫讲解,你应该已经对区块链的知识体系已经有了一个基本的了解,但是,区块链是一项新兴的事物,大多数人依然处于知识的迷雾区,对区块链的理解并不是十分透彻. 我在很多场合都做过区块链 ...

  8. 【虹科】揭开关于激光雷达传感器的常见误区——第一部分

    随着世界科技向智能化.高效率发展,激光雷达及其应用也受到越来越多的关注.但是,人们对激光雷达技术及性能等方面也存在一些误解.本文将为大家揭开关于激光雷达的六个常见误区. 1.激光雷达应用的技术复杂 虽 ...

  9. Web前端工程师的一些常见误区

    想要作为一名合格的web前端工程师,那么掌握基本的开发技术是远远不够的,在职场中还要少犯一些错误,本期小编为大家分享的web前端培训教程主要是介绍一些web前端工程师常见的误区,希望对大家有所帮助. ...

最新文章

  1. php stortime,文件存储 - Laravel 5.8 中文文档手册 - php中文网手册
  2. mysql startupitem_MySQL数据库之Mac上安装MySQL过程分享
  3. php include传参数,浅谈php中include文件变量作用域
  4. 监控摄像头服务器维护要多久,监控摄像机怎么维护和保养?
  5. 手机联系人头像包_一组抖音上很火的表情包,这里都有,一起来可可爱爱吧
  6. IT 技能发展:10 大基本 IT 技能(精通一半你就是人才)
  7. k8s集群安装traefik 2.x (保证成功版)
  8. Android dex2jar反编译dex文件报错 Detail Error Information in File .\classes-error.zip
  9. java 拟合曲线_关于java实现自定义曲线拟合的研究
  10. JM8.5中的高精度象素运动估计 1
  11. 试用 必应bing 缤纷桌面
  12. c语言百分号le,在C语言中,有le-6这么个表示方法,怎么 – 手机爱问
  13. AI开发者大会,李彦宏成“宏颜获水”?
  14. oracle 取记录最大的那条记录_相机记录高三备考生的一天,看哭万人: 读书虽苦,却是最容易的那条路!...
  15. Google Earth上划定矢量范围并导出为KMZ文件
  16. 曙光服务器主板显示Fd,解析曙光八路服务器A950r-F、I950r-G
  17. 【毕业设计】答 辩 技 巧 一(以一个过来人的身份,祝各位答辩 过 过 过)
  18. html网页设计期末大作业——化妆品html+div商城(19页)
  19. javascript Date属性(月份英语)
  20. Java笔记整理——包装类

热门文章

  1. 物联网平台有哪些商业模式
  2. windows下系统dll文件大全
  3. 艺赛旗联合创始人胡立军:咨询机构、CIO和用户眼中的RPA「理想型」
  4. Javascript 合集 自己整理的收藏 记录一下(最下面有惊喜)
  5. 祝我亲爱的天蝎GG生日快乐!+相识3周年小纪念【转载】
  6. 2020 年值得关注的20个区块链项目,来看看今年该把目光放在哪?
  7. Ra-08系列开发板入门教程,标准LoRaWAN协议对接国外 TTN LoRaWAN 开源服务器。
  8. excel中读取数据拟合幂律分布
  9. 南卫理公会大学计算机科学,南卫理公会大学计算机科学与工程硕士.pdf
  10. PowerPoint2007无法将Excel图表转换为图形对象