深度学习笔记(50) 一维到三维推广

  • 1. 2维数据
  • 2. 1维数据
  • 3. 3维数据

1. 2维数据

从卷积神经网络框架,到如何使用它进行图像识别、对象检测、人脸识别与神经网络转换
即使大部分讨论的图像数据,某种意义上而言都是2D数据,考虑到图像如此普遍
许多所掌握的思想不仅局限于2D图像,甚至可以延伸至1D,乃至3D数据

关于2D卷积,可能会输入一个14×14的图像,并使用一个5×5的过滤器进行卷积
接下来看到了14×14图像是如何与5×5的过滤器进行卷积的
通过这个操作会得到10×10的输出


如果使用了多通道,比如14×14×3,那么相匹配的过滤器可能是5×5×3
如果使用了多重过滤,比如16,最终你得到的是10×10×16


2. 1维数据

事实证明早期想法也同样可以用于1维数据

举个例子,左边是一个EKG信号,或者说是心电图(electrocardiogram)
当在胸部放置一个电极,电极透过胸部测量心跳带来的微弱电流
正因为心脏跳动,产生的微弱电波能被一组电极测量
这就是人心跳产生的EKG,每一个峰值都对应着一次心跳

如果想使用EKG信号,比如医学诊断
那么将处理1维数据,因为EKG数据是由时间序列对应的每个瞬间的电压组成
这次不是一个14×14的尺寸输入,可能只有一个14尺寸输入

在这种情况下可能需要使用一个1维过滤进行卷积
只需要一个1×5的过滤器,而不是一个5×5的

当对这个1维信号使用卷积,将发现一个14维的数据与5维数据进行卷积,并产生一个10维输出


再一次如果使用多通道,在这种场景下可能会获得一个14×1的通道
如果使用一个EKG,就是5×1的,如果有16个过滤器
可能最后会获得一个10×16的数据,这可能会是卷积网络中的某一层


对于卷积网络的下一层
如果输入一个10×16数据,也可以使用一个5维过滤器进行卷积,这需要16个通道进行匹配
如果有32个过滤器,另一层的输出结果就是6×32


于2D数据而言,当处理10×10×16的数据时也是类似的
可以使用5×5×16进行卷积,其中两个通道数16要相匹配
将得到一个6×6的输出
如果用的是32过滤器,输出结果就是6×6×32,这也是32的来源

所有这些方法也可以应用于1维数据,可以在不同的位置使用相同的特征检测器
比如说,为了区分EKG信号中的心跳的差异,可以在不同的时间轴位置使用同样的特征来检测心跳
所以卷积网络同样可以被用于1D数据,对于许多1维数据应用
实际上会使用递归神经网络进行处理


3. 3维数据

与1D数列或数字矩阵不同,现在有了一个3D块,一个3D输入数据

以做CT扫描为例,这是一种使用X光照射,然后输出身体的3D模型
CT扫描实现的是它可以获取身体不同片段(图片信息)

当进行CT扫描时,与现在做的事情一样,可以看到人体躯干的不同切片,本质上这个数据是3维的
一种对这份数据的理解方式是:
假设数据现在具备一定长度、宽度与高度,其中每一个切片都与躯干的切片对应

如果想要在3D扫描或CT扫描中应用卷积网络进行特征识别
也可以从二维和一维的卷积里得到想法,并将其应用到3D卷积中

为了简单起见,如果有一个3D对象,比如说是14×14×14
这也是输入CT扫描的宽度与深度(后两个14)
再次提醒,正如图像不是必须以矩形呈现,3D对象也不是一定是一个完美立方体
所以长和宽可以不一样
同样CT扫描结果的长宽高也可以是不一致的
为了简化讨论,仅使用14×14×14为例

如果现在使用5×5×5过滤器进行卷积,过滤器现在也是3D的,这将会给一个10×10×10的结果输出
技术上来说也可以再×1(编号1所示),如果这有一个1的通道
这仅仅是一个3D模块,但是数据可以有不同数目的通道
那种情况下也是乘1(编号2所示),因为通道的数目必须与过滤器匹配
如果使用16过滤器处理5×5×5×1,接下来的输出将是10×10×10×16
这将成为3D数据卷积网络上的一层


如果下一层卷积使用5×5×5×16维度的过滤器再次卷积,通道数目也与往常一样匹配
如果有32个过滤器,操作也与之前相同,最终得到一个6×6×6×32的输出

某种程度上3D数据也可以使用3D卷积网络学习,这些过滤器实现的功能正是通过3D数据进行特征检测
CT医疗扫描是3D数据的一个实例

另一个数据处理的例子是可以将电影中随时间变化的不同视频切片看作是3D数据
可以将这个技术用于检测动作及人物行为

总而言之这就是1D、2D及3D数据处理,图像数据无处不在
以至于大多数卷积网络都是基于图像上的2D数据
但希望其他模型同样会有帮助


参考:

《神经网络和深度学习》视频课程


相关推荐:

深度学习笔记(49) 风格代价函数
深度学习笔记(48) 内容代价函数
深度学习笔记(47) 神经风格迁移
深度学习笔记(46) 深度卷积网络学习
深度学习笔记(45) 人脸验证与二分类


谢谢!

深度学习笔记(50) 一维到三维推广相关推荐

  1. 4.11 一维到三维推广-深度学习第四课《卷积神经网络》-Stanford吴恩达教授

    ←上一篇 ↓↑ 下一篇→ 4.10 风格代价函数 回到目录 4.12 总结 一维到三维推广 (1D and 3D Generalizations of Models) 你已经学习了许多关于卷积神经网络 ...

  2. 吴恩达深度学习笔记(四)

    吴恩达深度学习笔记(四) 卷积神经网络CNN-第二版 卷积神经网络 深度卷积网络:实例探究 目标检测 特殊应用:人脸识别和神经风格转换 卷积神经网络编程作业 卷积神经网络CNN-第二版 卷积神经网络 ...

  3. 下载量过百万的吴恩达机器学习和深度学习笔记更新了!(附PDF下载)

    今天,我把吴恩达机器学习和深度学习课程笔记都更新了,并提供下载,这两本笔记非常适合机器学习和深度学习入门.(作者:黄海广) 0.导语 我和同学将吴恩达老师机器学习和深度学习课程笔记做成了打印版,放在g ...

  4. 33万字!深度学习笔记在线版发布!

    吴恩达老师的深度学习课程(deeplearning.ai),可以说是深度学习入门的最热门课程,我和志愿者编写了这门课的笔记,并在 github 开源,为满足手机阅读的需要,我将笔记做成了在线版,可以在 ...

  5. 深度学习笔记 第四门课 卷积神经网络 第四周 特殊应用:人脸识别和神经风格转换...

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  6. 《DeepLearning.ai 深度学习笔记》发布,黄海广博士整理

    深度学习入门首推课程就是吴恩达的深度学习专项课程系列的 5 门课.该专项课程最大的特色就是内容全面.通俗易懂并配备了丰富的实战项目.今天,给大家推荐一份关于该专项课程的核心笔记!这份笔记只能用两个字形 ...

  7. 深度学习笔记其七:计算机视觉和PYTORCH

    深度学习笔记其七:计算机视觉和PYTORCH 1. 图像增广 1.1 常用的图像增广方法 1.1.1 翻转和裁剪 1.1.2 改变颜色 1.1.3 结合多种图像增广方法 1.2 使用图像增广进行训练 ...

  8. 吴恩达深度学习笔记- lesson4 卷积神经网络

    文章目录 Week 1 卷积神经网络基础 4.1.1 计算机视觉(Computer vision) 4.1.2 边缘检测示例(Edge detection example) 4.1.3 更多边缘检测内 ...

  9. 深度学习笔记(17) 误差分析(二)

    深度学习笔记(17) 误差分析(二) 1. 使用来自不同分布的数据进行误差分析 2. 数据分布不匹配时的偏差与方差 3. 处理数据不匹配问题 1. 使用来自不同分布的数据进行误差分析 越来越多的团队都 ...

  10. 深度学习笔记(7) 实践层面(二)

    深度学习笔记(7) 实践层面(二) 1. 正则化 2. dropout 正则化 3. 其他正则化方法 1. 正则化 深度学习可能存在过拟合问题--高方差,在确定模型之后有两个解决方法 正则化 准备更多 ...

最新文章

  1. IDEA(IntelliJ IDEA)+常用快捷键(short cuts)
  2. 只缺一个程序员 如何让产品实现
  3. linux下的ppp软件,linux下ppp拨号无线上网(示例代码)
  4. python树状节点 可拖拽_Python 的 heapq 模块源码分析
  5. 无线网状网、Zigbee、RFID三种技术分析
  6. VS2010下安装Cocos2dx完整教程(原)
  7. 远程源已存在于“ git push”到新存储库中
  8. 初探 Yii2 的测试模式 index-test.php
  9. junit的命令行测试-Could not find class
  10. RHCE课程-RH253Linux服务器架设笔记五-APACHE服务器配置(2)
  11. IOS7开发~Xcode5制作framework
  12. ACCESS数据库查询
  13. STM32官方编程IDE及烧录软件介绍
  14. 答题小程序之调查问卷模板开发
  15. 什么软件可以清除流氓软件
  16. 家政维修小程序+上门预约小程序+VUE前后端分离+uniapp(附近师傅+门店入驻+在线抢单服务APP、小程序、公众号、H5)
  17. OpenAI-ChatGPT最新官方接口《审核机制》全网最详细中英文实用指南和教程,助你零基础快速轻松掌握全新技术(七)(附源码)
  18. XML与Json解析
  19. 百合数c语言360问答,关于百合花的资料
  20. iOS获取设备信息和获取当前屏幕状态

热门文章

  1. 手把手教你编译Flutter engine
  2. 前端面试,面试官会问些啥...
  3. Think:研究生期间的迷茫、困惑——放平心态,奋力拼搏
  4. 计算机论文参考文献范文,计算机文类论文参考文献 计算机文参考文献有哪些...
  5. 域名申请+云服务器购买+花生壳内网穿透+myeclipse web 登录
  6. uniapp 查看图片点击放大预览图片 单张 多张
  7. 语音共振峰的获取python
  8. 《别做正常的傻瓜》笔记……
  9. Photographic Tone Reproduction for Digital Images
  10. apache(Web服务器)