欢迎来到专栏《AI杂谈》,顾名思义就是说一些比较杂的有意思的东西了,任何东西都有可能

今天首先介绍一篇文章,2014年的一篇深度学习综述,《Deep learning in Neural Networks:An Overiew》,来自于瑞士人工智能实验室Jurgen Schmidhuber。这是我见过的唯一一篇参考文献比正文还长的文章(看来还是文章看得太少了),正文17页,参考文献27页。在这个基础上对深度学习的各个方向做简单的介绍。

作者 | 言有三

编辑 | 言有三

01

文章内容

顾名思义这是一篇深度学习综述文章,虽然是4年前,时间有点久远了,但是还有具有可读性的,尤其是历史部分。文章的内容包括以下几个方面。

1.1 Introduction

前面四节都是简介,加起来也只有5页纸,而且一些术语很是晦涩。

第一节简单介绍了什么是神经网络,神经网络的几个重要历史节点(1960年代的启蒙,1980年代反向传播被用于训练模型,2009年后开始逐渐在各类比赛中崭露头角等)。

提到了早期的无监督学习和有监督学习,在没有反向传播算法之前,实际上主流是采用无监督学习的方案,winner-take-all算法是很常见的。

第二节扯了没什么卵用的东西。

第三节讨论了模型深度的问题,何时shallow learning就能搞定问题,何时又需要deep learning?这是个很复杂的工程问题了,早点想一想也好。

第四节说了深度学习中的一些常见主题。提了无监督学习对有监督学习和增强学习的辅助,甚至还有GPU,不过笔者觉得写的真烂。

1.2 Supervised NNs

这一节才是正式开始说历史,咱们可以看一下目录了解大概。

5.1节说的是上个世纪40年代,McCulloch和Pitts提出的MP模型

5.2节说的是上个世纪60年代Hubel和Wiesel研究猫的大脑并发现了大脑视觉机制,这是整个卷积神经网络的基础,两人也因此获得了诺贝尔生理学与医学奖。

5.3节说的是最早的多层感知器模型,甚至1971年的时候已经达到了8层,当时的机器下不知道怎么训练的,有时间要去看看。

5.4节说的是第一个卷积神经网络,Neogognitron。在这个网络中已经出现了现代卷积神经网络的基本轮廓,卷积和下采样,公众号之前也解读过的。

5.5节讲述了反向传播机制的诞生,及其在神经网络训练中的应用。正式的出现是在1981年,从此反向传播成为了神经网络的标配训练机制。

后面的大家自己对着看吧

......

......

......

1.3 Reinforcement Learning

第5部分都在说有监督学习和无监督学习在一些模式识别任务中的应用,第6部分则重点就是说增强学习在一些未知环境中的应用,并且同时讨论了前馈神经网络FNN和RNN。

02

杂谈深度学习综述

既然是杂谈就再说两句,上面这篇文章其实正文不长,但是真的不好读,在公众号写出来只是感觉比较奇特(吸引眼球)。

如果你想读深度学习或者CNN相关的综述,我推荐一些其他的资料,更好。

《What Do We Understand About Convolutional Networks?》,这是我见过最好的卷积神经网络综述,没有之一,老少咸宜,新手和菜鸟都行,覆盖CNN方方面面,有图有真相,机器之心有中文翻译版本。

《Efficient Processing of Deep Neural Networks: A Tutorial and Survey》,主要是硬件角度出发撰写的Deep learning综述,这篇文章说的东西也比较多。

《A Deep Learning Tutorial: From Perceptrons to Deep Networks》,优秀入门博客,不多解释。

下面我对深度学习中的一些重要研究方向列出来供大家学习参考,涉及的东西太多了。

2.1 深度学习理论

深度学习相关的理论涉及非常多的东西,为大家所熟悉的就包括最优化方法,激活函数,正则化方法,归一化方法,初始化方法,可视化解释等等。

前段时间公众号也做了调研,大家对这一块内容的投票最高,之所以前段时间没写,是因为我想把这一块写的尽可能完美而浅显易懂,有理论又包含实践,这一块是我们2019年的重中之重,尽情期待吧!

2.2 模型架构

这一块包含的东西也特别多(其实可以包含在理论中),深度学习在各大领域都有不同的模型,比如图像领域常见的CNN,语音和NLP领域常见的RNN,LSTM,GAN。而CNN又包含了非常多的结构,我们有一个专栏(可以至公众号菜单看),大家持续关注就好,下面是其中的几篇文章。

【模型解读】“不正经”的卷积神经网络

【模型解读】resnet中的残差连接,你确定真的看懂了?

2.3 深度学习框架

工欲善其事必先利其器,深度学习框架对于从事相关工作太重要了,我们也有一个快速入门的专栏(可以至公众号菜单看),而且今年会进行更多的拓展,这也是公众号今年的重点项目

【caffe速成】caffe图像分类从模型自定义到测试

【tensorflow速成】Tensorflow图像分类从模型自定义到测试

2.4 数据相关

数据是深度学习系统的输入,从数据的收集整理到数据增强的应用等涉及的领域也非常广,而且通常毁掉一个项目的就是数据,我们也有相关的专栏和文章。

【技术综述】一文道尽“人脸数据集”

【技术综述】深度学习中的数据增强(下)

【数据】深度学习从“数据集”开始

2.5 可视化

数据和模型的可视化也是一个单独的领域,可以有助于我们更深入理解数据和模型到底学到了什么,在干什么,我们也有一篇综述的。

【技术综述】“看透”神经网络

2.6 方向

涉及的方向太广了,以图像为例,笔者以前在外讲座包括了以下内容。

当然,从应用角度来说,人脸,自动驾驶等都是非常大的方向,足够研究半辈子了。

另外,一些训练技巧,损失函数的设计等都是非常重要的工程技巧,我会经常写写的,请持续关注吧。

本文相关的文章,可以发送关键词“深度学习综述”获取。

总结

提几个小众但是很有意思的问题供大家思考一下,过一天我会公布答案。考验知识是不是扎实的时候到了。


1,谁首先提出了数据增强策略?

2,第一个图像领域的卷积神经网络和第一个语音领域的卷积神经网络分别是谁?

3,为什么LeNet网络,倒数第二层全连接的大小是84?

转载文章请后台联系

侵权必究

更多请关注知乎专栏《有三AI学院》

往期精选

  • 回顾2018,计划2019

  • 【杂谈】为什么你学了AI,企业却不要你

【AI杂谈】从一篇参考文献比正文还长的文章,杂谈深度学习综述相关推荐

  1. 百度 AI 再发福利!不仅有实战营,还有手把手教学的“深度学习公开课”

    点击上方"CSDN",选择"置顶公众号" 关键时刻,第一时间送达! 百度 AI 开发者实战营第二季强势回归,你期待的技术干货.成功案例与大咖演讲都将如期而至,甚 ...

  2. 看完这篇AI算法和笔记,跟面试官扯皮没问题了 | 基于深度学习和传统算法的人体姿态估计

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  3. 看完这篇AI算法和笔记,跟面试官扯皮没问题了 | 基于深度学习和传统算法的人体姿态估计...

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  4. 看完这篇AI算法和笔记,让面试官刮目相看没问题了 | 基于深度学习和传统算法的人体姿态估计...

    点击蓝色"AI专栏"关注我哟 重磅干货,第一时间送达 这是站长的第 41 篇原创优质长文 前几天站长写的一篇的文章[基于深度学习算法和传统立体匹配算法的双目立体视觉]大受好评.这次 ...

  5. 技术小白的AI产品经理成长之路第一步(吴恩达《深度学习工程师》学习笔记2.1二分分类)希望可以给同为技术小白的同学一点深参考

    <背景> 作为一个在市场营销岗位多年的技术小白,突然某天想到自己曾经的产品梦正在伤感之余(话说曾经因为舍不得在营销岗多年的经验,因此在三年前想要转行却一直未能成功,直到现在移动端红利期已过 ...

  6. 一篇适合新手的深度学习综述

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|人工智能与算法学习 这篇综述论文列举出了近年来深度学习的重 ...

  7. 从起源到具体算法,这篇深度学习综述论文送给你

    来源:机器之心 本文共4602字,建议阅读8分钟. 本文为大家从最基础的角度来为大家解读什么是深度学习,以及深度学习的一些前沿发展. 自 2012 年多伦多大学 Alex Krizhevsky 等人提 ...

  8. AI公开课:19.04.04李航—字节跳动AILab总监《深度学习与自然语言处理:评析与展望》课堂笔记以及个人感悟

    AI公开课:19.04.04李航-字节跳动 AI Lab总监<深度学习与自然语言处理:评析与展望>课堂笔记以及个人感悟 导读 1.关于李航教授       李航,字节跳动科技有限公司人工智 ...

  9. 首篇!基于全景相机的深度学习综述:全面回顾未来展望

    作者 | dianyunPCL  编辑 | 点云PCL 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[目标检测]技术交流群 摘要 全 ...

最新文章

  1. 日志中的秘密:Windows登录类型知多少
  2. CoreOS安装到硬盘
  3. 一朝清明不若鸿蒙什么意思,清明节得名并非源于“气清景明”
  4. CVPR 2021 | 如何让GAN的训练更加高效优雅
  5. python 录入数据不重复_pythonDjango批量导入不重复数据
  6. 深入剖析ORACLE数据库备份与恢复的原理
  7. python自己写包_如何将自己的Python包发布到PyPI
  8. UNIX下DNS服务器之创建篇(下)
  9. cut point and bridge总结
  10. python申明变量和赋值_Python入门(二)
  11. 旅游景区无线智能调频广播系统
  12. docker安装redis并挂载配置文件
  13. win10硬盘读写速度测试-crystaldiskmark
  14. IT十大最尴尬瞬间 盖茨遭遇Win98死机列榜首
  15. 【优化调度】基于粒子群算法求解水火电调度优化问题含Matlab源码
  16. TemporalType
  17. HDU-1173 采矿(采矿)
  18. STM32CubeIDE 统计及控制PWM产生个数
  19. 【Qt】 Pro工程管理文件介绍
  20. 颜色类中英文词汇大全(2)

热门文章

  1. 算法--微软面试:指定数字在数组中出现的次数
  2. 一天搞定CSS:层级(z-index)--18
  3. Java之线程同步练习
  4. (Java集合框架)List接口
  5. 深拷贝一个对象会了,怎么深拷贝一个图?
  6. 修改Linux终端命令行字体颜色(对比明显,超炫酷)
  7. 线性表的动态顺序存储和实现(C语言实现)【线性表】(4)
  8. php access ole相片,[求助]怎样读取ACCESS数据库中的OLE对象的图片啊???
  9. Java写手机专题分析接口_jeesite学习文档API-内容管理模块
  10. mac mysql ip访问不了_解决mysql中只能通过localhost访问不能通过ip访问的问题