Introduce of deep learning

1.问题展示

正常情况下,输入为‘cat’输出为一张猫的图片;而我们研究的内容是输入一张猫的图片,输出‘cat’。f(‘cat’) = a pic of cat,我们研究f(‘a pic of cat’)=‘cat’。

为了达到上述效果,我们需要定义一系列函数,优化函数有关参数,然后在定义的函数中选出最适合的函数。就是这么简单的几步,这就是深度学习要做的事情。只不过上述定义的函数是模拟神经网络建立的, 如图。可以看到,这里的计算可以抽象成矩阵的计算,所以线性代数一定要好好学。下图只是一个函数,而神经网络是有多个这样的函数串行或者并行组成。

一个简单的图片识别的例子,如下图所示

文中也介绍到要确定神经网络的层数和每一层的神经元个数需要我们不断的尝试和纠正另外也要靠一些直觉。

2.深度学习组件

训练数据,学习目标,损失,总损失。他们之间的关系是,我们通过训练数据要达到一定的学习目标,在这个目标情况下,总损失最小。

我们是以函数为训练目标的,函数结构事先定义好,参数先随机生成。将前向计算得到的结果和我们的预期结果对比计算出loss,得到总loss,然后根据设定的梯度下降算法(Gradient Descent)更新参数。而更新

3.为什么要深度学习

实践证明,参数越多,性能越好;Fat+Short 比 Thin + Tall性能差。

深度学习的代码编写者有两种角色,一种是正常角色,即搭积木的孩子;一种非正常角色,即写函数的大佬。目前的科学研究大部分在于调节深度学习的结构,优化参数等操作。

4 recipe of deep learning

选择合适损失函数,mini-batch,激活函数,可适应学习率,momentum,early stop, 正则化, 网络结构。

损失函数有那些:square error,cross entropy
mini-batch:batch是我们选择的一个处理单位,表明一次取多少数据进行处理
激活函数:ReLU,Sigmoid,Maxout
学习率:学习率太高,则总损失在每次更新后可能不会下降,如果学习率太低,则训练过程会很慢
momentum:momentum是梯度下降法中一种常用的加速技术。(https://www.zhihu.com/question/24529483)
early stopping: 学习目标由训练数据定义,而训练数据和测试数据往往不一样,因此我们需要确保训练数据训练出来的参数适应于测试数据,不要出现过拟合现象。
正则化:weight decay是一种正则化手段,weight decay是放在正则项(regularization)前面的一个系数,正则项一般指示模型的复杂度,所以weight decay的作用是调节模型复杂度对损失函数的影响,若weight decay很大,则复杂的模型损失函数的值也就大
dropout:是指随机去掉神经网络中的某些神经元达到优化训练过程(http://www.cnblogs.com/dupuleng/articles/4341265.html)
网络结构:各种cnn模型(Inception v1,v2,v3等)

有错误的话欢迎指正~

一天搞懂深度学习—学习笔记1相关推荐

  1. 太强了! 李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT

    <1 天搞懂深度学习>,300 多页的 ppt,台湾李宏毅教授写的,非常棒.不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章. 这份 300 页的 PPT,被搬运到了 Sli ...

  2. 下载 | 李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT

    <1 天搞懂深度学习>,300 多页的 ppt,台湾李宏毅教授写的,非常棒.不夸张地说,是我看过最系统,也最通俗易懂的,关于深度学习的文章. 这份 300 页的 PPT,被搬运到了 Sli ...

  3. 【深度学习】李宏毅:1 天搞懂深度学习,我总结了 300 页 PPT(附思维导图)...

    转载自:机器学习算法那些事 ID:Charlotte77 公众号:Charlotte数据挖掘 By    Charlotte77 前言:李宏毅的教材,非常经典,B站有配套视频,文末附下载链接!     ...

  4. 干货 | 台大“一天搞懂深度学习”课程PPT(下载方式见文末!!)

    微信公众号 关键字全网搜索最新排名 [机器学习算法]:排名第一 [机器学习]:排名第一 [Python]:排名第三 [算法]:排名第四 Deep Learing Tutorial 本篇文章我们给出了一 ...

  5. 李宏毅——一天搞懂深度学习PPT学习笔记

    李宏毅一天搞懂机器学习PPT,SildeShare链接:https://www.slideshare.net/tw_dsconf/ss-62245351?qid=108adce3-2c3d-4758- ...

  6. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  7. [1天搞懂深度学习] 读书笔记 lecture I:Introduction of deep learning

    - 通常机器学习,目的是,找到一个函数,针对任何输入:语音,图片,文字,都能够自动输出正确的结果. - 而我们可以弄一个函数集合,这个集合针对同一个猫的图片的输入,可能有多种输出,比如猫,狗,猴子等, ...

  8. 一文搞懂深度学习正则化的L2范数

    想要彻底弄明白L2范数,必须要有一定的矩阵论知识,L2范数涉及了很多的矩阵变换.在我们进行数学公式的推到之前,我们先对L2范数有一个感性的认识. L2范数是什么? L2范数的定义其实是一个数学概念,其 ...

  9. 搞懂深度网络初始化(Xavier and Kaiming initialization)

    参数初始化就是这么一个容易被忽视的重要因素,因为不仅使用者对其重要性缺乏概念,而且这些操作都被TF.pytorch这些框架封装了,你可能不知道的是,糟糕的参数初始化是会阻碍复杂非线性系统的训练的. 本 ...

  10. 深度强化学习(资源篇)(更新于2020.11.22)

    理论 1种策略就能控制多类模型,华人大二学生提出RL泛化方法,LeCun认可转发 | ICML 2020 AlphaGo原来是这样运行的,一文详解多智能体强化学习的基础和应用 [DeepMind总结] ...

最新文章

  1. jenkins搭建cc++自动化构建
  2. 关于datagridview自动增加行高度和显示全部内容的设置
  3. ROS系统 用Python或C++实现发布者Publisher
  4. CNI:容器网络接口详解
  5. 公共语言运行库(CLR)和中间语言(IL)(一)
  6. 网络商务信息与计算机的关系,计算机与电子商务的关系,
  7. mysql 命令备忘
  8. 机器学习用于数字图像处理_用于创建数字内容的免费电子学习工具
  9. 官宣了!百度36亿美元收购YY直播,一个用户“值”87.4美元
  10. matlab2014 下的 libsvm 安装
  11. git untracked working tree files would be overwritten by merge
  12. Windows窗口程序设计入门(C#版)
  13. Android开机动画总结
  14. Visual Studio安装.nupkg文件
  15. win10 java8安装包双击之后完全没反应
  16. 应急响应入侵排查之第二篇Linux
  17. win10安装影子系统导致的蓝屏,终止代码:BAD_SYSTEM_CONFIG
  18. linux num_fds文件描述符数量限制 too many openfiles 错误
  19. JavaScript修改表格行的背景色,鼠标所在行颜色高亮
  20. 区块链金融中的python应用--LSM定价

热门文章

  1. 【认知无线网络】认知无线网络基础知识学习
  2. 计算机专业学生学校活动,校园IT文化节活动策划方案
  3. QT中widget相关控件
  4. java xssf 字体样式_Apache POI字体/Fonts
  5. HeadFirst 设计模式
  6. Head First设计模式(中文版)PDF
  7. coreseek(中文全文搜索)安装和使用(一)
  8. 手机无线上网何时进入战国时代?
  9. VS2012注册密钥
  10. chrome disable-web-security 关闭安全策略 解决跨域