左图为我们对于低维空间的想象,似乎局部最优广泛存在。梯度下降法或者某个算法可能困在一个局部最优中,而不会抵达全局最优。
但这些理解并不正确
事实上如果我们要创建一个神经网络,通常梯度为0的点并不是左图中的局部最优点。实际上成本函数的零梯度点通常是鞍点
因为一个具有高维空间的函数,如果梯度为0,那么在每个方向,它可能是凸函数也可能是凹函数。如果在20000维空间中想要得到局部最优,发生概率为2-20000,是一个非常非常小的值。明显遇到鞍点的概率要大得多。

我们对于低维空间的大部分直觉,并不能应用到高维空间中

第一:我们不太可能困在局部最优值中。
第二:平稳段会减慢学习速度(平缓段导数长时间趋于0)。

吴恩达神经网络和深度学习-学习笔记-15-局部最优相关推荐

  1. 吴恩达神经网络与深度学习——深度神经网络

    吴恩达神经网络与深度学习--深度神经网络 深度神经网络 符号 前向传播 矩阵维度 m个样本 为什么使用深层表示 搭建深层神经网络块 正向传播和反向传播 前向和反向传播 前向传播 反向传播 参数和超参数 ...

  2. 吴恩达神经网络和深度学习

    [前言] 在学习了深度学习和神经网络之后,为什么我要以博客的形式来做笔记?这CSDN有那么多的优秀文章,我自己写的都比不上 别人的我写的真的有意义吗,为什么我要浪费大量的时间去做这项工作?我相信一句话 ...

  3. 吴恩达神经网络与深度学习——浅层神经网络

    吴恩达神经网络与深度学习--浅层神经网络 神经网络概述 神经网络表示 计算神经网络的输出 m个样本的向量化 for loop 向量化 向量化实现的解释 激活函数 sigmoid tanh函数 ReLu ...

  4. 吴恩达神经网络和深度学习-学习笔记-38-使用开源的方案+迁移学习+数据增强data augmentation

    使用别人的开源成果 想要用现成的网络,最好在网络上找到开源的实现,这要比从头开始实现快得多. 比如:直接在Google上搜索resnets github,找到合适的后点击下载会得到URL,然后在cmd ...

  5. 吴恩达神经网络和深度学习-学习笔记-28-端到端的深度学习(end-to-end deep learning )

    深度学习最令人振奋的最新动态之一,就是端到端深度学习end-to-end deep learning的兴起. 什么是"端到端深度学习" 以前有一些数据处理系统或学习系统,它们需要多 ...

  6. 吴恩达神经网络和深度学习-学习笔记-8-梯度消失与爆炸 + 梯度检测

    梯度消失与爆炸 介绍 直观理解是: 权重W只比1(即单位矩阵)大一点,深度神经网络的激活函数将爆炸式增长. 权重W只比1(即单位矩阵)小一点,深度神经网络的激活函数将指数式递减. 虽然我(吴恩达老师) ...

  7. 吴恩达-神经网络和深度学习课程-学习心得(一)

    前言: 陆陆续续学完了吴恩达老师在网易云课堂上开设的深度学习工程师微专业的部分内容(01.神经网络与深度学习,04.卷积神经网络,02.改善深层神经网络),在进一步应用实践之前,对之前的学习的内容做个 ...

  8. 吴恩达神经网络和深度学习-学习笔记-39-计算机视觉现状

    Data vs hand-engineering 你可以把大部分的机器学习问题看成是在你的数据相对较少的地方,应用到你拥有大量数据的地方. 我们今天有相当数量的语音识别数据,至少相对于这个问题的复杂性 ...

  9. 吴恩达神经网络和深度学习-学习笔记-22-误差分析

    单一误差分析 假设我们面对一个猫分类器的准确率不够的原因. 队友看了一下算法分类出错的例子,注意到算法将一些够狗分类为猫. 在这种条件下,我们应不应该做一个项目专门处理狗?比如搜集更多的狗的图片,或者 ...

  10. 吴恩达神经网络和深度学习-学习笔记-21-何时该改变开发集+测试集或指标

    需要我们改变开发集+测试集或指标的情况,是现有的指标或开发测试集并不能帮助我们选择出最好的模型! 如果你的评估指标,无法正确评估好算法的排名,那么就需要花时间定义一个新的评估指标. (加权来排除某一类 ...

最新文章

  1. 传输文件过程中遇到异常被中断
  2. 临近春招,Kafka是不是忘完了,给你一文概括Kafka
  3. expect一键登录mysql
  4. 选了combobox里的选项后没激发change事件_备胎测试:来测测你被备胎了没?
  5. linux内核--设备驱动程序(学习笔记)
  6. python爬虫——40行代码爬取「笔趣看」全部小说
  7. VB如何只读取字符串中的数字部分??
  8. Qt构建时出现Makefile Error 1的解决办法
  9. 搜索引擎提交软件_SEO程序员一个会关键词优化的半个程序玩家搜索引擎优化
  10. 算法设计与分析-习题-动态规划法求解资源分配问题(动态规划法)
  11. css3中-moz、-ms、-webkit、-o 各是什么意思
  12. IT行业大致工作方向
  13. 解决CentOS下boost安装后不能使用的问题
  14. JAVA实现对阿里云DNS的解析管理
  15. 微信小程序上拉刷新下拉加载
  16. Centos7 网卡配置及静态IP配置
  17. 【iOS】APP的优化---IPA大小的压缩
  18. 一文搞懂本地和远程分支代码回退git reset
  19. reack Hooks
  20. python的str()字符串类型的方法详解

热门文章

  1. 语音识别结合应用场景之后
  2. 硬盘是办公设备还是计算机设备,机械硬盘价格与区别【详细介绍】
  3. c语言实现md5比java难_浅谈md5弱类型比较和强碰撞
  4. -bash: unzip: 未找到命令_29 条运维工程师必会实用 Linux 命令
  5. 移动web-margin塌陷
  6. 【滑动窗口】leetcode1456:定长子串中元音的最大数目
  7. LeetCode 101对称二叉树
  8. 2020年春季计算机网络考试,国家开放大学2020年春季学期电大考试《计算机网络》精选考试题及答案...
  9. mysql 官方docker_用docker安装官方mysql
  10. SQL server 列值转列行