上一篇,我们一步步搭建了一个深层的神经网络,来实现图片的分类。结果显示,随着网络层数加深,隐藏层数增加,网络性能会有所提升。但是,单纯地通过增加网络层数也不一定能取得很好的效果,且模型容易发生过拟合。本文将主要来谈谈神经网络中的过拟合问题以及如何避免过拟合。

什么是过拟合

任何机器学习模型,包括神经网络都可能存在过拟合(Overfit)问题。下面用一张图来说明:

上图中,分别用三个模型来拟合实际的样本点(红色 x 表示样本)。第一个模型是一条直线,模型简单,但是预测值与样本 Label 差别较大,这种情况称之为欠拟合(Underfit)。第三个模型是一个高阶多项式,模型过于复杂,虽然预测值与样本 Label 完全吻合,但是该模型在训练样本之外的数据上拟合效果可能很差,该模型可能把噪声也学习了。这种情况称之为过拟合(Overfit),即模型过于拟合训练样本的数据而泛化能力很差。第二个模型是二次曲线,模型复杂度中等,既能对训练样本有较好的拟合效果,也能保证有不错的泛化能力。这是我们构建神经网络模型希望得到的模型。

欠拟合和过拟合分别对应着高偏差(High Bias)和高方差(High Variance)。偏差度量了学习算法的期望预测与真实结果的偏离程度,刻画描述了算法本身对数据的拟合能力,也就是训练数据的样本与训练出来的模型的匹配程度;方差度量了训练集的变化导致学习性

第10课:优化神经网络——如何防止过拟合相关推荐

  1. 0.0 目录-深度学习第一课《神经网络与深度学习》-Stanford吴恩达教授

    文章目录 第五课 第四课 第三课 第二课 第一课 第五课 <序列模型> 笔记列表 Week 1 循环序列模型 Week 1 传送门 -> 1.1 为什么选择序列模型 1.2 数学符号 ...

  2. 深度学习笔记 第四门课 卷积神经网络 第四周 特殊应用:人脸识别和神经风格转换...

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  3. 吴恩达深度学习deeplearning.ai——第一门课:神经网络与深度学习——第三节:浅层神经网络

    3.1 神经网络概述(Neural Network Overview) 本章你将学习如何实现一个神经网络.在我们深入学习具体技术之前,我希望快速的带你预览一下本章你将会学到的东西.如果这个视频中的某些 ...

  4. 吴恩达deeplearning.ai系列课程笔记+编程作业(11)第四课 卷积神经网络-第二周 深度卷积网络:实例探究(Deep convolutional models: case studies)

    第四门课 卷积神经网络(Convolutional Neural Networks) 第二周 深度卷积网络:实例探究(Deep convolutional models: case studies) ...

  5. 第四门课 卷积神经网络(Convolutional Neural Networks)

    第四门课 卷积神经网络(Convolutional Neural Networks) 第一周 卷积神经网络(Foundations of Convolutional Neural Networks) ...

  6. ​深度学习笔记 第四门课 卷积神经网络 第一周 卷积神经网络基础

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  7. 第05课:神经网络基础知识

    在第01课深度学习概述中,我们介绍了神经网络的基本结构,介绍了神经网络的基本单元组成是神经元.如何构建神经网络,如何训练.优化神经网络,这其中包含了许多数学原理,需要具备一些基本知识.本课,我将重点罗 ...

  8. 贝叶斯优化神经网络参数_贝叶斯超参数优化:神经网络,TensorFlow,相预测示例

    贝叶斯优化神经网络参数 The purpose of this work is to optimize the neural network model hyper-parameters to est ...

  9. 深度学习笔记(10) 优化算法(二)

    深度学习笔记(10) 优化算法(二) 1. Adam 优化算法 2. 学习率衰减 3. 局部最优的问题 1. Adam 优化算法 Adam代表的是 Adaptive Moment Estimation ...

最新文章

  1. 二叉树实现java,二叉树实现java
  2. 【详解!思路清晰】1095 解码PAT准考证 (25分)
  3. 线上服务器登记的要点
  4. Android之layout属性介绍
  5. 添加删除 板块 struts2
  6. 2016全国计算机二级题,2016全国计算机二级考生试题及答案
  7. 01_配置管理和SaltStack概述
  8. ThreadLocal学习
  9. 远场(far-field)语音识别的主流技术有哪些?
  10. ★★★★★手把手教你如何利用凤凰实现破 解后台权限以及升级固件(刷机)★★★★★
  11. JS利用canvas画布功能画时钟
  12. 网站建设中做到需求分析细致,网站优化也就顺理成章了
  13. 明天全国哀悼日,小程序只需三行代码秒变黑白
  14. 解决gcc -m32报错fatal error: sys/cdefs.h: No such file or directory
  15. ubuntu18.04根目录已满造成开机失败报错Fail to start....
  16. Qt5:报错error: ‘tr‘ was not declared in this scop
  17. SPDY:一种更快速web的实验协议(转)
  18. nginx02-RTFM
  19. 《互联网金融投资理财一册通》一一1.1 互联网金融
  20. ipc原理linux,Docker 的底层原理,了解它只需要 5分钟!

热门文章

  1. 理解oracle的共享连接和专用连接
  2. 智慧办公的AI博弈——看飞企互联如何接招!
  3. linux内核同步之信号量、顺序锁、RCU、完成量、关闭中断【转】
  4. js计算两个日期的时间差
  5. 博客统计:腾讯分析这些数据哪儿来的?
  6. 内存泄漏检测工具(转载)
  7. hdu 1534(差分约束)
  8. NYOJ 608 畅通工程
  9. NYOJ 119 士兵杀敌(三)
  10. NYOJ 904 search 二分查找