1.训练样本

数据增强

  • 方法:通过对样本图像平移、旋转或镜像翻转,增加样本数量;
  • 优点:使有限的数据得到最大程度的有效利用。

使用大规模数据集

  • ImageNet:基于WorldNet,按层级图像分类,动物植物食物等,末梢节点包含多张对应图像;
  • Place:在SVNDatabase基础上的扩展,包括多种场景,室内、室外、交通工具、建筑物等。

其它

  • 设置图像中间区域为感兴趣区域,可以防止变换后的样本偏离图像区域;
  • 对样本会产生形状变化的情况,如手写字符识别,先变形再数据增强,可以使用弹性变换算法,包括双线性插值或双三次插值等插值法。

2.预处理

原因:当样本类别内差异较大时,为了减少样本差异,会进行预处理。

方法:均值减法、归一化、白化。

均值减法

  • 大规模的物体识别预处理的方式;
  • eg:图像识别中,训练样本-均值图像=输入数据(差分图像),经过处理后,数据平均值会变为0,图像整体亮度变化可以得到抑制。

归一化

  • 为样本的均值和方差添加约束的一种预处理方法。
  • 首先计算各数据标准差,然后对样本图像进行均值减法,再除以标准差
  • 可以得到均值为0,方差为1的标准化数据,可以得到高度差异更小的图像样本。

白化

  • 消除数据间的相关性,增强图像边缘。
  • 首先使用均值减法使数据均值为0,得到;然后进行白化处理,,PD分别为奇异值分解后的正交矩阵和对角矩阵;
  • 该方法可以消除相关性较高的信息,保留边缘等相关性较低的信息,可以提高图像的识别性能。

3.激活函数

maxout:从k个单元输出值中取最大值作为单元的最终输出。

  • 卷积层使用:在多个特征图的相同位置选取最大值,用来减少特征图的个数;
  • 池化层使用:最大池化,用来缩小特征图。

ReLU函数的衍生函数

  • 其中,R ReLU性能最优,但是差异不大。

4.DropOut

原理:在网络训练的过程中,按照一定的概率将一部分中间层单元暂时从网络中丢弃,把该单元的输出设置为0,使其不工作来避免过拟合。

  • 丢弃概率通常是50%,可以在不同层设置不同的DropOut概率。

注意:

  • 对被舍弃的单元进行误差反向传播计算时,使用被丢弃之前的原始输出值;
  • 用训练好的网络进行识别时,经过进行过DropOut处理的层时,输出值要在原始输出的基础上乘以训练时DropOut的概率。

5.DropConnect

原理:将一部分连接权重设置为0,达到舍弃一部分单元,防止过拟合的目的。

与DropOut比较:

  • 性能更好,被丢弃的单元数更多;
  • 训练难度更高,需要随机选择设置为0的连接权重,对随机数依赖性比较高。

深度学习笔记整理(五)——提高泛化能力的方法相关推荐

  1. 神经网络与深度学习笔记汇总五

    神经网络与深度学习笔记汇总五 往期回顾 将之前掘金写的学习笔记所遇困难搬到这里,方便查看复习 遇到问题: 报错 (未解决) 学习内容: 1.报错operand should contain 1 col ...

  2. 正则化方法/防止过拟合提高泛化能力的方法:L1和L2 regularization、数据集扩增、dropout

    转载自:http://blog.csdn.net/u012162613/article/details/44261657 本文是<Neural networks and deep learnin ...

  3. 图解深度学习-提高泛化能力的方法

    数据集 在深度学习的训练过程中,神经网络的类型和结构固然重要,但训练样本才是重中之重. 数据增强 当训练样本数量较少时,可以通过数据增强来增加样本的多样性. 数据增强就是通过对样本图像进行平移.旋转. ...

  4. 深度学习笔记 第五门课 序列模型 第二周 自然语言处理与词嵌入

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  5. 深度学习笔记 第五门课 序列模型 第三周 序列模型和注意力机制

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  6. 神经网络与深度学习笔记 (五)深层神经网络

    摘要:本文知识点主要有简单介绍深层神经网络.深层神经网络的传播过程.保证矩阵维数的正确性.深度神经网络强大的原因.神经网络正向传播和反向传播的流程图.参数和超参数和神经网络与人脑机制的关系. 1.深层 ...

  7. 深度学习笔记(五) 代价函数的梯度求解过程和方法

    作为自己的笔记系列,方便自己查阅和理解. 1)什么是梯度 梯度 本意是一个向量(矢量) 当某一函数在某点处沿着该方向的方向导数取得该点处的最大值,即函数在该点处沿方向变化最快,变化率最大(为该梯度的模 ...

  8. 深度学习笔记 第五门课 序列模型 第一周 循环序列模型

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  9. 深度学习笔记(五):深度学习卷积核的计算理解,小卷积核和大卷积核的转换比较

    文章目录 一.卷积核(convolutional kernel): 1.1 介绍 1.2 设计中的问题 二.池化(pooling): 没有完全整理的blog 整理完的blog 一.卷积核(convol ...

  10. 深度学习笔记整理2 - 感知器算法

    深度学习 基本概念 深度学习是机器学习算法中的一类,其源于人工神经网络的研究. 深度学习广泛应用在计算机视觉,音频处理,自然语言处理等诸多领域. 深度可以理解为数据计算转换的层数. 机器学习& ...

最新文章

  1. opencv Mat类
  2. 推荐两个Firefox插件
  3. OO真经——关于面向对象的哲学体系及科学体系的探讨(下)
  4. linux 将远程mysql复制,在线备份MySQL及远程copy到远程备份服务器shell脚本
  5. 作业2 分支循环结构
  6. 【SpringClould】Spring Cloud Eureka源码分析
  7. mysql中的表显示“使用中”解决办法!
  8. Linux下svn的部署
  9. js和jquery给iframe src赋值的3种方法
  10. 最近amd.dll闹的很火
  11. 微信安装包 11 年膨胀 575 倍?QQ安装包800M?谁在抢你的手机内存?
  12. C#求学之路MVC《医院管理系统》项目研发文献
  13. VUE读取Vcard文件,并获取/筛选想要的内容
  14. 【经验分享】如何使用校园账号登录WOS(Web of Science)
  15. 滤波笔记三:无迹卡尔曼滤波(UKF)
  16. python爬今日头条
  17. html中的innerHTML的用法
  18. Vue Video.js播放m3u8视频流格式(video+videojs-contrib-hl)
  19. chrome vue 未响应_vue兼容低版本chrome
  20. 【1】2018校招真题——舞会

热门文章

  1. MDK中符号代号说明
  2. 大数据是什么?大数据可以做什么?大数据实际做了什么?大数据要怎么做?
  3. 嵌入式系统的知识体系
  4. 龙梦迷你电脑福珑2.0通过手机USB共享网络联网
  5. 设备树学习(四、内核head.S对uboot传参的处理)
  6. 在Windows服务器上搭建Nuget私人服务器(超~详细)
  7. 包装印刷行业裕同集团易普优APS项目顺利验收!
  8. 使用99编程 —— EDA拼接屏大规模图像处理
  9. qq象棋棋谱格式详解及其解析
  10. 【English】The feelings about Good luck charlie