神经网络不收敛的 11 个原因,加实践感悟

如果有说法不妥的,还望在评论区留言指点,切磋交流,十分感谢!

网上有朋友的博客:https://blog.csdn.net/lc013/article/details/116401778

列举了神经网络不收敛的 11 个原因及其解决办法

如果你的神经网络不收敛,应该怎么办呢?一般来说,神经网络不收敛的原因有以下 11 种原因:

  1. 忘记对你的数据进行归一化
  2. 忘记检查输出结果
  3. 没有对数据进行预处理
  4. 没有使用任何的正则化方法
  5. 使用了一个太大的 batch size
  6. 使用一个错误的学习率
  7. 在最后一层使用错误的激活函数
  8. 网络包含坏的梯度
  9. 网络权重没有正确的初始化
  10. 使用了一个太深的神经网络
  11. 隐藏层神经元数量设置不正确

接下来将一一解释以上11 种原因并给出对应的解决办法;


1. 忘记对你的数据进行归一化

问题描述

在神经网络训练中,如何对你的数据进行归一化是非常重要的。这是一个不能省略的步骤,几乎不可能在不进行归一化的前提下可以训练得到一个很好的网络模型。不过正因为这个步骤非常重要,而且在深度学习社区也很有名,所以很少人会提到它,但是对于初学者则是可能会犯下的一个错误。

原因

我们需要对数据进行归一化操作的原因

神经网络不收敛的 11 个原因,加实践感悟相关推荐

  1. 神经网络不收敛的 11 个原因及其解决办法

    原文:http://theorangeduck.com/page/neural-network-not-working 原文标题:My Neural Network isn't working! Wh ...

  2. 深度学习(18)神经网络与全连接层一: 数据加载

    深度学习(18)神经网络与全连接层一: 数据加载 1. 常用数据集 2. MNIST数据集 (1) MNIST样本 (2) MNIST加载案例 3. CIFAR10/100 (1) CIFAR10/1 ...

  3. triplet loss后面不收敛_你的神经网络真的收敛了么?

    1.为什么小模型的作为backbone效果会差? 在深度学习目标检测(图像分割)领域,我们发现当我们使用层数越深,并且在imagenet上表现越好的分类网络作为backbone时,它的检测和分割效果越 ...

  4. 神经网络不收敛的查缺补漏

    数据归一化 数据归一化包括三个内容:数据缩放的本质.区别,以及选择合适的缩放方法.缩放包括归一化和标准化,两者的本质都是一个线性变换,线性变换有很多良好的性质,这些性质决定了为什么对数据进行改变后竟然 ...

  5. java pkcs#11读取证书加解密(初学-分享)

    java pkcs#11读取证书加解密(初学-分享) http://www.cnblogs.com/sunfb/archive/2013/02/28/2937227.html 插入USB-KEY, 想 ...

  6. JVM(Java SE 11版本)加载类和接口

    本文介绍了Java虚拟机(Java SE 11版本)加载类和接口. 加载类和接口 加载是指查找具有特定名称的类或接口类型的二进制形式的过程.典型的做法是,查找事先由Java编译器从源代码计算而来二进制 ...

  7. 神经网络 测试集loss不下降_代码实践 | 全连接神经网络回归---房价预测

    学习目录 阿力阿哩哩:深度学习 | 学习目录​zhuanlan.zhihu.com 前面我们介绍了: 阿力阿哩哩:深度学习开端|全连接神经网络​zhuanlan.zhihu.com 4.7代码实践 & ...

  8. 梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛?

    文 | Summer Clover@知乎 本文已获作者授权,禁止二次转载 这是Deep Learning Theory里很基本也很核心的一个问题. 在这个问题上,初学者容易被入门教学误导,非此研究方向 ...

  9. 神经网络_训练loss不下降原因集合

    一,train loss与test loss结果分析 train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,test loss趋于不变,说明网 ...

最新文章

  1. 向下滚动页面导航悬浮
  2. 有关Oracle角色管理
  3. Card Game Again CodeForces - 818E (双指针)
  4. Packet Tracer 5.0 建构 CCNA 实验攻略——配置单区域 OSPF
  5. linux下限制ip访问
  6. python怎么清空屏幕_python3.6怎么清屏幕
  7. 实操调试成功 基于NI-VISA的USBTMC接口程控仪器连接
  8. movielens数据集简述
  9. 5.16 BScroll页面切换滑动失效,点击事件冒泡(未绑定click也会监听click),transition-group动画特例,BScroll未激活不允许任何事件调用,类的实例和对象
  10. 群晖nas 文件服务器,群晖nas挂到云服务器上
  11. gulp:提示:Error: watching html/*: watch task has to be a function (optionally generated by using gulp
  12. oh-my-zsh安装教程
  13. Vector space
  14. 【达梦数据库的console工具进行备份恢复遇到报错:bakres连接DMAP失败】
  15. MacbookPro 15硬盘升级踩坑记
  16. 计算机专业十六字口号,励志口号大全16字
  17. window10登录界面进不了,怎么办
  18. linux 安装jeakens_Linux安装mysql过程(转+完善)
  19. Java多线程----java 对象锁
  20. 顺风车发生交通事故 乘客诉嘀嗒出行索赔3.7万元

热门文章

  1. 解决windows图片查看器背景色变成米黄色
  2. Android开发--多媒体应用开发(一)--MediaPlayer的使用介绍
  3. 2021湖南高考艺考成绩查询,2021届湖南艺考生联考成绩查询时间安排
  4. 问题集锦(36-40)
  5. graythresh matlab,Matlab-图形算法和图像处理指南
  6. java getaccessflags_Java Method.getAccessFlags方法代码示例
  7. ib课程计算机科学内容,ib课程体系的六大课程
  8. php文本文件操作,PHP文本操作类
  9. php的v_PHPV是什么意思
  10. 推送通知_手机总是收到烦人的推送,教你几招,彻底摆脱无用通知