介绍

前段时间在做training的时候,发现网络会有的时候不收敛,于是仔细去查看了网络不收敛的原因,在此做个记录。

网络不收敛的原因

一、数据和标签

需要查看数据分类标注是否准确?数据是否干净?数据库太小一般不会带来不收敛的问题,只要你一直在train总会收敛。反而不收敛一般是由于样本的信息量太大导致网络不足以fit住整个样本空间。样本少只可能带来过拟合的问题。

二、学习率设定不合理

在自己训练新网络时,可以从0.1开始尝试,如果loss不下降的意思,那就降低,除以10,用0.01尝试,一般来说0.01会收敛,不行的话就用0.001. 学习率设置过大,很容易震荡。不过刚刚开始不建议把学习率设置过小,尤其是在训练的开始阶段。

在开始阶段我们不能把学习率设置的太低否则loss不会收敛。我的做法是逐渐尝试,从0.1,0.08,0.06,0.05 …逐渐减小直到正常为止

三、网络设定不合理

如果做很复杂的分类任务,却只用了很浅的网络,可能会导致训练难以收敛,换网络即可(我从yolov2换成了yolov3),或者也可以尝试加深当前网络。

深度学习中网络在训练时不收敛的原因相关推荐

  1. HALCON 21.11:深度学习笔记---网络和训练过程(4)

    HALCON 21.11:深度学习笔记---网络和训练过程(4) HALCON 21.11.0.0中,实现了深度学习方法.关于网络和训练过程如下: 在深度学习中,任务是通过网络发送输入图像来执行的.整 ...

  2. 深度学习中的随机数种子

    深度学习中的随机数种子 seed()函数的作用 解释 例子1 例子2 深度学习中的随机数种子 训练过程 测试过程 代码随机种子的设定 本文参考网络上对于seed函数的讲解,记录一下我对于这个函数作用的 ...

  3. 深度学习中,CPU、GPU、NPU、FPGA如何发挥优势?

    随着AI的广泛应用,深度学习已成为当前AI研究和运用的主流方式.面对海量数据的并行运算,AI对于算力的要求不断提升,对硬件的运算速度及功耗提出了更高的要求. 目前,除通用CPU外,作为硬件加速的GPU ...

  4. 万字长文带你看尽深度学习中的各种卷积网络

    来源:AI科技评论 摘要:深度学习中的各种卷积网络大家知多少? 深度学习中的各种卷积网络大家知多少?对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,这篇文章非常值得一读.Kunlun Bai 是 ...

  5. 经验 | 深度学习中从基础综述、论文笔记到工程经验、训练技巧

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:本文授权转自知乎作者跑者小越,https://zhuanla ...

  6. 万字长文带你看尽深度学习中的12种卷积网络

    转自 | AI科技评论 作者 | Kunlun Bai 深度学习中的各种卷积网络大家知多少?对于那些听说过却又对它们没有特别清晰的认识的小伙伴们,Kunlun Bai 这篇文章非常值得一读.Kunlu ...

  7. 深度学习中 Batch Size 对训练过程的影响

    作者 | 陈志远 编辑丨极市平台 之前面试过程中被问到过两个问题: (1)深度学习中batch size的大小对训练过程的影响是什么样的? (2)有些时候不可避免地要用超大batch,比如人脸识别,可 ...

  8. 深度学习——从网络威胁情报中收集TTPs

    从网络威胁情报中收集TTPs 摘要 为啥要用网络威胁情报 被动防御 & 主动防御 网络威胁情报的概念 何为情报(Intelligence)? 何为网络威胁(Cyber Threat)? 何为网 ...

  9. 深度学习深度前馈网络_深度学习前馈网络中的讲义第4部分

    深度学习深度前馈网络 FAU深度学习讲义 (FAU Lecture Notes in Deep Learning) These are the lecture notes for FAU's YouT ...

  10. 深度学习中的生成对抗网络GAN

    转载:一文看尽深度学习中的生成对抗网络 | CVHub带你看一看GANs架构发展的8年 (qq.com) 导读 生成对抗网络 (Generative Adversarial Networks, GAN ...

最新文章

  1. 温故而知新-面向对象的PHP
  2. Systemd 入门及常用命令
  3. 回滚master代码_Git之master主干代码回滚
  4. 深入浅出讲解:php的socket通信
  5. centos非root用户创建用户_CentOS中用户和用户组管理
  6. 卡耐基大学计算机专业分类,卡内基梅隆大学计算机专业
  7. [蓝桥杯][2018年第九届真题]日志统计(树状数组)
  8. ubuntu 查找qt是否安装_Ubuntu Qt 安装教程--快速下载连接(网盘)
  9. pdf转word python_Python实现PDF转Word
  10. 2021-11-24 摘抄:软件产品的一些功能和性能指标
  11. 第二周Python笔记 数据类型 字典
  12. 从零基础入门Tensorflow2.0 ----七、35. 文本生成之---1.数据处理
  13. 一键搞定JavaEE应用,JRE+Tomcat+Mysql-JaveEE绿色运行环境JTM0.9版 (转载)
  14. C语言 简单的在线电子词典
  15. matlab半波整流怎么做,基于Matlab的单相半波可控整流电路的设计与仿真.doc
  16. mosefet驱动电路设计详解
  17. vim-plug插件安装
  18. TokenGazer:DeFi领域发展良好,量化模型显示MKR处于市值偏低区间
  19. 《Domain Separation Networks》文献翻译
  20. 谁发明了计算机人工智能,麻省理工学院发明了人工智能芯片

热门文章

  1. NFinal ajax
  2. 页面制作(PS/HTML/CSS)易错点总结
  3. INNO SETUP卸载程序中加入自定义窗体
  4. 转载:eclipse 搭建SSH项目(第二篇,有具体的项目例子)
  5. Linux下DNS服务器的基本搭建
  6. Java NIO - Buffer 基础 -1
  7. 新手干货:Vue - 事件修饰符
  8. js实现类似微博根据发布时间,给信息加上“刚刚”“一分钟前”“一小时前”
  9. akamai 指纹 和 akamai BMP 移动端sensor 风控分析
  10. 07. 千万不要重载、||和, 操作符