前几天yy 用resnet_152 fintuing 他的网络出现的问题:

fine-tuning resnet-152 遇到问题:在设置BN层参数use_global_stats的时候,训练时应该为false(滑动均值与方差),测试时应该为true(全局均值与方差)。
现在我的问题是train的时候设为false,test设为true,测试的误差跟训练误差不在一个数量级上(很大),

若测试的时候设为false,则测试误差较小(其实也很大,但至少跟训练误差在一个数量级上)

更详细的信息:

trian  的时候收敛的很好train的loss降到0.1 如果测试的时候use_global_stats =true 那么test 的loss 位6.9

trian  的时候收敛的很好train的loss降到0.1 如果测试的时候use_global_stats =false 那么test 的loss 为0.5

群里大牛给的答案:

batchsize 太小了。

由原来的batchsize 为35 ---〉140  果断就没有这个问题了

关于bn层的进一步认识相关推荐

  1. 狠补基础-数学+算法角度讲解卷积层,激活函数,池化层,Dropout层,BN层,全链接层

    狠补基础-数学+算法角度讲解卷积层,激活函数,池化层,Dropout层,BN层,全链接层 在这篇文章中您将会从数学和算法两个角度去重新温习一下卷积层,激活函数,池化层,Dropout层,BN层,全链接 ...

  2. 网络骨架:Backbone(神经网络基本组成——BN层、全连接层)

    BN层 为了追求更高的性能,卷积网络被设计得越来越深,然而网络却变得难以训练收敛与调参.原因在于,浅层参数的微弱变化经过多层线性变化与激活函数后会被放大,改变了每一层的输入分布,造成深层的网络需要不断 ...

  3. tensorflow中的BN层实现

    import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from tensorflow.keras imp ...

  4. Interview:算法岗位面试—上海某科技公司算法岗位(偏AI算法,国企)技术面试之BN层的认知、BP的推导、GD优化的几种改进等

    Interview:算法岗位面试-上海某科技公司算法岗位(偏AI算法,国企)技术面试之BN层的认知.BP的推导.GD优化的几种改进等 导读:关于神经网络,问的比较深,因为博主做过总结,所以用自己的语言 ...

  5. DL之DNN优化技术:自定义MultiLayerNetExtend算法(BN层使用/不使用+权重初始值不同)对Mnist数据集训练评估学习过程

    DL之DNN优化技术:自定义MultiLayerNetExtend算法(BN层使用/不使用+权重初始值不同)对Mnist数据集训练评估学习过程 目录 输出结果 设计思路 核心代码 更多输出 相关文章: ...

  6. batch_normalization (bn)层以及实际使用中合并bn层

    参考: bn层原理: https://blog.csdn.net/hjimce/article/details/50866313 合并bn层: https://blog.csdn.net/kangdi ...

  7. 合并BN层到卷积层的原理及实验

    1.  为什么要合并BN层 在训练深度网络模型时,BN(Batch Normalization)层能够加速网络收敛,并且能够控制过拟合,一般放在卷积层之后.BN 层将数据归一化后,能够有效解决梯度消失 ...

  8. caffe中的batchNorm层(caffe 中为什么bn层要和scale层一起使用)

    caffe中的batchNorm层 链接: http://blog.csdn.net/wfei101/article/details/78449680 caffe 中为什么bn层要和scale层一起使 ...

  9. Pytorch中BN层入门思想及实现

    批归一化层-BN层(Batch Normalization) 作用及影响: 直接作用:对输入BN层的张量进行数值归一化,使其成为均值为零,方差为一的张量. 带来影响: 1.使得网络更加稳定,结果不容易 ...

最新文章

  1. python零基础难学吗-如何从零开始学习Python,零基础学python难吗
  2. Java-IntelliJ IDEA【@Override is not allowed when implementing interface method 解决方法】
  3. javascript 正则表达式-零宽断言
  4. 真假难辨!全球首位AI合成女主播正式上岗 引发全球媒体圈关注
  5. 2013河北省职称计算机应用能力考试操作题答案,(2013河北省职称计算机应用能力考试操作题步骤详解PPT部分.doc...
  6. springboot2源码3-自动配置
  7. ADC采样间隔问题+TRGO作为ADC的触发源头
  8. Linux运维基础入门(二):网络基础知识梳理02
  9. sql中的一些通用函数
  10. LINUX下载编译gperf
  11. 维纳滤波和卡尔曼滤波
  12. 14种最佳的PHP帮助台脚本和5种免费选项
  13. Verilog编程网站学习——门电路、组合电路、时序电路
  14. MongoDB应用记录
  15. 图片不能置于底层怎么办_excel如何设置图片置于底层
  16. python中全局变量global的使用
  17. 数学基础知识总结 —— 7. 行列式的基本知识
  18. C语言FILE详解(COME ON)
  19. Android 实时录音和回放,边录音边播放 (KTV回音效果)
  20. 视频素材网,视频剪辑必备。

热门文章

  1. python处理多种编码格式的txt文件
  2. 调用多个thrift接口ttypes冲突的问题
  3. 10_隐马尔科夫模型HMM1_统计学习方法
  4. vSphere vsan 6.5部署之一VCSA6.5安装
  5. spring 线程安全
  6. web端权限维持【好文】
  7. 李大维:互联网人做硬件创业容易产生的七大误解【转载】
  8. 第十课 これは古い庭園です。
  9. Adobe Acrobat的安装时出现:服务print spooler启动失败,请确认您有足够权限启动系统服务。解决方法...
  10. 在linux下面实现检测按键(Linux中kbhit()函数的实现)