现有一个使用Relu激活函数的网络,训练过程中发现,它对所有的输入样本都输出一样的预测概率,比如二分类,对所有样本的预测概率都是[0.4,0.6]。由于预测概率都一样,因此预测标签也都一样,全预测为0或1。

一开始以为是不是网络结构搭建有问题,因为当网络参数确定后,不同的输入样本的输入数据不一样,那么输出的预测概率肯定不一样,怎么会全输出一样的概率。然后一层一层找原因,发现某一卷积层的输出值全为0。经过分析,该层使用的是Relu激活函数,而且该层训练后的权值W和偏置b都是负数,这样,输入在这一层的卷积运算结果全为负值,再经过Relu激活函数后,这一层的输出值就全为0。因此,不管输入样本是什么,经过该层后的输出都为0,从而导致网络最终输出的预测概率和输入样本完全没有关系,此时输出概率取决于这一层后面层的偏置参数b。

解决方法:

换一种网络参数的初始化方法,或者改变初始化方法中的参数(比如使用正态初始化的话可以尝试改变方差)

网络参数的初始化方法:

https://blog.csdn.net/weixin_38314865/article/details/106049511

Relu神经网络输出预测全为0或1,对所有输入样本的预测概率也相同相关推荐

  1. 神经网络与深度学习——TensorFlow2.0实战(笔记)(三)(python输入和输出)

    从程序中学习知识点 1. #输出函数可以输出字符串常量 print("hello") #输出数学表达式 print(1+2) #输出变量 print(num) 2. #string ...

  2. 一文搞定深度学习建模预测全流程(Python)

    作者 | 泳鱼 来源 | 算法进阶 本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Pyt ...

  3. 深度学习建模预测全流程(Python)!

    本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Python库有:keras.scikit ...

  4. 一文深度学习建模预测全流程(Python)

    本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Python库有:keras.scikit ...

  5. 深度学习——神经网络之DNN全连接神经网络、BP算法原理

    深度学习--神经网络之DNN全连接神经网络.BP算法原理 深度学习--神经网络之DNN全连接神经网络.BP算法原理 1.啥是人工神经网络 2.神经网络的应用 3.神经网络的组成 3.1.神经元 3.2 ...

  6. DL之DNN:自定义2层神经网络TwoLayerNet模型(封装为层级结构)利用MNIST数据集进行训练、预测

    DL之DNN:自定义2层神经网络TwoLayerNet模型(封装为层级结构)利用MNIST数据集进行训练.预测 导读           计算图在神经网络算法中的作用.计算图的节点是由局部计算构成的. ...

  7. 【Pytorch神经网络实战案例】11 循环神经网络结构训练语言模型并进行简单预测

    1 语言模型步骤 简单概述:根据输入内容,继续输出后面的句子. 1.1 根据需求拆分任务 (1)先对模型输入一段文字,令模型输出之后的一个文字. (2)将模型预测出来的文字当成输入,再放到模型里,使模 ...

  8. python神经网络案例——FC全连接神经网络实现mnist手写体识别

    全栈工程师开发手册 (作者:栾鹏) python教程全解 FC全连接神经网络的理论教程参考 http://blog.csdn.net/luanpeng825485697/article/details ...

  9. [转载] python bp神经网络 mnist_Python利用全连接神经网络求解MNIST问题详解

    参考链接: Python中的单个神经元神经网络 本文实例讲述了Python利用全连接神经网络求解MNIST问题.分享给大家供大家参考,具体如下: 1.单隐藏层神经网络 人类的神经元在树突接受刺激信息后 ...

最新文章

  1. ECCV 2018|商汤37篇论文入选,为你解读精选论文(附链接+开源资源)
  2. C语言和JAVA可以互相转换吗,求助大神!!!JAVA转换成C语言
  3. PHP关于VC11,VC9,VC6以及Thread Safe和Non Thread Safe版本选择
  4. 独立版Jexus配置SSL,支持https访问
  5. 大数据学习(2)-Hadoop的介绍与安装
  6. nodjes 支付宝接口 - 优惠卷
  7. Eclipse关联JavaDoc
  8. LeetCode 33. Search in Rotated Sorted Array
  9. 100道精选面试题,教你怎样轻松晋级!
  10. asp.net门诊收费管理系统
  11. w ndows无法完成格式化,win10系统windows无法完成格式化的处理方法
  12. Mysql中有关Datetime和Timestamp的使用总结
  13. Ubuntu16.04安装NVIDIA独立显卡驱动并分屏
  14. 计算机 审计追踪功能,第 讲 审计追踪技术与Windows安全审计功能
  15. z77主板升级nvme,迁移系统,蓝屏解决方法
  16. linux pppd ip up 脚本,Linux下pppd拨号脚本配置(转载)
  17. 安装rpm包时提示错误:依赖检测失败
  18. 互联网移动支付存在的安全风险和对策
  19. 笔记本+显示器组建扩展屏幕分辨率问题
  20. 数据结构与算法——栈和队列定义和特点

热门文章

  1. 可以闭眼入的O'REILLY机器学习神书出新版了!
  2. 还在随缘炼丹?一文带你详尽了解机器学习模型可解释性的奥秘
  3. java程序员学习路线以及我的学习经验
  4. 如何才能真正的提高自己,真正成为一名出色的架构师?
  5. Android官方开发文档Training系列课程中文版:创建自定义View之View的创建
  6. 基于在线百科知识库的多义词词义消歧项目
  7. 【转】常用数学函数篇(Linux c)
  8. PHP中 .= 的意思
  9. 10个绕过反病毒的恶意用户技巧
  10. H5常用拖放事件解析