tensorflow训练神经网络时loss出现nan的问题
tensorflow训练神经网络时loss出现nan的问题
一般情况下原因是由于优化器上的学习比率learning_rate定义值太大,如:
train_step = tf.compat.v1.train.GradientDescentOptimizer(0.1).minimize(loss)
运行打印loss:
for i in range(100):sess.run(train_step,feed_dict={xs:x_data,ys:y_data})#这里我们用全部数据来进行train,其实有个forcast GDO只用一部分数据进行训练,能使训练效率更高if i % 50:print('实际偏差率:',sess.run(loss,feed_dict={xs:x_data,ys:y_data})[0])
其结果为:
实际偏差率: 9477596000000000.0
实际偏差率: inf
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
......
实际偏差率: nan
将其中learning_rate的值改为0.01或者更小:
train_step = tf.compat.v1.train.GradientDescentOptimizer(0.01).minimize(loss)
结果为:
实际偏差率: 5.9452715
实际偏差率: 5.5919566
实际偏差率: 5.1778126
实际偏差率: 0.023199111
实际偏差率: 0.26209167
实际偏差率: 0.41470975
实际偏差率: 0.47333607
实际偏差率: 0.48828265
实际偏差率: 0.48628327
实际偏差率: 0.47839066
实际偏差率: 0.46885166
实际偏差率: 0.4591693
.......
实际偏差率: 0.014343787
tensorflow训练神经网络时loss出现nan的问题相关推荐
- 使用caffe训练时Loss变为nan的原因
极视角高校计算机视觉算法邀请赛目前正在报名中,欢迎各高校在读学生报名参加,大奖+商业项目参与机会+数据库等你来拿!!!咨询报名请加小助手(微信号:Extreme-Vision) 本文为极市平台原创编译 ...
- 使用TensorFlow训练神经网络进行价格预测
Using Deep Neural Networks for regression problems might seem like overkill (and quite often is), bu ...
- Tensorflow训练神经网络
Tensorflow实战google深度学习框架中章节 import os os.getcwd() #查看当前路径 'E:\\深度学习\\mnist' os.chdir('E:\深度学习\mnist' ...
- pytorch训练过程中loss出现NaN的原因及可采取的方法
在pytorch训练过程中出现loss=nan的情况 1.学习率太高. 2.loss函数 3.对于回归问题,可能出现了除0 的计算,加一个很小的余项可能可以解决 4.数据本身,是否存在Nan,可以用n ...
- 吴裕雄 python 神经网络——TensorFlow训练神经网络:不使用隐藏层
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_dataINPUT_NODE = 784 # ...
- 训练神经网络时如何确定batch的大小?
当我们要训练一个已经写好的神经网络时,我们就要直面诸多的超参数啦.这些超参数一旦选不好,那么很有可能让神经网络跑的还不如感知机.因此在面对神经网络这种容量很大的model前,是很有必要深刻的理解一下各 ...
- 训练神经网络时如何确定batch size?
前言 当我们要训练一个已经写好的神经网络时,我们就要直面诸多的超参数了.这些超参数一旦选不好,那么很有可能让神经网络跑的还不如感知机.因此在面对神经网络这种容量很大的model前,是很有必要深刻的理解 ...
- Tensorflow训练神经网络保存*.pb模型及载入*.pb模型
1 神经网络结构 1.0 保存*.pb模型 import tensorflow as tf from tensorflow.python.framework import graph_util fro ...
- 搭建卷积神经网络时loss计算方式的选择
最近在利用卷积神经网络跑模型的时候,总会出现一些奇奇怪怪的问题,而其中出现次数最多的就是loss值计算方式选择错误问题.在tensorflow中封装的loss值的计算方式有三种:BinaryCross ...
最新文章
- 用字节流查看txt文件
- [vue]data数据属性及ref获取dom
- SAP License:SAP低值易耗品管理
- 在线文本字符串批量替换工具
- 发布HTML5 2D游戏引擎YEngine2D
- 数学建模各种软件对比(MATLAB/Lingo/SAS/SPSS)
- 丁小平:人类究竟需要什么样的微积分原理
- lol全队消息怎么发_英雄联盟如何发全部消息,LOL怎样发送消息给全部
- python的jira库操作
- PWM常见输出方法及避坑指南
- Python 为何能坐稳 AI 时代头牌语言
- 螺旋传动设计系统lisp_螺旋传动设计计算.pdf
- android判断webview加载完成,android webView判断是否加载完成的2种办法
- 2、Docker的安装、设置国内镜像源
- 欧盟包装指令94/62/EC详解
- go walk 开发window界面,上传文件到阿里云oss -- 服务器端
- 37预备2—leetcode198打家劫舍
- 男扮女装参加超级女声的经历<转>
- 解决VMware Workstation的虚拟化与win10 自带的Hyper-V服务冲突的问题
- Android逆向--APP通信解密技巧
热门文章
- 进程的静止和活动状态
- wps html编辑表格,WPS 2017个人版演示word使用技巧(wps2017表格使用技巧)
- Systemd 入门教程之命令篇
- java创建对象new后面为啥可以传入参数_你有认真了解过自己的“Java对象”吗?渣男...
- element table 怎么知道点击的是第几行_el-data-table, 让CRUD更简单??
- tkinter中鼠标与键盘事件
- 【深度学习】Tensorflow完成线性回归对比机器学习LinearRegression()
- global全局变量
- Python元类(type()和metaclass)
- java 路径获取文件名称_java 根据文件获取文件名及路径的方法