tensorflow训练神经网络时loss出现nan的问题

一般情况下原因是由于优化器上的学习比率learning_rate定义值太大,如:

train_step = tf.compat.v1.train.GradientDescentOptimizer(0.1).minimize(loss)

运行打印loss:

for i in range(100):sess.run(train_step,feed_dict={xs:x_data,ys:y_data})#这里我们用全部数据来进行train,其实有个forcast GDO只用一部分数据进行训练,能使训练效率更高if i % 50:print('实际偏差率:',sess.run(loss,feed_dict={xs:x_data,ys:y_data})[0])

其结果为:

实际偏差率: 9477596000000000.0
实际偏差率: inf
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
实际偏差率: nan
......
实际偏差率: nan

将其中learning_rate的值改为0.01或者更小:

train_step = tf.compat.v1.train.GradientDescentOptimizer(0.01).minimize(loss)

结果为:

实际偏差率: 5.9452715
实际偏差率: 5.5919566
实际偏差率: 5.1778126
实际偏差率: 0.023199111
实际偏差率: 0.26209167
实际偏差率: 0.41470975
实际偏差率: 0.47333607
实际偏差率: 0.48828265
实际偏差率: 0.48628327
实际偏差率: 0.47839066
实际偏差率: 0.46885166
实际偏差率: 0.4591693
.......
实际偏差率: 0.014343787

tensorflow训练神经网络时loss出现nan的问题相关推荐

  1. 使用caffe训练时Loss变为nan的原因

    极视角高校计算机视觉算法邀请赛目前正在报名中,欢迎各高校在读学生报名参加,大奖+商业项目参与机会+数据库等你来拿!!!咨询报名请加小助手(微信号:Extreme-Vision) 本文为极市平台原创编译 ...

  2. 使用TensorFlow训练神经网络进行价格预测

    Using Deep Neural Networks for regression problems might seem like overkill (and quite often is), bu ...

  3. Tensorflow训练神经网络

    Tensorflow实战google深度学习框架中章节 import os os.getcwd() #查看当前路径 'E:\\深度学习\\mnist' os.chdir('E:\深度学习\mnist' ...

  4. pytorch训练过程中loss出现NaN的原因及可采取的方法

    在pytorch训练过程中出现loss=nan的情况 1.学习率太高. 2.loss函数 3.对于回归问题,可能出现了除0 的计算,加一个很小的余项可能可以解决 4.数据本身,是否存在Nan,可以用n ...

  5. 吴裕雄 python 神经网络——TensorFlow训练神经网络:不使用隐藏层

    import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_dataINPUT_NODE = 784 # ...

  6. 训练神经网络时如何确定batch的大小?

    当我们要训练一个已经写好的神经网络时,我们就要直面诸多的超参数啦.这些超参数一旦选不好,那么很有可能让神经网络跑的还不如感知机.因此在面对神经网络这种容量很大的model前,是很有必要深刻的理解一下各 ...

  7. 训练神经网络时如何确定batch size?

    前言 当我们要训练一个已经写好的神经网络时,我们就要直面诸多的超参数了.这些超参数一旦选不好,那么很有可能让神经网络跑的还不如感知机.因此在面对神经网络这种容量很大的model前,是很有必要深刻的理解 ...

  8. Tensorflow训练神经网络保存*.pb模型及载入*.pb模型

    1 神经网络结构 1.0 保存*.pb模型 import tensorflow as tf from tensorflow.python.framework import graph_util fro ...

  9. 搭建卷积神经网络时loss计算方式的选择

    最近在利用卷积神经网络跑模型的时候,总会出现一些奇奇怪怪的问题,而其中出现次数最多的就是loss值计算方式选择错误问题.在tensorflow中封装的loss值的计算方式有三种:BinaryCross ...

最新文章

  1. 用字节流查看txt文件
  2. [vue]data数据属性及ref获取dom
  3. SAP License:SAP低值易耗品管理
  4. 在线文本字符串批量替换工具
  5. 发布HTML5 2D游戏引擎YEngine2D
  6. 数学建模各种软件对比(MATLAB/Lingo/SAS/SPSS)
  7. 丁小平:人类究竟需要什么样的微积分原理
  8. lol全队消息怎么发_英雄联盟如何发全部消息,LOL怎样发送消息给全部
  9. python的jira库操作
  10. PWM常见输出方法及避坑指南
  11. Python 为何能坐稳 AI 时代头牌语言
  12. 螺旋传动设计系统lisp_螺旋传动设计计算.pdf
  13. android判断webview加载完成,android webView判断是否加载完成的2种办法
  14. 2、Docker的安装、设置国内镜像源
  15. 欧盟包装指令94/62/EC详解
  16. go walk 开发window界面,上传文件到阿里云oss -- 服务器端
  17. 37预备2—leetcode198打家劫舍
  18. 男扮女装参加超级女声的经历<转>
  19. 解决VMware Workstation的虚拟化与win10 自带的Hyper-V服务冲突的问题
  20. Android逆向--APP通信解密技巧

热门文章

  1. 进程的静止和活动状态
  2. wps html编辑表格,WPS 2017个人版演示word使用技巧(wps2017表格使用技巧)
  3. Systemd 入门教程之命令篇
  4. java创建对象new后面为啥可以传入参数_你有认真了解过自己的“Java对象”吗?渣男...
  5. element table 怎么知道点击的是第几行_el-data-table, 让CRUD更简单??
  6. tkinter中鼠标与键盘事件
  7. 【深度学习】Tensorflow完成线性回归对比机器学习LinearRegression()
  8. global全局变量
  9. Python元类(type()和metaclass)
  10. java 路径获取文件名称_java 根据文件获取文件名及路径的方法