与训练相关的操作

  • 0 gpu版本的tensor flow安装
  • 1. tf.control_dependencies(update_ops)

0 gpu版本的tensor flow安装

cuda10.2

conda create -n py27 python=2.7
conda activate py27
pip install tensorflow==1.14.0

验证 gpu版本的tensor可用

import tensorflow as tf
print(tf.test.is_gpu_available()) # true 为可用

报错1: Could not dlopen library ‘libcudart.so.10.0’; dlerror: libcudart.so.10.0: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: /usr/local/cuda-11.2/lib64:
解决:安装cudatoolkit

conda install cudatoolkit=10.0

报错1: Could not dlopen library ‘libcudnn.so.7’; dlerror: libcudnn.so.7: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: /usr/local/cuda-11.2/lib64
解决:安装cudnn=7.6.5

conda install cudnn=7.6.5

如果你的模型训练出不了效果,可能的原因太多了,没搞清tf 中各个函数的具体作用可能就是其中一个原因。本文记录【如果不理清,会造成无法解释的训练现象的操作】。

1. tf.control_dependencies(update_ops)

  1. tf.control_dependencies()–保证其作用域内的操作必须要在该函数所传递的参数中的操作完成后再进行。 如下Code Demo,只有在update_ops 操作完成后,才会执行optimizer.minimize(loss)。
  2. tf.GraphKeys.UPDATE_OPS–tensorflow计算图中内置的一个集合,通过 tf.get_collection获取这个集合。其中会保存一些需要在训练操作之前完成的操作。例如: batch normalization 均值和方差的更新。

Code Demo

  update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)with tf.control_dependencies(update_ops):train_op = optimizer.minimize(loss)

参考文献:
1.tensorflow中的batch_norm以及tf.control_dependencies和tf.GraphKeys.UPDATE_OPS的探究
2.tf.get_collection(tf.GraphKeys.UPDATE_OPS)

TensorFlow(3)-与训练相关的操作相关推荐

  1. 程序如何在两个gpu卡上并行运行_深度学习分布式训练相关介绍 - Part 1 多GPU训练...

    本篇文章主要是对深度学习中运用多GPU进行训练的一些基本的知识点进行的一个梳理 文章中的内容都是经过认真地分析,并且尽量做到有所考证 抛砖引玉,希望可以给大家有更多的启发,并能有所收获 介绍 大多数时 ...

  2. [翻译] 使用 TensorFlow 进行分布式训练

    [翻译] 使用 TensorFlow 进行分布式训练 文章目录 [翻译] 使用 TensorFlow 进行分布式训练 0x00 摘要 1. 概述 2. 策略类型 2.1 MirroredStrateg ...

  3. tensorflow2caffe(3) : 如何将tensorflow框架下训练得到的权重转化为caffe框架下的权重参数

    版权声明:本文为博主原创文章,转载时请附加博文链接. https://blog.csdn.net/jiongnima/article/details/78382972 在前两期专栏tensorflow ...

  4. tensorflow2caffe(1) : 如何将tensorflow框架下训练得到的权重转化为caffe框架下的权重参数

    在前两期专栏tensorflow2caffe(1)和tensorflow2caffe(2)中,笔者向大家介绍了caffemodel文件类型下的参数架构和如何取出tensorflow框架下训练参数.在本 ...

  5. Tensorflow版yolov3训练自己的数据

    Tensorflow版yolov3训练自己的数据 源代码:https://github.com/YunYang1994/TensorFlow2.0-Examples/tree/master/4-Obj ...

  6. win下使用TensorFlow object detection训练自己模型

    win下使用TensorFlow object detection训练自己模型 1. 环境 2.xml生成csv文件,再生成record文件 2.1 对训练文件和测试文件都使用以下两个文件分别生成自己 ...

  7. Linux中和文件相关的操作

    Linux中和文件(/文件夹)相关的操作 1. 文件:删除.复制.移动.创建链接 2. 文件的解压 和 压缩 3. 文件:列举查看.大小查看.个数统计 3.1 `ls`:文件列举查看 3.2 `ls. ...

  8. 语义匹配(一)【NLP论文复现】Sentence-BERT 句子语义匹配模型的tensorflow实现以及训练Trick

    Sentence-BERT 句子语义匹配模型的tensorflow实现以及训练trick 论文模型回顾 建模与训练 模型代码部分 数据处理 训练 模型训练Trick trick1 warm up 代码 ...

  9. Boost:与gz文件相关的操作实例

    Boost:与gz文件相关的操作实例 实现功能 C++实现代码 实现功能 与gz文件相关的操作实例,打开,关闭,读写. C++实现代码 #include "zstream.h" # ...

最新文章

  1. 【JUC并发编程04】线程间定制化通信(单标志法存在的问题)
  2. 端侧AI:高隐私、高可靠的智能个性化服务
  3. 关于链表的面试题(持续更新)
  4. 前端学习(2663):vue3.0的todolist
  5. 03MyBatis动态sql
  6. Python——Eric的Python编程命名规则
  7. 小型微型计算机系统2006,小型微型计算机系统杂志
  8. markdown mysql高亮_博客园里Markdown支持高亮显示的语言
  9. Auto layout 的使用
  10. 【相机标定系列】单目相机,内参,外参
  11. goahead如何使用cgi服务_GoAhead2.5源代码分析之9-cgi处理句柄(cgi.c)
  12. PCB天线设计及射频布局设计指南
  13. 转:谦逊不是罕见的美德,而是人人可习得的能力
  14. dreamweaver html模版,dw网页设计模板
  15. 怎么用计算机给u盘加密文件,使用u盘给电脑加密如何操作
  16. ST17H66 低功耗蓝牙SOC开发(3)—— OSAL系统简介
  17. c语言三个灯一直亮 一个灯闪烁,电脑键盘不能用了,三个指示灯一直在闪,也用不了,是为什么...
  18. numpy_3数组的操作-变形
  19. Celery 全面学习笔记
  20. 超级计算机国产cpu,为何国产超级计算机已经领先全世界了,而国产cpu却依然落后?...

热门文章

  1. 双网卡绑定linux7.2,CentOS 7.2 bond实现网卡聚合链路(双网卡绑定)脚本及验证(适合云平台)...
  2. apple watch3连android,Apple watch 可以连android手机吗?
  3. Oracle备份standby,Oracle 11g 利用泠备份恢复standby库
  4. 利用envi对landsat8数据进行处理
  5. 【转】刨根究底正则表达式(2):文本查找方式的演化历史
  6. 【转】添加web引用和添加服务引用有什么区别?
  7. 使用C#代码部署SharePoint 2013开发包简单总结(一)
  8. JAVA类 与类文件
  9. REVERSE-COMPETITION-HGAME2022-Week1
  10. 采购模板html5,蓝色的采购信息管理系统手机界面wap模板