1.Linux终端执行:

通过readme.md文件的指示:
终端执行以下文件:

bisenetv1 cityscapes

Linux命令如下:

export CUDA_VISIBLE_DEVICES=0,1
cfg_file=configs/bisenetv1_city.py
NGPUS=2
python -m torch.distributed.launch --nproc_per_node=$NGPUS tools/train_amp.py --config $cfg_file

※ 注意以下问题:

1.首先终端进入主文件再进行操作
2.调用GPU个数注意,看是否支持
3.文件访问的路径位置,此处是相对路径,一般相对路径不会出问题,但是一旦涉及相对路径找不到文件报错,那么就一定要采取绝对路径了(从home开始……)



对于bisenetv1_city.py文件:文件路径一定要对,相对路径

对train.txt的内容设计程序:原图+label make path文件如下:

import osfile = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/train.txt'
train_image_path = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/image/train'
train_label_path = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/label/train'label_list = []
image_list = []train_image_dir = sorted(os.listdir(train_image_path))
train_label_dir = sorted(os.listdir(train_label_path))with open(file, 'w') as f:for n1, n2 in zip(train_image_dir, train_label_dir):train_single_image = sorted(os.listdir(os.path.join(train_image_path, n1)))train_single_label = sorted(os.listdir(os.path.join(train_label_path, n2)))for i in train_single_image:image_list.append(os.path.join(train_image_path, n1, i))for i in train_single_label:if i.split('_')[-1] == 'labelIds.png':label_list.append(os.path.join(train_label_path, n2, i))for l1, l2 in zip(image_list, label_list):f.write(l1 + ',' + l2 + '\n')f.close()


2.一旦端口被调用,记得杀进程

多个GPU训练出现RuntimeError
RuntimeError: Address already in use

2021-7-14 深度学习服务器Linux终端网络训练training(顶会ECCV网络BiSeNet)相关推荐

  1. 2021-07-15 深度学习服务器Linux终端网络训练training结果(顶会ECCV网络BiSeNet)

    1.网络BiSeNetV1训练training结果 训练集结果在好多个小时终于出来了哈哈哈哈,在迭代8万次之后结果如图: $ python evaluate.py --config configs/b ...

  2. 【深度学习】基于深度学习的linux服务器,需要搭建哪些服务,一步步搭建深度学习的环境,cuda,pytorch,opencv,ftp服务, nfs服务 docker等等

    来来回回的安装服务器,是时间写个pipline了,在这里主要记录下生产环境下的一台基于深度学习的linux服务器,需要搭建那些服务 文章目录 前言 一.开工 1.1 切换yum源 1.2 minico ...

  3. linux重启gpu_远程配置Ubuntu深度学习服务器GPU驱动+Docker+CUDA多个版本

    前言 首先说一下为什么建议使用docker来使用搭建深度学习服务器.其实网上很多人都写了如何搭建CUDA10.0 + cudnn8.5 , CUDA9.0 + cudnn7.5 等等,并且从Tenso ...

  4. NVIDIA英伟达:深度学习服务器搭建指南 | 交流会笔记

    主讲人:Ken(何琨)| NVIDIA开发者社区经理 张康 屈鑫 编辑整理 量子位 出品 | 公众号 QbitAI 7月21日,量子位联合NVIDIA英伟达举行了线下交流会,跟现场近百位开发者同学共同 ...

  5. 使用AMD CPU,打造自己的深度学习服务器

    本文作者详细描述了自己组装深度学习服务器的过程,从 CPU.GPU.主板.电源.机箱等的选取到部件的安装,再到服务器的设置,可谓面面俱到.作者指出,组装者首先要弄清自己的需求,然后根据预算做出合理的选 ...

  6. 自己动手打造深度学习服务器

    摘要: 本文介绍如何自己构建深度学习服务器 注意:本文主要关注服务器设置和与多个用户同时工作,部件组装和软件安装过程是Slav Ivanov关于创建自己的DL Box的文章的简化版本. 我刚刚开始阅读 ...

  7. Ubuntu 18.04 server配置多用户深度学习服务器

    Ubuntu 18.04 server配置多用户深度学习服务器 1 重装系统 2 安装图形界面 2.1 更改Ubuntu 镜像源 2.2 安装图形界面 2.3安装gcc , make等库 3 安装Nv ...

  8. 从零到一保姆级Ubuntu深度学习服务器环境配置教程

    文章目录 前言 一.Ubuntu安装教程 1.1 下载Ubuntu镜像 1.2 软碟通刻录U盘 1.3 进入Bios,修改相关选项 1.4 Ubuntu18.04安装流程 二.更换软件源 三. NVI ...

  9. 如何从ip服务器所用系统,如何从0开始打造一个深度学习服务器?

    最近我(作者Wayde Gilliam--译者注)在学习了一些深度学习方面的知识和教程后,决定自己搭一个服务器用来训练机器学习模型,不再用现在所用的AWS p2虚拟机和存储器.我意识到,后面我会用到规 ...

最新文章

  1. usaco fencing the cows
  2. 编译Cocos2dx程序 (一)
  3. 开机f8修复电脑步骤_知识 | 8种方法修复电脑无法开机问题
  4. netflow报文格式与数据处理流程分析_RTK、三维激光扫描、无人机倾斜摄影在大比例尺地形图测绘的对比分析...
  5. Codeforces Round #709 (Div. 1) B. Playlist 链表维护 + bfs
  6. ubuntu php 无法执行exec_利用webhook使php项目自动部署
  7. hiveql函数笔记(二)
  8. 论文浅尝 | 用对抗学习做知识表示(NAACL2018)
  9. linux 安装nodejs8,CentOS 安装NodeJS V8.0.0的方法
  10. PAT 乙级 1031. 查验身份证(15) Java版
  11. Shell 把日志记录按天切割到不同的文件
  12. 讲解wpe抓包,封包
  13. vijos 1071 01背包
  14. 小米max刷鸿蒙,小米Max刷recovery教程 小米Max第三方recovery下载
  15. 计算机更新过后cad,升级windows10系统后cad无法打开的两种解决方法
  16. HCNA-IP地址规划练习
  17. 【chrome插件开发一】初始chrome插件——helloWorld
  18. 微信开放平台第三方解密失败
  19. 计算机图形学基础:2D/3D坐标变换(Transformation)
  20. 利用R语言画简单时间序列图

热门文章

  1. 优点和阵列的缺点,并且一个链表
  2. Android问题-DelphiXE5编义时提示找不到“连接器(arm-linux-androideabi-ld.exe)
  3. 把Windows CA根证书安装到iPhone
  4. 负载均衡中的服务器健康检查
  5. 让一个网页打开的同时自动为另一个网页自动填写表单并提交
  6. 性能优化之Java多线程批量拆分List导入数据库
  7. 惊了,老板要我开发一个工作流引擎!
  8. 干货!用大白话告诉你什么是Mock测试
  9. 刚看完 Kafka 源码,各位随便问!
  10. 携程数据库高可用架构实践