2021-7-14 深度学习服务器Linux终端网络训练training(顶会ECCV网络BiSeNet)
1.Linux终端执行:
通过readme.md文件的指示:
终端执行以下文件:
bisenetv1 cityscapes
Linux命令如下:
export CUDA_VISIBLE_DEVICES=0,1
cfg_file=configs/bisenetv1_city.py
NGPUS=2
python -m torch.distributed.launch --nproc_per_node=$NGPUS tools/train_amp.py --config $cfg_file
※ 注意以下问题:
1.首先终端进入主文件再进行操作
2.调用GPU个数注意,看是否支持
3.文件访问的路径位置,此处是相对路径,一般相对路径不会出问题,但是一旦涉及相对路径找不到文件报错,那么就一定要采取绝对路径了(从home开始……)
对于bisenetv1_city.py文件:文件路径一定要对,相对路径
对train.txt的内容设计程序:原图+label
make path
文件如下:
import osfile = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/train.txt'
train_image_path = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/image/train'
train_label_path = 'D:/BaiduNetdiskDownload/08BiSeNet/Datasets/Cityscapes/label/train'label_list = []
image_list = []train_image_dir = sorted(os.listdir(train_image_path))
train_label_dir = sorted(os.listdir(train_label_path))with open(file, 'w') as f:for n1, n2 in zip(train_image_dir, train_label_dir):train_single_image = sorted(os.listdir(os.path.join(train_image_path, n1)))train_single_label = sorted(os.listdir(os.path.join(train_label_path, n2)))for i in train_single_image:image_list.append(os.path.join(train_image_path, n1, i))for i in train_single_label:if i.split('_')[-1] == 'labelIds.png':label_list.append(os.path.join(train_label_path, n2, i))for l1, l2 in zip(image_list, label_list):f.write(l1 + ',' + l2 + '\n')f.close()
2.一旦端口被调用,记得杀进程
多个GPU训练出现RuntimeError
RuntimeError: Address already in use
2021-7-14 深度学习服务器Linux终端网络训练training(顶会ECCV网络BiSeNet)相关推荐
- 2021-07-15 深度学习服务器Linux终端网络训练training结果(顶会ECCV网络BiSeNet)
1.网络BiSeNetV1训练training结果 训练集结果在好多个小时终于出来了哈哈哈哈,在迭代8万次之后结果如图: $ python evaluate.py --config configs/b ...
- 【深度学习】基于深度学习的linux服务器,需要搭建哪些服务,一步步搭建深度学习的环境,cuda,pytorch,opencv,ftp服务, nfs服务 docker等等
来来回回的安装服务器,是时间写个pipline了,在这里主要记录下生产环境下的一台基于深度学习的linux服务器,需要搭建那些服务 文章目录 前言 一.开工 1.1 切换yum源 1.2 minico ...
- linux重启gpu_远程配置Ubuntu深度学习服务器GPU驱动+Docker+CUDA多个版本
前言 首先说一下为什么建议使用docker来使用搭建深度学习服务器.其实网上很多人都写了如何搭建CUDA10.0 + cudnn8.5 , CUDA9.0 + cudnn7.5 等等,并且从Tenso ...
- NVIDIA英伟达:深度学习服务器搭建指南 | 交流会笔记
主讲人:Ken(何琨)| NVIDIA开发者社区经理 张康 屈鑫 编辑整理 量子位 出品 | 公众号 QbitAI 7月21日,量子位联合NVIDIA英伟达举行了线下交流会,跟现场近百位开发者同学共同 ...
- 使用AMD CPU,打造自己的深度学习服务器
本文作者详细描述了自己组装深度学习服务器的过程,从 CPU.GPU.主板.电源.机箱等的选取到部件的安装,再到服务器的设置,可谓面面俱到.作者指出,组装者首先要弄清自己的需求,然后根据预算做出合理的选 ...
- 自己动手打造深度学习服务器
摘要: 本文介绍如何自己构建深度学习服务器 注意:本文主要关注服务器设置和与多个用户同时工作,部件组装和软件安装过程是Slav Ivanov关于创建自己的DL Box的文章的简化版本. 我刚刚开始阅读 ...
- Ubuntu 18.04 server配置多用户深度学习服务器
Ubuntu 18.04 server配置多用户深度学习服务器 1 重装系统 2 安装图形界面 2.1 更改Ubuntu 镜像源 2.2 安装图形界面 2.3安装gcc , make等库 3 安装Nv ...
- 从零到一保姆级Ubuntu深度学习服务器环境配置教程
文章目录 前言 一.Ubuntu安装教程 1.1 下载Ubuntu镜像 1.2 软碟通刻录U盘 1.3 进入Bios,修改相关选项 1.4 Ubuntu18.04安装流程 二.更换软件源 三. NVI ...
- 如何从ip服务器所用系统,如何从0开始打造一个深度学习服务器?
最近我(作者Wayde Gilliam--译者注)在学习了一些深度学习方面的知识和教程后,决定自己搭一个服务器用来训练机器学习模型,不再用现在所用的AWS p2虚拟机和存储器.我意识到,后面我会用到规 ...
最新文章
- usaco fencing the cows
- 编译Cocos2dx程序 (一)
- 开机f8修复电脑步骤_知识 | 8种方法修复电脑无法开机问题
- netflow报文格式与数据处理流程分析_RTK、三维激光扫描、无人机倾斜摄影在大比例尺地形图测绘的对比分析...
- Codeforces Round #709 (Div. 1) B. Playlist 链表维护 + bfs
- ubuntu php 无法执行exec_利用webhook使php项目自动部署
- hiveql函数笔记(二)
- 论文浅尝 | 用对抗学习做知识表示(NAACL2018)
- linux 安装nodejs8,CentOS 安装NodeJS V8.0.0的方法
- PAT 乙级 1031. 查验身份证(15) Java版
- Shell 把日志记录按天切割到不同的文件
- 讲解wpe抓包,封包
- vijos 1071 01背包
- 小米max刷鸿蒙,小米Max刷recovery教程 小米Max第三方recovery下载
- 计算机更新过后cad,升级windows10系统后cad无法打开的两种解决方法
- HCNA-IP地址规划练习
- 【chrome插件开发一】初始chrome插件——helloWorld
- 微信开放平台第三方解密失败
- 计算机图形学基础:2D/3D坐标变换(Transformation)
- 利用R语言画简单时间序列图