远程服务器 Linux 用cityscape训练DeepLabv3模型（Pytorch版）并用图像测试

参考
https://blog.csdn.net/qq_45389690/article/details/111591713?utm_medium=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase
https://blog.csdn.net/weixin_41919571/article/details/107906066
代码
https://github.com/jfzhang95/pytorch-deeplab-xception

出现问题
ImportError: No module named pycocotools.coco
解决
https://blog.csdn.net/u011961856/article/details/77676461

https://blog.csdn.net/joejeanjean/article/details/78839318?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242

https://blog.csdn.net/haiyonghao/article/details/80472713?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-11&spm=1001.2101.3001.4242
一定要把PythonAPI目录下除setup.py之外的所有文件拷贝到pytorch-deeplab-xception-master文件夹下

出现问题
ImportError: No module named ‘Queue’
解决
https://blog.csdn.net/DarrenXf/article/details/82962412

出现问题
from utils.loss import SegmentationLosses
ImportError: No module named loss
参考
https://blog.csdn.net/Diliduluw/article/details/103742766
解决
在utils文件下新建一个空白的__init__.py

出现问题
AttributeError: ‘module’ object has no attribute ‘kaiming_normal_’
参考
https://blog.csdn.net/songchunxiao1991/article/details/83104893?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

https://blog.csdn.net/Aug0st/article/details/42707709
然后我删除了所有pyc文件（主要是不敢更新Python27\Lib\urllib2.pyc文件怕影响别的算法）
删除指令 find /dir -name “*.pyc” | xargs rm -rf
但并没用

然后
我又配了一个python3.5 pytorch0.4.1的环境

出现问题
RuntimeError: CUDA error: out of memory
解决
train.py中改batch-size的default=2

出现问题
ValueError: Expected more than 1 value per channel when training, got input size [1, 256, 1, 1]

参考
https://blog.csdn.net/weixin_43925119/article/details/109755329
https://www.cnblogs.com/zmbreathing/p/pyTorch_BN_error.html
https://blog.csdn.net/sinat_39307513/article/details/87917537
https://blog.csdn.net/qq_42079689/article/details/102587401?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/jining11/article/details/111478935?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-2&spm=1001.2101.3001.4242
https://blog.csdn.net/qq_36321330/article/details/108954588?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/qq_34124009/article/details/109100053?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control
https://blog.csdn.net/qq_21230831/article/details/103711545?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control
https://blog.csdn.net/lrs1353281004/article/details/108262018?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-7&spm=1001.2101.3001.4242
模型中含有nn.BatchNorm层，训练时需要batch_size大于1，来计算当前batch的running mean and std，数据数量除以batch_size后刚好余1时就会报错。

解决
改batch_size 使其除完不余1，但我改完5之后内存又不行了，报错。
于是我去找了/usr/local/lib/python3.5/dist-packages/torch/utils/data/dataloader.py文件，改里面drop_last=True。
因为远程服务器不能直接打开这个文件，所以粘过来又拷过去的。

远程服务器 Linux 用cityscape训练DeepLabv3模型（Pytorch版）并用图像测试相关推荐

2021-7-14 深度学习服务器Linux终端网络训练training（顶会ECCV网络BiSeNet）
1.Linux终端执行: 通过readme.md文件的指示: 终端执行以下文件: bisenetv1 cityscapes Linux命令如下: export CUDA_VISIBLE_DEVICES ...
2021-07-15 深度学习服务器Linux终端网络训练training结果（顶会ECCV网络BiSeNet）
1.网络BiSeNetV1训练training结果训练集结果在好多个小时终于出来了哈哈哈哈,在迭代8万次之后结果如图: $ python evaluate.py --config configs/b ...
linux关闭远程服务器,linux – 远程主机关闭SSH连接
我有问题连接SSH到远程主机,但只在我的家庭网络(提供商).如果我在另一个网络(我在同一个城市的朋友 – 不同的提供商),连接工作完美. Ping到服务器(在我家)工作.这个问题我只有这个服务器.如果 ...
python调用yolov3模型,pytorch版yolov3训练自己的数据（数据，代码，预训练模型下载链接）...
1.数据预处理准备图片数据(JPEGImages),标注文件(Annotations),以及划分好测试集训练集的索引号(ImageSets) 修改代码中voc_label.py文件中的路径以及类别, ...
远程服务器的url怎么配置文件,Linux常用命令(5)--SSH访问远程服务器、SCP服务器间文件拷贝...
一.使用"ssh"命令,登录访问远程服务器 Linux是一个支持多用户操作的系统,在同一时刻允许多个用户同时访问系统,共享系统提供的服务.那么用户如何从不同的机器上访问同一台Lin ...
Pycharm连接远程服务器、使用Pycharm运行深度学习项目、Pycharm使用总结以及Pycharm报错和解决办法
Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结文章目录 Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结前 ...
dw修改服务器,dw怎么更改远程服务器
dw怎么更改远程服务器内容精选换一换使用Mac版Microsoft Remote Desktop工具,远程连接Windows云服务器.由于Mac系统的特殊性,在使用Mac系统远程登录Window ...
计算机视觉——PyCharm连接远程服务器和Linux Screen命令使用
一.PyCharm连接远程服务器 (1)教程配置详见:pycharm:远程连接服务器调试代码(保姆级详细步骤) (2)开始使用打开服务器的terminal(可开多个):Tools-Start SS ...
VSCode 连接 Linux 远程服务器
一.前言我们在跑机器学习或深度学习模型的时候通常会使用 GPU,但大多数人自己本地电脑的 GPU 不是太好甚至没有 GPU.所以我们通常会选择实验室服务器或者云服务器去跑模型,一般我们会先在本地电脑 ...
使用Linux训练LoRA模型
原文:使用Linux训练LoRA模型 - 知乎 2022年十一之后一直在关注AI绘图的进展,包括waifu,novelai等模型层出不穷,一点点刷新着AI绘图的能力. 关于LoRA: 2022年12月 ...

远程服务器 Linux 用cityscape训练DeepLabv3模型（Pytorch版）并用图像测试

远程服务器 Linux 用cityscape训练DeepLabv3模型（Pytorch版）并用图像测试相关推荐

最新文章

热门文章