参考
https://blog.csdn.net/qq_45389690/article/details/111591713?utm_medium=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase
https://blog.csdn.net/weixin_41919571/article/details/107906066
代码
https://github.com/jfzhang95/pytorch-deeplab-xception

出现问题
ImportError: No module named pycocotools.coco
解决
https://blog.csdn.net/u011961856/article/details/77676461

https://blog.csdn.net/joejeanjean/article/details/78839318?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242

https://blog.csdn.net/haiyonghao/article/details/80472713?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-11&spm=1001.2101.3001.4242
一定要把PythonAPI目录下除setup.py之外的所有文件拷贝到pytorch-deeplab-xception-master文件夹下

出现问题
ImportError: No module named ‘Queue’
解决
https://blog.csdn.net/DarrenXf/article/details/82962412

出现问题
from utils.loss import SegmentationLosses
ImportError: No module named loss
参考
https://blog.csdn.net/Diliduluw/article/details/103742766
解决
在utils文件下 新建一个空白的__init__.py

出现问题
AttributeError: ‘module’ object has no attribute ‘kaiming_normal_’
参考
https://blog.csdn.net/songchunxiao1991/article/details/83104893?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control

https://blog.csdn.net/Aug0st/article/details/42707709
然后 我删除了所有pyc文件 (主要是不敢更新Python27\Lib\urllib2.pyc文件 怕影响别的算法)
删除指令 find /dir -name “*.pyc” | xargs rm -rf
但并没用

然后
我又配了一个python3.5 pytorch0.4.1的环境

出现问题
RuntimeError: CUDA error: out of memory
解决
train.py中改batch-size的default=2

出现问题
ValueError: Expected more than 1 value per channel when training, got input size [1, 256, 1, 1]

参考
https://blog.csdn.net/weixin_43925119/article/details/109755329
https://www.cnblogs.com/zmbreathing/p/pyTorch_BN_error.html
https://blog.csdn.net/sinat_39307513/article/details/87917537
https://blog.csdn.net/qq_42079689/article/details/102587401?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/jining11/article/details/111478935?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-2&spm=1001.2101.3001.4242
https://blog.csdn.net/qq_36321330/article/details/108954588?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/qq_34124009/article/details/109100053?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control
https://blog.csdn.net/qq_21230831/article/details/103711545?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control
https://blog.csdn.net/lrs1353281004/article/details/108262018?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-7&spm=1001.2101.3001.4242
模型中含有nn.BatchNorm层,训练时需要batch_size大于1,来计算当前batch的running mean and std,数据数量除以batch_size后刚好余1时就会报错。

解决
改batch_size 使其除完不余1,但我改完5之后内存又不行了,报错。
于是 我去找了/usr/local/lib/python3.5/dist-packages/torch/utils/data/dataloader.py文件,改里面drop_last=True。
因为远程服务器不能直接打开这个文件,所以粘过来又拷过去的。

远程服务器 Linux 用cityscape训练DeepLabv3模型(Pytorch版)并用图像测试相关推荐

  1. 2021-7-14 深度学习服务器Linux终端网络训练training(顶会ECCV网络BiSeNet)

    1.Linux终端执行: 通过readme.md文件的指示: 终端执行以下文件: bisenetv1 cityscapes Linux命令如下: export CUDA_VISIBLE_DEVICES ...

  2. 2021-07-15 深度学习服务器Linux终端网络训练training结果(顶会ECCV网络BiSeNet)

    1.网络BiSeNetV1训练training结果 训练集结果在好多个小时终于出来了哈哈哈哈,在迭代8万次之后结果如图: $ python evaluate.py --config configs/b ...

  3. linux关闭远程服务器,linux – 远程主机关闭SSH连接

    我有问题连接SSH到远程主机,但只在我的家庭网络(提供商).如果我在另一个网络(我在同一个城市的朋友 – 不同的提供商),连接工作完美. Ping到服务器(在我家)工作.这个问题我只有这个服务器.如果 ...

  4. python调用yolov3模型,pytorch版yolov3训练自己的数据(数据,代码,预训练模型下载链接)...

    1.数据预处理 准备图片数据(JPEGImages),标注文件(Annotations),以及划分好测试集训练集的索引号(ImageSets) 修改代码中voc_label.py文件中的路径以及类别, ...

  5. 远程服务器的url怎么配置文件,Linux常用命令(5)--SSH访问远程服务器、SCP服务器间文件拷贝...

    一.使用"ssh"命令,登录访问远程服务器 Linux是一个支持多用户操作的系统,在同一时刻允许多个用户同时访问系统,共享系统提供的服务.那么用户如何从不同的机器上访问同一台Lin ...

  6. Pycharm连接远程服务器、使用Pycharm运行深度学习项目、Pycharm使用总结以及Pycharm报错和解决办法

    Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结 文章目录 Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结 前 ...

  7. dw修改服务器,dw怎么更改远程服务器

    dw怎么更改远程服务器 内容精选 换一换 使用Mac版Microsoft Remote Desktop工具,远程连接Windows云服务器.由于Mac系统的特殊性,在使用Mac系统远程登录Window ...

  8. 计算机视觉——PyCharm连接远程服务器和Linux Screen命令使用

    一.PyCharm连接远程服务器 (1)教程配置 详见:pycharm:远程连接服务器调试代码(保姆级详细步骤) (2)开始使用 打开服务器的terminal(可开多个):Tools-Start SS ...

  9. VSCode 连接 Linux 远程服务器

    一.前言 我们在跑机器学习或深度学习模型的时候通常会使用 GPU,但大多数人自己本地电脑的 GPU 不是太好甚至没有 GPU.所以我们通常会选择实验室服务器或者云服务器去跑模型,一般我们会先在本地电脑 ...

  10. 使用Linux训练LoRA模型

    原文:使用Linux训练LoRA模型 - 知乎 2022年十一之后一直在关注AI绘图的进展,包括waifu,novelai等模型层出不穷,一点点刷新着AI绘图的能力. 关于LoRA: 2022年12月 ...

最新文章

  1. Redis 高级特性(5)— 集群模式(主从模式、哨兵模式、cluster 集群模式)
  2. 机器学习也能套模版:在线选择模型和参数,一键生成demo
  3. WP8开发日志(1):Toolkit的本地化
  4. 第四章 - 数据运算
  5. 5.Git使用详细教程
  6. unity导出fbx_使用Blender和Unity创建一个简单Low Poly的模型(一)
  7. 基于C++的模板引擎
  8. 如何使用NFC双界面读写器UTrust4701读取电子护照信息
  9. 一个介绍实用软件及技巧的独立博客-善用佳软
  10. 万能计算机在线应用,万能计算器在线使用技巧,快点学习吧
  11. 浅尝大菠萝Pinia
  12. linux git ssh目录权限,Git SSH Key的配置问题
  13. python opencv截取视频
  14. dell电脑如何安装ubuntu系统_Dell台式机安装Ubuntu 16.04注意事项( Alienware R6)
  15. 【万字长文】Dubbo 入门总结 ,一款高性能的 Java RPC 框架
  16. oracle delete not in 优化,Oracle中的sql语句优化
  17. 群晖Synology FileStation不显示Share文件夹的解决办法
  18. 【码农学编曲】Cubase乐器轨音频轨各种轨没声音的终极解决方案
  19. 施米德胡贝,被遗忘的人工智能教父
  20. Windows10安装MG2580打印机

热门文章

  1. PyQt5之Drag拖曳功能
  2. 二元一次方程编程解鸡兔同笼问题
  3. JavaScript发送短信案例
  4. C语言获取本机IP地址
  5. 地图瓦片坐标系定义及计算原理
  6. 初次软件开发(总结篇 之一)
  7. Python 救救我!如何连接串口实现一个报警灯报警器
  8. 01改变世界:没有计算器的日子怎么过——手动时期的计算工具
  9. 德歌:阿里云RDS PG最佳实践
  10. Linux 常用命令和快捷键