远程服务器 Linux 用cityscape训练DeepLabv3模型(Pytorch版)并用图像测试
参考
https://blog.csdn.net/qq_45389690/article/details/111591713?utm_medium=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase&depth_1-utm_source=distribute.pc_relevant_download.none-task-blog-baidujs-2.nonecase
https://blog.csdn.net/weixin_41919571/article/details/107906066
代码
https://github.com/jfzhang95/pytorch-deeplab-xception
出现问题
ImportError: No module named pycocotools.coco
解决
https://blog.csdn.net/u011961856/article/details/77676461
https://blog.csdn.net/joejeanjean/article/details/78839318?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-6&spm=1001.2101.3001.4242
https://blog.csdn.net/haiyonghao/article/details/80472713?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-11&spm=1001.2101.3001.4242
一定要把PythonAPI目录下除setup.py之外的所有文件拷贝到pytorch-deeplab-xception-master文件夹下
出现问题
ImportError: No module named ‘Queue’
解决
https://blog.csdn.net/DarrenXf/article/details/82962412
出现问题
from utils.loss import SegmentationLosses
ImportError: No module named loss
参考
https://blog.csdn.net/Diliduluw/article/details/103742766
解决
在utils文件下 新建一个空白的__init__.py
出现问题
AttributeError: ‘module’ object has no attribute ‘kaiming_normal_’
参考
https://blog.csdn.net/songchunxiao1991/article/details/83104893?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.control
https://blog.csdn.net/Aug0st/article/details/42707709
然后 我删除了所有pyc文件 (主要是不敢更新Python27\Lib\urllib2.pyc文件 怕影响别的算法)
删除指令 find /dir -name “*.pyc” | xargs rm -rf
但并没用
然后
我又配了一个python3.5 pytorch0.4.1的环境
出现问题
RuntimeError: CUDA error: out of memory
解决
train.py中改batch-size的default=2
出现问题
ValueError: Expected more than 1 value per channel when training, got input size [1, 256, 1, 1]
参考
https://blog.csdn.net/weixin_43925119/article/details/109755329
https://www.cnblogs.com/zmbreathing/p/pyTorch_BN_error.html
https://blog.csdn.net/sinat_39307513/article/details/87917537
https://blog.csdn.net/qq_42079689/article/details/102587401?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/jining11/article/details/111478935?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-2&spm=1001.2101.3001.4242
https://blog.csdn.net/qq_36321330/article/details/108954588?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-2.control
https://blog.csdn.net/qq_34124009/article/details/109100053?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-4.control
https://blog.csdn.net/qq_21230831/article/details/103711545?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-7.control
https://blog.csdn.net/lrs1353281004/article/details/108262018?utm_medium=distribute.pc_relevant.none-task-blog-baidujs_title-7&spm=1001.2101.3001.4242
模型中含有nn.BatchNorm层,训练时需要batch_size大于1,来计算当前batch的running mean and std,数据数量除以batch_size后刚好余1时就会报错。
解决
改batch_size 使其除完不余1,但我改完5之后内存又不行了,报错。
于是 我去找了/usr/local/lib/python3.5/dist-packages/torch/utils/data/dataloader.py文件,改里面drop_last=True。
因为远程服务器不能直接打开这个文件,所以粘过来又拷过去的。
远程服务器 Linux 用cityscape训练DeepLabv3模型(Pytorch版)并用图像测试相关推荐
- 2021-7-14 深度学习服务器Linux终端网络训练training(顶会ECCV网络BiSeNet)
1.Linux终端执行: 通过readme.md文件的指示: 终端执行以下文件: bisenetv1 cityscapes Linux命令如下: export CUDA_VISIBLE_DEVICES ...
- 2021-07-15 深度学习服务器Linux终端网络训练training结果(顶会ECCV网络BiSeNet)
1.网络BiSeNetV1训练training结果 训练集结果在好多个小时终于出来了哈哈哈哈,在迭代8万次之后结果如图: $ python evaluate.py --config configs/b ...
- linux关闭远程服务器,linux – 远程主机关闭SSH连接
我有问题连接SSH到远程主机,但只在我的家庭网络(提供商).如果我在另一个网络(我在同一个城市的朋友 – 不同的提供商),连接工作完美. Ping到服务器(在我家)工作.这个问题我只有这个服务器.如果 ...
- python调用yolov3模型,pytorch版yolov3训练自己的数据(数据,代码,预训练模型下载链接)...
1.数据预处理 准备图片数据(JPEGImages),标注文件(Annotations),以及划分好测试集训练集的索引号(ImageSets) 修改代码中voc_label.py文件中的路径以及类别, ...
- 远程服务器的url怎么配置文件,Linux常用命令(5)--SSH访问远程服务器、SCP服务器间文件拷贝...
一.使用"ssh"命令,登录访问远程服务器 Linux是一个支持多用户操作的系统,在同一时刻允许多个用户同时访问系统,共享系统提供的服务.那么用户如何从不同的机器上访问同一台Lin ...
- Pycharm连接远程服务器、使用Pycharm运行深度学习项目、Pycharm使用总结以及Pycharm报错和解决办法
Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结 文章目录 Pycharm连接远程服务器,使用Pycharm运行深度学习项目以及Pycharm的使用总结 前 ...
- dw修改服务器,dw怎么更改远程服务器
dw怎么更改远程服务器 内容精选 换一换 使用Mac版Microsoft Remote Desktop工具,远程连接Windows云服务器.由于Mac系统的特殊性,在使用Mac系统远程登录Window ...
- 计算机视觉——PyCharm连接远程服务器和Linux Screen命令使用
一.PyCharm连接远程服务器 (1)教程配置 详见:pycharm:远程连接服务器调试代码(保姆级详细步骤) (2)开始使用 打开服务器的terminal(可开多个):Tools-Start SS ...
- VSCode 连接 Linux 远程服务器
一.前言 我们在跑机器学习或深度学习模型的时候通常会使用 GPU,但大多数人自己本地电脑的 GPU 不是太好甚至没有 GPU.所以我们通常会选择实验室服务器或者云服务器去跑模型,一般我们会先在本地电脑 ...
- 使用Linux训练LoRA模型
原文:使用Linux训练LoRA模型 - 知乎 2022年十一之后一直在关注AI绘图的进展,包括waifu,novelai等模型层出不穷,一点点刷新着AI绘图的能力. 关于LoRA: 2022年12月 ...
最新文章
- Redis 高级特性(5)— 集群模式(主从模式、哨兵模式、cluster 集群模式)
- 机器学习也能套模版:在线选择模型和参数,一键生成demo
- WP8开发日志(1):Toolkit的本地化
- 第四章 - 数据运算
- 5.Git使用详细教程
- unity导出fbx_使用Blender和Unity创建一个简单Low Poly的模型(一)
- 基于C++的模板引擎
- 如何使用NFC双界面读写器UTrust4701读取电子护照信息
- 一个介绍实用软件及技巧的独立博客-善用佳软
- 万能计算机在线应用,万能计算器在线使用技巧,快点学习吧
- 浅尝大菠萝Pinia
- linux git ssh目录权限,Git SSH Key的配置问题
- python opencv截取视频
- dell电脑如何安装ubuntu系统_Dell台式机安装Ubuntu 16.04注意事项( Alienware R6)
- 【万字长文】Dubbo 入门总结 ,一款高性能的 Java RPC 框架
- oracle delete not in 优化,Oracle中的sql语句优化
- 群晖Synology FileStation不显示Share文件夹的解决办法
- 【码农学编曲】Cubase乐器轨音频轨各种轨没声音的终极解决方案
- 施米德胡贝,被遗忘的人工智能教父
- Windows10安装MG2580打印机