运行程序

去github上下载Dlinknet的代码
https://github.com/zlckanata/DeepGlobe-Road-Extraction-Challenge

把数据集放进dataset/train里面
注意数据命名以及格式

直接使用anaconda的powershell运行程序

python train.py

出现错误

RuntimeError: An attempt has been made to start a new process before the…

参考这篇博文
我采用了
去掉num_workers参数解决

下一个问题接踵而至

RuntimeError: CUDA out of memory

貌似都是pytorch经常出现的问题
解决方式没有一个好的方法,最后我参考这篇文章
减小batch_size,修改代码来解决
这个解决方法
貌似挺好的,这里码一下,下次试试

果然不能一帆风顺

UserWarning: nn.functional.sigmoid is deprecated. Use torch.sigmoid instead.

warnings.warn(“nn.functional.sigmoid is deprecated. Use torch.sigmoid instead.”)
还能怎么办,F:\anaconda3\lib\site-packages\torch\nn\functional.py:1639: UserWarning: nn.functional.sigmoid is deprecated. Use torch.sigmoid instead.
warnings.warn(“nn.functional.sigmoid is deprecated. Use torch.sigmoid instead.”)
那就改吧
只有networks文件夹里的dlinknet含有nn.functional.sigmoid,全部修改即可
改完,再次运行

编译器

推荐使用vscode,下载pycharm还需要破解,否则只有30天试用
与anaconda结合起来,参考配置环境

RuntimeError: CUDA error: CUBLAS_STATUS_ALLOC_FAILED when calling cublasCreate(handle)

我发现这两个报错简直是两条死路,貌似都只能改batchsize,这个是太小

最后我把train数据集删去了一半,就能够跑通了,但是出现了下面的错误

这里是说找不到该文件夹和th文件,只要新建一个空的就行,就可以跑起来啦

现在我跑的时间是2022年1月11日17:28
数据集是1480个样本

看看多久能跑完测试数据
现在是真害怕有人半夜拔我网线了hhh
待更新。。。


2022年1月12日11:33:50
目前的进度是跑到了121

查看代码应该是要跑到epoch=300

目测应该还要跑一整天,这里码一下师姐给我的建议~分享给大家,感谢亲爱的师姐

我:师姐,怎样训练效果最好呢
师姐:
图片越大越多越好
也看你最后要提取哪里的道路
训练的数据和测试的数据要特征要相似
现在用的数据集是东南亚地区的乡村数据,如果你后期提取城市的道路效果就不会很好,如果提取乡村道路应该会效果好一点

先把代码跑通试试效果,之后再进行下一步实验
待更新。。。


现在是2022年1月12日13:18:00
由于出现break语句所以输出了结果

现在来试试predict
运行
python test.py

Error(s) in loading state_dict for DataParallel:

    size mismatch for module.finaldeconv1.weight: copying a param with shape torch.Size([64, 32, 3, 3]) from checkpoint, the shape in current model is torch.Size([64, 32, 4, 4]).size mismatch for module.finalconv3.weight: copying a param with shape torch.Size([1, 32, 2, 2]) from checkpoint, the shape in current model is torch.Size([1, 32, 3, 3]).

尝试了第一种解决方法,失败了
1、model.load_state_dict(torch.load(“model.th”),strict=False)
没效果,还是相同的错

查看了一些博客试了这个方法虽然能成功运行,但结果惨不忍睹

 model = torch.load(path)        model.pop('module.finaldeconv1.weight')        model.pop('module.finalconv3.weight')        self.net.load_state_dict(model,strict=False)

这是我调试的方法,输出的结果全是黑色图片

最后发现是train的模型和predict模型选择错误才出现了问题
原代码出现了一点问题
需要把下图的dink改成link



这两个模型需要保持一致
若不一样就会出现网络层数的问题

这样一改结果就出来了

重新进行DinkNet34的训练,这次选取最多的样本,并且还是1024的大小
有了上面的思路,这次重新运行就很快了
总结:
代码部分需要修改的就是
根据需要修改

我决定重启电脑重新训练,重新记录训练时间,大家下一篇博文再见!

windows10使用cuda11搭建pytorch深度学习框架——运行Dlinknet提取道路(二)——代码运行问题解决相关推荐

  1. windows10使用cuda11搭建pytorch深度学习框架——运行Dlinknet提取道路(三)——模型精度评估代码完善

    重新调试好代码,使用Dinknet34模型对数据集进行训练 数据集大小为1480张图片 运行时间为2022年1月12日16:00 记录下该模型训练时间 但如何评估模型的精度也是一个问题,因此作如下总结 ...

  2. Ubuntu20搭建pytorch深度学习框架——使用增强样本运行Dlinknet提取道路水体(五)——样本增强

    之前运行的样本是未进行过样本增强的 做出来多少样本就使用了多少样本来进行训练 这里复盘一下样本训练结果 首先是道路 使用512512分辨率的16461张标签和16461张原图进行训练 接下来是水体 使 ...

  3. 从头搭建一个深度学习框架

    从头搭建一个深度学习框架 转自:Build a Deep Learning Framework From Scratch 代码:https://github.com/borgwang/tinynn 当 ...

  4. 2021-7-26 pytorch深度学习框架学习

    1. Pytorch深度学习框架

  5. 在腾讯云主机上搭建pytorch深度学习环境

    在腾讯云主机上搭建pytorch深度学习环境 1.购置[腾讯云主机](https://cloud.tencent.com/? fromSource=gwzcw.234976.234976.234976 ...

  6. pytorch深度学习框架--gpu和cpu的选择

    pytorch深度学习框架–gpu和cpu的选择 基于pytorch框架,最近实现了一个简单的手写数字识别的程序,我安装的pytorch是gpu版(你也可以安装cpu版本的,根据个人需要),这里我介绍 ...

  7. 人工智能:PyTorch深度学习框架介绍

    目录 1.PyTorch 2.PyTorch常用的工具包 3.PyTorch特点 4.PyTorch不足之处 今天给大家讲解一下PyTorch深度学习框架的一些基础知识,希望对大家理解PyTorch有 ...

  8. pytorch深度学习框架—torch.nn模块(一)

    pytorch深度学习框架-torch.nn模块 torch.nn模块中包括了pytorch中已经准备好的层,方便使用者调用构建的网络.包括了卷积层,池化层,激活函数层,循环层,全连接层. 卷积层 p ...

  9. 手把手教你搭建pytorch深度学习网络

    总有人在后台问我,如今 TensorFlow 和 PyTorch 两个深度学习框架,哪个更流行? 就这么说吧,今年面试的实习生,问到常用的深度学习框架时,他们清一色的选择了「PyTorch」. 这并不 ...

最新文章

  1. Docker 入门到实践笔记2
  2. Linux大文件传输(转)
  3. visualStudio创建项目过程
  4. 关于 AppDelegate 、UIApplication 简单的用法
  5. poj 2186 强连通分量
  6. Java 对象初始化过程
  7. 一个项目部署多个节点会导致锁失效么_Redis分布式锁
  8. Prometheus-普罗米修斯:高扩展性的监控和报警系统
  9. CSS3实现卡片翻转动画
  10. ListView优化的
  11. 城镇化进程中的粮食生产问题
  12. 【资料】哈代拉马努金相关,悼文,哈佛演讲,及各种杂七杂八资料整理
  13. 全面了解信贷业务流程
  14. 用Java玩转选择排序
  15. AcWing 913. 排队打水 (排序不等式)
  16. Kelvin connection of PCB traces for current sensing--Cypress
  17. 经典名言+经典配色图
  18. 前端 JS 调起打印机打印页面
  19. 大数据和区块链之间的比较分析
  20. 论软件架构风格及其应用

热门文章

  1. rpa 手机_RPA
  2. 基尔霍夫电压电流定律
  3. marquee的用法,例子
  4. 推荐算法评测方法总结
  5. 服务器配置公网ftp服务端(软件和python代码两种方法)
  6. 来自上海的燕谷坊申请纳斯达克IPO上市,募资3000万美元
  7. 计算机专业本科生和研究生比较
  8. Labview Ethernetip TCP网口通讯欧姆龙PLC
  9. CCNA专业英文词汇红宝书
  10. C++zlib库实现的GZIP压缩解压缩工具类【多图警告^_^】