深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image
The Winning Solution to the iFLYTEK Challenge 2021 Cultivated Land Extraction from High-Resolution Remote Sensing Image
PDF: https://arxiv.org/pdf/2202.10974.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks

1 JiLin-1 image dataset


数据地址:https://pan.baidu.com/s/1_yFbJ6nX1ovOK0_9BZ5Lrg?pwd=1234 提取码:1234

2 Whole Pipeline

Hybrid Task Cascade(HTC)

  • backbone: ResNeXt-101-64x4d and Deformable ConvNets v2 (DCN)
  • weight initialization: model pretrained for 20 epochs on the COCO dataset
  • post-processed: the overlap-tile fusion strategy
  • nms: Soft-NMS

此外也有一些其他实验结果:

  • Random cropping and InstaBoost的数据增强策略对无效;
  • multi-scales test 效果也一般;
  • COCO数据集预训练效果要好于ImageNet

3 Overlap-Tile Fusion Strategy

图像切片划分为target area T 和 ignore area, ignore area的左边和上边距离切片边缘2px,当且仅当目标检测框的左上角落到目标区域,该检测框保留;当切片位于图像边缘时,同方向上的ignore area和target area边缘重叠;

4 Data Preprocessing

  • 选择4通道tif文件的RGB三个通道输出小图数据

  • 运用如下图所示的滑窗剪切图片,首先以height_stride的步长向下移动,直至达到图片的下边界,然后以width_stride向右平移一单位,继续以height_stride的步长向下移动,以剪切出小图组成数据集

  • 当滑窗的下边界超出图片的下边界时,停止移动,以图片的下边界作为滑窗的下边界;当滑窗的右边界超出图片的右边界时,停止移动,以图片的右边界作为滑窗的右边界;

  • 在所有滑窗中随机采样组成训练集和验证集,训练集和验证集比例为5:1

  • 在训练与测试模型时,滑窗尺寸为512 x 512,height_stride与width_stride均为512 (滑窗不重叠)

  • 在使用模型输出提交结果时,滑窗尺寸为1536 x 1536,height_stride与width_stride均为1280,然后在后处理过程中运用边界筛选法去除图片重叠的影响

5 数据的后处理

为了解决原始图片被剪切成各个小图时,相关的耕地目标也被切分成了多个部分的问题。我们使用了边界筛选法对预测结果进行后处理

  • 我们设置滑窗尺寸为1536 x 1536,height_stride与width_stride均为1280,以保证每块耕地目标至少会完整的出现在其中一个滑窗之中

  • 因为滑窗从上向下,从左向右剪切,当滑窗的下或右边界超出图片的下或右边界时,以图片的下边界和右边界作为滑窗的下边界和右边界, 所以在图片的下边界一行处的滑窗的框高imageHeight可能小于标准框高1536,右边界一列处的滑窗的框宽imageWidth可能小于标准框宽1536

  • place_offset_coord.json文件记录了每个滑窗左上角顶点的坐标(xmin,ymin),在图片的左边界处,滑窗xmin = 0,在图片的上边界处,滑窗ymin = 0。 通过(imageHeight, imageWidth, xmin, ymin)可以判断出每一个滑窗的位置

  • (1)我们定义基础select area为滑窗向下和向右移动一个stride形成的多边形区域,当小图中的预测mask的bbox的左上角的坐标(bboxx, bboxy)落在图中的select area中时则认为耕地目标完整出现在本滑窗中,否则认为耕地目标不完整予以舍弃。
    (2)我们定义靠近滑窗左边界或上边界2个像素的区域内为error区域,如果bbox的左上角顶点落在error区域内,我们认为这个bbox内的耕地目标很大概率是被截断的、不完整的。
    (3)位于原始图片的上边界和左边界的滑窗,其上边界或左边界没有来自前者的重叠图片,则不舍弃error区域;位于原始图片的下边界和右边界的滑窗,其下边界或右边界没有后续的重叠图片,则合并结果,仅减去error区域。

图片各个滑窗的位置判断与区域选择

四个角处的滑窗
Top-Left:(imageHeight = 1536, imageWidth = 1536, xmin = 0, ymin = 0)
Bottom-Left:(imageHeight < 1536, imageWidth = 1536, xmin = 0, ymin ≠ 0)
Top-Right:(imageHeight = 1536, imageWidth < 1536, xmin ≠ 0, ymin = 0)
Bottom-Right:(imageHeight < 1536, imageWidth < 1536)

四条边界处的滑窗(不包含四个角)
Left-Boundary:(imageHeight = 1536, imageWidth = 1536, xmin = 0, ymin ≠ 0)
Right-Boundary:(imageHeight = 1536, imageWidth < 1536, xmin ≠ 0, ymin ≠ 0)
Top-Boundary:(imageHeight = 1536, imageWidth = 1536, xmin ≠ 0, ymin = 0)
Bottom-Boundary:(imageHeight < 1536, imageWidth = 1536, xmin ≠ 0, ymin ≠ 0)


图片中部处的滑窗
Midst:(imageHeight = 1536, imageWidth = 1536, xmin ≠ 0, ymin ≠ 0)

深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image相关推荐

  1. 深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》

    深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1< You Only Look Once: Unified, Real-Time Object Detection> Abstra ...

  2. 深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

    深度学习论文阅读目标检测篇(一):R-CNN<Rich feature hierarchies for accurate object detection and semantic segmen ...

  3. 深度学习论文: Computer Vision for Road Imaging and Pothole Detection: A State-of-the-Art Review

    深度学习论文: Computer Vision for Road Imaging and Pothole Detection: A State-of-the-Art Review of Systems ...

  4. 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》

    深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...

  5. [深度学习论文笔记]医学图像分割U型网络大合集

    [深度学习论文笔记]医学图像分割U型网络大合集 2015 U-Net: Convolutional Networks for Biomedical Image Segmentation (MICCAI ...

  6. 深度学习论文阅读目标检测篇(二):Fast R-CNN《Fast R-CNN》

    深度学习论文阅读目标检测篇(二):Fast R-CNN<Fast R-CNN> Abstract 摘要 1. Introduction 引言 1.1 RCNN and SPPnet 1.2 ...

  7. 深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization

    深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization PaDiM: ...

  8. Github标星24k,127篇经典论文下载,这份深度学习论文阅读路线图不容错过

    作者  | Floodsung 翻译 | 黄海广 来源 | 机器学习初学者(ID:ai-start-com) [导读]如果你是深度学习领域的新手,那么你可能会遇到的第一个问题是"我应该从哪篇 ...

  9. 深度学习论文阅读路线图

    https://www.toutiao.com/a6703859415763649031/ 作者:floodsun编译:ronghuaiyang 这是作者一年前整理的东西,有些最新的论文没有包含进去, ...

最新文章

  1. vs 添加ico图 到资源
  2. swift 通知中心 进入后台多久会通知用户关闭此功能
  3. 如何创建可变数量的变量?
  4. System Memory Management in Windows CE .NET
  5. 1063. Set Similarity (25)
  6. win7 一些快捷系统工具命令
  7. html font后面跟多种字体
  8. C#中 out、ref、params 修饰符使用方法
  9. 精品软件 推荐 常用软件 游戏的 运行库 下载 合集 3D game 玩游戏的一定要收藏一下。...
  10. pcl求平面法向量_PCL自动求解平面法向量参数化表示
  11. stm32f1系列直接存储器存取---DMA
  12. Beyond Compare 4 “授权秘钥已被吊销“ 的解决办法
  13. python3 列表list 内置函数
  14. 文本框只能输入数字、字母,屏蔽粘贴
  15. 虚拟服务器lan网段地址,lan侧服务器ip地址
  16. python3里复数的算法_Python高级复数算法
  17. 地下通信管道的管孔都快占满了,新增光缆怎么布放?
  18. LVGL (8) 绘制流程
  19. 计算机批量制作邀请函步骤,如何利用Word批量制作邀请函
  20. 软通动力:电子签是HR数字化的重要抓手

热门文章

  1. 错误1068:依赖服务或组无法启动
  2. 【苹果CMS技术教程】苹果CMSV10宝塔全自动定时采集教程
  3. 设计模式学习笔记(C++实现)(七)--适配器模式
  4. 【文件格式_XML_HTML_】XML、HTML文件
  5. 一些比较实用的书籍推荐
  6. 利用K-means进行图像压缩
  7. python里面bif是啥意思_什么是BIF?
  8. .NET Core Onvif协议C#教程系列之XiaoFeng.Onvif组件库
  9. Microsoft Excel 单元格行高和列宽
  10. Linux大事TOP 100