深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image
深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image
The Winning Solution to the iFLYTEK Challenge 2021 Cultivated Land Extraction from High-Resolution Remote Sensing Image
PDF: https://arxiv.org/pdf/2202.10974.pdf
PyTorch代码: https://github.com/shanglianlm0525/CvPytorch
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
1 JiLin-1 image dataset
数据地址:https://pan.baidu.com/s/1_yFbJ6nX1ovOK0_9BZ5Lrg?pwd=1234 提取码:1234
2 Whole Pipeline
Hybrid Task Cascade(HTC)
- backbone: ResNeXt-101-64x4d and Deformable ConvNets v2 (DCN)
- weight initialization: model pretrained for 20 epochs on the COCO dataset
- post-processed: the overlap-tile fusion strategy
- nms: Soft-NMS
此外也有一些其他实验结果:
- Random cropping and InstaBoost的数据增强策略对无效;
- multi-scales test 效果也一般;
- COCO数据集预训练效果要好于ImageNet
3 Overlap-Tile Fusion Strategy
图像切片划分为target area T 和 ignore area, ignore area的左边和上边距离切片边缘2px,当且仅当目标检测框的左上角落到目标区域,该检测框保留;当切片位于图像边缘时,同方向上的ignore area和target area边缘重叠;
4 Data Preprocessing
选择4通道tif文件的RGB三个通道输出小图数据
运用如下图所示的滑窗剪切图片,首先以height_stride的步长向下移动,直至达到图片的下边界,然后以width_stride向右平移一单位,继续以height_stride的步长向下移动,以剪切出小图组成数据集
当滑窗的下边界超出图片的下边界时,停止移动,以图片的下边界作为滑窗的下边界;当滑窗的右边界超出图片的右边界时,停止移动,以图片的右边界作为滑窗的右边界;
在所有滑窗中随机采样组成训练集和验证集,训练集和验证集比例为5:1
在训练与测试模型时,滑窗尺寸为512 x 512,height_stride与width_stride均为512 (滑窗不重叠)
在使用模型输出提交结果时,滑窗尺寸为1536 x 1536,height_stride与width_stride均为1280,然后在后处理过程中运用边界筛选法去除图片重叠的影响
5 数据的后处理
为了解决原始图片被剪切成各个小图时,相关的耕地目标也被切分成了多个部分的问题。我们使用了边界筛选法对预测结果进行后处理
我们设置滑窗尺寸为1536 x 1536,height_stride与width_stride均为1280,以保证每块耕地目标至少会完整的出现在其中一个滑窗之中
因为滑窗从上向下,从左向右剪切,当滑窗的下或右边界超出图片的下或右边界时,以图片的下边界和右边界作为滑窗的下边界和右边界, 所以在图片的下边界一行处的滑窗的框高imageHeight可能小于标准框高1536,右边界一列处的滑窗的框宽imageWidth可能小于标准框宽1536
place_offset_coord.json文件记录了每个滑窗左上角顶点的坐标(xmin,ymin),在图片的左边界处,滑窗xmin = 0,在图片的上边界处,滑窗ymin = 0。 通过(imageHeight, imageWidth, xmin, ymin)可以判断出每一个滑窗的位置
(1)我们定义基础select area为滑窗向下和向右移动一个stride形成的多边形区域,当小图中的预测mask的bbox的左上角的坐标(bboxx, bboxy)落在图中的select area中时则认为耕地目标完整出现在本滑窗中,否则认为耕地目标不完整予以舍弃。
(2)我们定义靠近滑窗左边界或上边界2个像素的区域内为error区域,如果bbox的左上角顶点落在error区域内,我们认为这个bbox内的耕地目标很大概率是被截断的、不完整的。
(3)位于原始图片的上边界和左边界的滑窗,其上边界或左边界没有来自前者的重叠图片,则不舍弃error区域;位于原始图片的下边界和右边界的滑窗,其下边界或右边界没有后续的重叠图片,则合并结果,仅减去error区域。
图片各个滑窗的位置判断与区域选择
四个角处的滑窗
Top-Left:(imageHeight = 1536, imageWidth = 1536, xmin = 0, ymin = 0)
Bottom-Left:(imageHeight < 1536, imageWidth = 1536, xmin = 0, ymin ≠ 0)
Top-Right:(imageHeight = 1536, imageWidth < 1536, xmin ≠ 0, ymin = 0)
Bottom-Right:(imageHeight < 1536, imageWidth < 1536)
四条边界处的滑窗(不包含四个角)
Left-Boundary:(imageHeight = 1536, imageWidth = 1536, xmin = 0, ymin ≠ 0)
Right-Boundary:(imageHeight = 1536, imageWidth < 1536, xmin ≠ 0, ymin ≠ 0)
Top-Boundary:(imageHeight = 1536, imageWidth = 1536, xmin ≠ 0, ymin = 0)
Bottom-Boundary:(imageHeight < 1536, imageWidth = 1536, xmin ≠ 0, ymin ≠ 0)
图片中部处的滑窗
Midst:(imageHeight = 1536, imageWidth = 1536, xmin ≠ 0, ymin ≠ 0)
深度学习论文: Cultivated Land Extraction from High-Resolution Remote Sensing Image相关推荐
- 深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1《 You Only Look Once: Unified, Real-Time Object Detection》
深度学习论文阅读目标检测篇(四)中英文对照版:YOLOv1< You Only Look Once: Unified, Real-Time Object Detection> Abstra ...
- 深度学习论文阅读目标检测篇(一):R-CNN《Rich feature hierarchies for accurate object detection and semantic...》
深度学习论文阅读目标检测篇(一):R-CNN<Rich feature hierarchies for accurate object detection and semantic segmen ...
- 深度学习论文: Computer Vision for Road Imaging and Pothole Detection: A State-of-the-Art Review
深度学习论文: Computer Vision for Road Imaging and Pothole Detection: A State-of-the-Art Review of Systems ...
- 深度学习论文阅读目标检测篇(三):Faster R-CNN《 Towards Real-Time Object Detection with Region Proposal Networks》
深度学习论文阅读目标检测篇(三):Faster R-CNN< Towards Real-Time Object Detection with Region Proposal Networks&g ...
- [深度学习论文笔记]医学图像分割U型网络大合集
[深度学习论文笔记]医学图像分割U型网络大合集 2015 U-Net: Convolutional Networks for Biomedical Image Segmentation (MICCAI ...
- 深度学习论文阅读目标检测篇(二):Fast R-CNN《Fast R-CNN》
深度学习论文阅读目标检测篇(二):Fast R-CNN<Fast R-CNN> Abstract 摘要 1. Introduction 引言 1.1 RCNN and SPPnet 1.2 ...
- 深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization
深度学习论文: PaDiM: a Patch Distribution Modeling Framework for Anomaly Detection and Localization PaDiM: ...
- Github标星24k,127篇经典论文下载,这份深度学习论文阅读路线图不容错过
作者 | Floodsung 翻译 | 黄海广 来源 | 机器学习初学者(ID:ai-start-com) [导读]如果你是深度学习领域的新手,那么你可能会遇到的第一个问题是"我应该从哪篇 ...
- 深度学习论文阅读路线图
https://www.toutiao.com/a6703859415763649031/ 作者:floodsun编译:ronghuaiyang 这是作者一年前整理的东西,有些最新的论文没有包含进去, ...
最新文章
- vs 添加ico图 到资源
- swift 通知中心 进入后台多久会通知用户关闭此功能
- 如何创建可变数量的变量?
- System Memory Management in Windows CE .NET
- 1063. Set Similarity (25)
- win7 一些快捷系统工具命令
- html font后面跟多种字体
- C#中 out、ref、params 修饰符使用方法
- 精品软件 推荐 常用软件 游戏的 运行库 下载 合集 3D game 玩游戏的一定要收藏一下。...
- pcl求平面法向量_PCL自动求解平面法向量参数化表示
- stm32f1系列直接存储器存取---DMA
- Beyond Compare 4 “授权秘钥已被吊销“ 的解决办法
- python3 列表list 内置函数
- 文本框只能输入数字、字母,屏蔽粘贴
- 虚拟服务器lan网段地址,lan侧服务器ip地址
- python3里复数的算法_Python高级复数算法
- 地下通信管道的管孔都快占满了,新增光缆怎么布放?
- LVGL (8) 绘制流程
- 计算机批量制作邀请函步骤,如何利用Word批量制作邀请函
- 软通动力:电子签是HR数字化的重要抓手