[论文笔记] Oriented R-CNN 阅读笔记
Oriented R-CNN 阅读笔记
- Oriented R-CNN for Object Detection(ICCV 2021)
- 摘要
- 引言
- Oriented R-CNN
- Oriented RPN
- Midpoint Offset Representation
- Loss Function
- Oriented R-CNN Head
- Rotated RoIAlign
- 实验结果
- 召回率
- DOTA数据集上与SOTA的对比
- HRSC2016数据集上与SOTA的对比
- DOTA数据集上速度与准确率对比
Oriented R-CNN for Object Detection(ICCV 2021)
论文链接:论文链接
代码链接:代码链接
摘要
- 传统two-stage检测器通过产生oriented proposals来进行OBB检测,十分耗时
- Oriented R-CNN是一个two-stage检测器:第一个stage使用oriented RPN产生高质量OBB;第二个stage是oriented R-CNN head用来细化oriented RoIs并进行识别
- DOTA上75.87%mAP,HRSC2016 96.50%mAP,1024×1024图片在RTX 2080Ti上有15.1FPS
引言
- 产生oriented proposals的三种方案
Oriented R-CNN
Oriented RPN
- 编码:Oriented RPN 网络输出 offset δ=(δx,δy,δw,δh,δα,δβ)\delta=(\delta_x,\delta_y,\delta_w,\delta_h,\delta_\alpha,\delta_\beta)δ=(δx,δy,δw,δh,δα,δβ),因此特征图上的每一个点有 6A 个输出(A是每个点上的anchor数目)
- 解码:(所有的参数含义可以从上面那张结构图里面知道)
Midpoint Offset Representation
Loss Function
- p∗∈{0,1}p^*\in \{0,1\}p∗∈{0,1} 表示每一个anchor属于一个正样本或者负样本,pi∗p^*_ipi∗表示该anchor对应的gt的真实label,δi\delta_iδi 和 ti∗t^*_iti∗分别表示预测的OBB和真实的OBB
- 获得的预测box可能带有仿射变换,如下图
Oriented R-CNN Head
Rotated RoIAlign
- 将上述蓝色框较短的对角线延长至和较长对角线一样的长度,得到一个矩形框
- 将oriented rectangular投影到stride为 sss 的特征图 FFF 上,然后通过RoI操作进行特征提取得到最右边的规格为 m×mm×mm×m 的特征图 F′F'F′ (mmm 默认为7)
- 特征图 F′F'F′ 的第 ccc 通道上的点 (i,j)(i, j)(i,j) 用以下公式计算
其中 FcF_cFc 是第 ccc 个通道的特征,nnn 是每个网格内定位的样本数, area(i,j)area(i,j)area(i,j)是包含在索引 (i,j)(i,j)(i,j) 的网格中的坐标集,R(⋅)R(·)R(⋅) 是一个旋转变换
实验结果
召回率
- 分别在每张图片中选择top-300、top-1000、top-2000个最高得分的proposals用 R300、R1000、R2000R_{300}、R_{1000}、R_{2000}R300、R1000、R2000 表示,结果如下图
DOTA数据集上与SOTA的对比
HRSC2016数据集上与SOTA的对比
DOTA数据集上速度与准确率对比
[论文笔记] Oriented R-CNN 阅读笔记相关推荐
- linux软raid阅读笔记,linux_软RAID阅读笔记.pdf
linux_软RAID阅读笔记.pdf RAID 读笔记 前言 1 1 RAID 概述 1 1.1 RAID 在linux 内核中的位置 2 1.2 mdadm 3 1.3 参考文献 3 2 RAID ...
- 2021年CVPR论文Deep Two-View Structure-from-Motion Revisited阅读笔记
这篇博客分享的是2021年发表于CVPR上的一篇论文<Deep Two-View Structure-from-Motion Revisited>.该论文使用深度学习的方法,按照经典的 ...
- 【论文笔记】Swin-Transformer系列阅读笔记
一.Swin Transformer V1 paper:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows ...
- Qt工作笔记-Qt文档阅读笔记-qualifiedName()的官方解析及XML使用名称空间
目录 官方解析 博主例子 官方解析 QXmlStreamReader::qualifiedName() 返回StartElement或EndElement的限制名: 限制名是XML数据中元素的原始名称 ...
- Qt工作笔记-Qt文档阅读笔记-setMouseTracking(无需按下移动使得widget获取鼠标位置)
目录 官方解析如下 小栗子 官方解析如下 这个属性说明在widget上鼠标的轨迹是否被开启. 如果鼠标轨迹估计被关闭(默认是关闭的)widget只能接收鼠标按下并且移动后的这种鼠标移动事件. 如果轨迹 ...
- 论文阅读笔记之——《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》
本博文是文章<Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform&g ...
- VINS-Mono代码阅读笔记(十四):posegraph的存储和加载
本篇笔记紧接着VINS-Mono代码阅读笔记(十三):posegraph中四自由度位姿优化,来分析位姿图的存储和加载. 完整(也是理想的)的SLAM的使用应该是这样的:搭载有SLAM程序的移动设备在一 ...
- Android 笔记之 R 文件
Android笔记之R文件 阅读目录 介绍 R 文件的内容 介绍 通过 R 文件引用资源 一.R 文件的内容 在 Android Studio 中 R 文件位于 app -> build -&g ...
- VINS-Mono代码阅读笔记(十):vins_estimator中的非线性优化
本篇笔记紧接着VINS-Mono代码阅读笔记(九):vins_estimator中的相机-IMU对齐,初始化完成之后就获得了要优化的变量的初始值,后边就是做后端优化处理了.这部分对应论文中第VI部分, ...
- 《Java疯狂讲义》第3章(数据类型和运算符):博主李俊德的阅读笔记与知识拓展
一.问题背景 博主在准备应聘的笔试.面试时,再次采用了多年以来的Java工具书<Java疯狂讲义>,并决定在每章详细复习后都要在博客中写下详细的阅读笔记. 二.阅读笔记与知识拓展--< ...
最新文章
- 异步方法顺序调用问题
- Python使用sklearn构建广义线性模型:gamma回归(Gamma regression)实战
- 42、谈谈你对闭包的理解?
- Toast 消息框应用。
- MySQL在Windows和Linux减少数据库
- 高等数学(工本)选择题
- 关于office2010的mso问题和卸载重装问题
- 移动硬盘插入提示需要格式化RAW_使用驱动器X:中的光盘之前需要将其格式化
- 正则表达式, email格式验证,邮箱地址验证
- 计算机专业助我成长作文600,梦想助我成长作文600字
- Java实现阿拉伯数字转换成中文大写数字,以及中文大写数字到阿拉伯数字的转换。
- ai条码插件免安装_AI条形码插件(含支持Illustrator cs6的条码脚本插件)
- 成长,没你想象的那么迫切!
- ubuntu20.05+GTX1050Ti驱动+CUDA10.2+CUDNN8+pytorch最后OK
- 1.计算机发展阶段 计算机发展历史 机械式计算机 机电式计算机 电子计算机 逻辑电路与计算机 二极管 电子管 晶体管 硅 门电路 计算机 电磁学计算机二进制...
- 厉害了,学霸利用贪心算法找偷车贼
- (PMP)三、项目经理的角色
- cadence16.6出odb++出不出来
- 如何进行seo搜索引擎优化(搜索引擎SEO优化)
- 关于IDEL中的全局搜索不显示该有的类的解决办法之一
热门文章
- 百度飞桨图像分类------第三天(实现蝴蝶图像分类)
- Revit:放置标高和轴网方法总结
- Springboot整合Mybatis Plus
- mysql数据库表损坏修复方法(适用虚拟主机)
- 计算机应用的高级职称,职称计算机应用能力要求相关政策规定
- C++小病毒(VS版)
- Unity3d 接入VKSDK登陆和分享 IOS篇
- python折叠次数计算、一张纸5毫米_一张纸折叠多次后会怎样?计算机模拟得出,它能突破宇宙范围...
- 做什么事都要有风险意识
- SOJ 4583 动态规划之分组背包