Oriented R-CNN 阅读笔记

  • Oriented R-CNN for Object Detection(ICCV 2021)
    • 摘要
    • 引言
    • Oriented R-CNN
      • Oriented RPN
        • Midpoint Offset Representation
        • Loss Function
      • Oriented R-CNN Head
        • Rotated RoIAlign
    • 实验结果
      • 召回率
      • DOTA数据集上与SOTA的对比
      • HRSC2016数据集上与SOTA的对比
      • DOTA数据集上速度与准确率对比

Oriented R-CNN for Object Detection(ICCV 2021)

论文链接:论文链接
代码链接:代码链接

摘要

  • 传统two-stage检测器通过产生oriented proposals来进行OBB检测,十分耗时
  • Oriented R-CNN是一个two-stage检测器:第一个stage使用oriented RPN产生高质量OBB;第二个stage是oriented R-CNN head用来细化oriented RoIs并进行识别
  • DOTA上75.87%mAP,HRSC2016 96.50%mAP,1024×1024图片在RTX 2080Ti上有15.1FPS

引言

  • 产生oriented proposals的三种方案

Oriented R-CNN

Oriented RPN

  • 编码:Oriented RPN 网络输出 offset δ=(δx,δy,δw,δh,δα,δβ)\delta=(\delta_x,\delta_y,\delta_w,\delta_h,\delta_\alpha,\delta_\beta)δ=(δx​,δy​,δw​,δh​,δα​,δβ​),因此特征图上的每一个点有 6A 个输出(A是每个点上的anchor数目)
  • 解码:(所有的参数含义可以从上面那张结构图里面知道)

Midpoint Offset Representation

Loss Function

  • p∗∈{0,1}p^*\in \{0,1\}p∗∈{0,1} 表示每一个anchor属于一个正样本或者负样本,pi∗p^*_ipi∗​表示该anchor对应的gt的真实label,δi\delta_iδi​ 和 ti∗t^*_iti∗​分别表示预测的OBB和真实的OBB

  • 获得的预测box可能带有仿射变换,如下图

Oriented R-CNN Head

Rotated RoIAlign

  • 将上述蓝色框较短的对角线延长至和较长对角线一样的长度,得到一个矩形框

  • 将oriented rectangular投影到stride为 sss 的特征图 FFF 上,然后通过RoI操作进行特征提取得到最右边的规格为 m×mm×mm×m 的特征图 F′F'F′ (mmm 默认为7)
  • 特征图 F′F'F′ 的第 ccc 通道上的点 (i,j)(i, j)(i,j) 用以下公式计算
    其中 FcF_cFc​ 是第 ccc 个通道的特征,nnn 是每个网格内定位的样本数, area(i,j)area(i,j)area(i,j)是包含在索引 (i,j)(i,j)(i,j) 的网格中的坐标集,R(⋅)R(·)R(⋅) 是一个旋转变换

实验结果

召回率

  • 分别在每张图片中选择top-300、top-1000、top-2000个最高得分的proposals用 R300、R1000、R2000R_{300}、R_{1000}、R_{2000}R300​、R1000​、R2000​ 表示,结果如下图

DOTA数据集上与SOTA的对比

HRSC2016数据集上与SOTA的对比

DOTA数据集上速度与准确率对比


[论文笔记] Oriented R-CNN 阅读笔记相关推荐

  1. linux软raid阅读笔记,linux_软RAID阅读笔记.pdf

    linux_软RAID阅读笔记.pdf RAID 读笔记 前言 1 1 RAID 概述 1 1.1 RAID 在linux 内核中的位置 2 1.2 mdadm 3 1.3 参考文献 3 2 RAID ...

  2. 2021年CVPR论文Deep Two-View Structure-from-Motion Revisited阅读笔记

      这篇博客分享的是2021年发表于CVPR上的一篇论文<Deep Two-View Structure-from-Motion Revisited>.该论文使用深度学习的方法,按照经典的 ...

  3. 【论文笔记】Swin-Transformer系列阅读笔记

    一.Swin Transformer V1 paper:Swin Transformer: Hierarchical Vision Transformer using Shifted Windows ...

  4. Qt工作笔记-Qt文档阅读笔记-qualifiedName()的官方解析及XML使用名称空间

    目录 官方解析 博主例子 官方解析 QXmlStreamReader::qualifiedName() 返回StartElement或EndElement的限制名: 限制名是XML数据中元素的原始名称 ...

  5. Qt工作笔记-Qt文档阅读笔记-setMouseTracking(无需按下移动使得widget获取鼠标位置)

    目录 官方解析如下 小栗子 官方解析如下 这个属性说明在widget上鼠标的轨迹是否被开启. 如果鼠标轨迹估计被关闭(默认是关闭的)widget只能接收鼠标按下并且移动后的这种鼠标移动事件. 如果轨迹 ...

  6. 论文阅读笔记之——《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》

    本博文是文章<Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform&g ...

  7. VINS-Mono代码阅读笔记(十四):posegraph的存储和加载

    本篇笔记紧接着VINS-Mono代码阅读笔记(十三):posegraph中四自由度位姿优化,来分析位姿图的存储和加载. 完整(也是理想的)的SLAM的使用应该是这样的:搭载有SLAM程序的移动设备在一 ...

  8. Android 笔记之 R 文件

    Android笔记之R文件 阅读目录 介绍 R 文件的内容 介绍 通过 R 文件引用资源 一.R 文件的内容 在 Android Studio 中 R 文件位于 app -> build -&g ...

  9. VINS-Mono代码阅读笔记(十):vins_estimator中的非线性优化

    本篇笔记紧接着VINS-Mono代码阅读笔记(九):vins_estimator中的相机-IMU对齐,初始化完成之后就获得了要优化的变量的初始值,后边就是做后端优化处理了.这部分对应论文中第VI部分, ...

  10. 《Java疯狂讲义》第3章(数据类型和运算符):博主李俊德的阅读笔记与知识拓展

    一.问题背景 博主在准备应聘的笔试.面试时,再次采用了多年以来的Java工具书<Java疯狂讲义>,并决定在每章详细复习后都要在博客中写下详细的阅读笔记. 二.阅读笔记与知识拓展--< ...

最新文章

  1. 异步方法顺序调用问题
  2. Python使用sklearn构建广义线性模型:gamma回归(Gamma regression)实战
  3. 42、谈谈你对闭包的理解?
  4. Toast 消息框应用。
  5. MySQL在Windows和Linux减少数据库
  6. 高等数学(工本)选择题
  7. 关于office2010的mso问题和卸载重装问题
  8. 移动硬盘插入提示需要格式化RAW_使用驱动器X:中的光盘之前需要将其格式化
  9. 正则表达式, email格式验证,邮箱地址验证
  10. 计算机专业助我成长作文600,梦想助我成长作文600字
  11. Java实现阿拉伯数字转换成中文大写数字,以及中文大写数字到阿拉伯数字的转换。
  12. ai条码插件免安装_AI条形码插件(含支持Illustrator cs6的条码脚本插件)
  13. 成长,没你想象的那么迫切!
  14. ubuntu20.05+GTX1050Ti驱动+CUDA10.2+CUDNN8+pytorch最后OK
  15. 1.计算机发展阶段 计算机发展历史 机械式计算机 机电式计算机 电子计算机 逻辑电路与计算机 二极管 电子管 晶体管 硅 门电路 计算机 电磁学计算机二进制...
  16. 厉害了,学霸利用贪心算法找偷车贼
  17. (PMP)三、项目经理的角色
  18. cadence16.6出odb++出不出来
  19. 如何进行seo搜索引擎优化(搜索引擎SEO优化)
  20. 关于IDEL中的全局搜索不显示该有的类的解决办法之一

热门文章

  1. 百度飞桨图像分类------第三天(实现蝴蝶图像分类)
  2. Revit:放置标高和轴网方法总结
  3. Springboot整合Mybatis Plus
  4. mysql数据库表损坏修复方法(适用虚拟主机)
  5. 计算机应用的高级职称,职称计算机应用能力要求相关政策规定
  6. C++小病毒(VS版)
  7. Unity3d 接入VKSDK登陆和分享 IOS篇
  8. python折叠次数计算、一张纸5毫米_一张纸折叠多次后会怎样?计算机模拟得出,它能突破宇宙范围...
  9. 做什么事都要有风险意识
  10. SOJ 4583 动态规划之分组背包