论文:Scale-Aware Trident Networks for Object Detection

Github:https://github.com/TuSimple/simpledet/tree/master/models/tridentnet

图森的工作

论文提出了TridentNet ,基于ResNet-101 的基础骨架网络在coco数据集上达到了单模型48.4的准确性,刷新了coco记录。

论文贡献:

  1. 首次提出感受野(receptive field)对目标检测任务中不同scale大小物体的影响,并进行相关实验验证
  2. 提出了适应于多尺度的目标检测框架TridentNet
  3. 使用参数共享的方法,提出了训练时3个branch,测试时只使用其中一个branch,这样保证推断时不会有额外参数和计算量的增加
  4. 使用ResNet-101的backbone在coco数据集上达到48.4的map

处理多尺度问题的方法:

  1. 图像金字塔,传统的检测算法
  2. 特征金字塔,FPN
  3. 本文的三叉戟网络,分为3个分支,所有的参数都一样,唯一的区别就是膨胀卷积的膨胀率不一样。

膨胀卷积Dilated convolution(空洞卷积Atrous convolution):

假设膨胀率为ds,使用的卷积核大小为3*3,则使用膨胀卷积的感受野大小为3+2*2*(ds-1),

例如,假设

  1. ds=1,表示不进行膨胀,感受野大小为3*3
  2. ds=2,表示进行膨胀,感受野大小为7*7
  3. ds=4,表示进行膨胀,感受野大小为15*15

实验验证,随着感受野的增大,小目标的检测准确性也开始下降,但是大目标的检测准确性开始上升。

TridentNet 网络结构:

TridentNet 模块主要包括3个完全一样的分支,唯一不同的只是膨胀卷积的膨胀率。从上到下,膨胀率分别为1,2,3,分别检测小,中,大的目标。三个分支共享权值。

每个分支的详细结构如下,

在训练过程中,对每一个分支都进行优化。因此,需要对目标的ground truth进行大小测试,

假设,w,h为ground truth的宽,高。Li,ui表示实验中定义的最小的面积和最大的面积。在coco实验中分别为32*32和96*96。

基于此公式实现小的目标走第一个分支,中等目标走第二个分支,大的目标走第三个分支。而不是所有目标都走所有分支。这样就可以进行有针对性的训练。

在测试阶段,只使用中间的那个分支进行推断,然后对结果进行NMS,输出最终的结果。

当然这样做会有一些精度的损失,但是好处就是不会引入额外的参数,不会增加额外的计算量。

实验结果:

Multi-branch ,Weight-sharing, Scale-aware有效性证明:

TridentNet 模块分支个数的实验:

TridentNet 模块在Resnet不同block中的实验:

TridentNet 每个分支中unit个数的实验:

TridentNet 各分支检测结果的评估:

TridentNet 中间分支在coco测试的结果:

coco数据集结果:

总结:

TridentNet 是一种尺度敏感的检测框架,并且训练过程也得进行尺度敏感的训练。检测准确性很高,并且不会有额外的参数,额外的计算量。是对ASPP结构的一种升华。

目标检测网络之三叉戟TridentNet相关推荐

  1. 一种投影法的点云目标检测网络

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 文章导读 本文来源于早期的一篇基于投影法的三维目标检测文章<An Euler-Region-Pr ...

  2. 丢弃Transformer!旷视和西安交大提出基于FCN的端到端目标检测网络

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 本文作者:王剑锋  | 编辑:Amusi https://zhuanlan.zhihu.com ...

  3. 计算机视觉算法——目标检测网络总结

    计算机视觉算法--目标检测网络总结 计算机视觉算法--目标检测网络总结 1. RCNN系列 1.1 RCNN 1.1.1 关键知识点--网络结构及特点 1.1.2 关键知识点--RCNN存在的问题 1 ...

  4. 两阶段3D目标检测网络 SIENet: Spatial Information Enhancement Network for 3D Object Detection from Point Cloud

    本文介绍一篇两阶段的3D目标检测网络:SIENet. 这里重点是理解本文提出的 Hybrid-Paradigm Region Proposal Network 和 Spatial Informatio ...

  5. 详解两阶段3D目标检测网络 Voxel R-CNN:Towards High Performance Voxel-based 3D Object Detection

    本文介绍一篇两阶段的3D目标检测网络:Voxel R-CNN,论文已收录于AAAI 2021. 这里重点是理解本文提出的 Voxel RoI pooling. 论文链接为:https://arxiv. ...

  6. 详解两阶段3D目标检测网络PVRCNN:Point-Voxel Feature Set Abstraction for 3D Object Detection

    在<动手学无人驾驶(4):基于激光雷达点云数据3D目标检测>一文中介绍了3D目标检测网络PointRCNN.今天介绍该作者新提出的3D检测模型:PVRCNN,论文已收录于CVPR2020. ...

  7. 目标检测网络中的 bottom-up 和 top-down理解

    看目标检测网络方面的论文时,出现了一组对比词汇: bottom-up和top-down,查了一些资料,结合个人理解,得到的看法是: top-down: 顾名思义是自上而下进行,最初来源于行人检测框架, ...

  8. 深度学习目标检测网络个人总结

    学习目标检测有一年了,从论文学习到工程实践,个人的认识得到了一定提升,大致总结一下. 目标检测是深度学习的图像处理一个方向,还有其他方向比如实例分割(找出目标并得到掩膜).语义分割(每一个像素属于什么 ...

  9. RefineDetLite:腾讯提出轻量级高精度目标检测网络

    点击我爱计算机视觉标星,更快获取CVML新技术 前几天腾讯公布了一篇论文RefineDetLite: A Lightweight One-stage Object Detection Framewor ...

最新文章

  1. 图的广度优先遍历算法流程图
  2. 2016年ADAS行业发展潜力及行业发展趋势分析【图】
  3. Linux的基本指令--服务器
  4. scala集合fold实例:将两个Map合并
  5. python决策树id3算法_决策树ID3算法预测隐形眼睛类型--python实现
  6. java得到文件创建时间linux,linux java获取文件创建时间
  7. Matlab矩阵替换所有等于某个值的数
  8. java 7.0 特性_JDK7.0语法新特性
  9. 使用 Intellij Idea 打包 java 工程为可执行 jar 包
  10. java 中断代码_你的java代码可中断吗?(2)
  11. Win7提示文件太大无法放入回收站怎么办
  12. ARM公司的Cortex-M0概况介绍
  13. python获取动态更新的数据_python3+beautifulsoup动态数据获取想要的内容
  14. LCD12864驱动显示程序
  15. 从Log4j迁移到LogBack的理由
  16. 记一个embed嵌入flash、mp4播放视频
  17. Vulkan 多线程渲染
  18. 编程序找出1000之内的所有完数
  19. java1.8离线安装包_离线安装JDK1.8
  20. 【X3D: Expanding Architectures for Efficient Video Recognition】

热门文章

  1. Spring报错:Exception encountered during context initialization - cancelling refresh attempt: org.sprin
  2. Python——飞机大战
  3. PV、UV、VV、IP及其关系与计算
  4. c程序设计语言k amp rpdf6,Adaptive Interpupillary Distance Adjustment for Stereoscopic 3D Visualization...
  5. echarts地图/中国
  6. 【pandas数据清洗与处理】项目5-城市餐饮店铺选址分析
  7. 3.14 python笔记
  8. 前端权限管理方案之精确到按钮级别
  9. ViewModel是如何在配置更改后继续留存数据的
  10. 自主移动机器人常用的导航定位技术及原理