[paper reading] CornerNet

GitHub:Notes of Classic Detection Papers

本来想放到GitHub的,结果GitHub不支持公式。
没办法只能放到CSDN,但是格式也有些乱
强烈建议去GitHub上下载源文件,来阅读学习!!!这样阅读体验才是最好的
当然,如果有用,希望能给个star

topic motivation technique key element math use yourself relativity
CornerNet Problem to Solve
KeyPoints (Anchor-Free)
CornerNet
Stacked Hourglass Network
Prediction Module
Corner Pooling
Why CornerNet Better?
Why Corner Pooling Works
Grouping Corners
Getting Bounding Box
Data Augmentation
Ablation Experiments
Loss Function
Corner Pooling Math
Network Design
Interpretability
Divide Task
TTA
Two-Stage
One-Stage

文章目录

  • [paper reading] CornerNet
    • Motivation
      • Problem to Solve
      • KeyPoints (Anchor-Free)
    • Technique
      • CornerNet
        • Idea
        • Architecture
        • Components
      • Stacked Hourglass Network
        • Components
        • Hourglass Module
        • Advantage
        • Improvement & Settings
        • Details
      • Prediction Module
      • Corner Pooling
    • Key Element
      • Why CornerNet Better?
      • Why Corner Pooling Works
      • Grouping Corners
      • Getting Bounding Box
      • Data Augmentation
        • Training
        • Testing
      • Ablation Experiments
        • Corner Pooling
        • Stability of Corner Pooling over Larger Area
        • Reducing Penalty to Negative Locations
        • Hourglass Network Works
        • Quality of the Bounding Boxes
        • Error Analysis
        • Compared to SOTA
    • Math
      • Loss Function
        • Detection Loss
        • Offset Loss
        • Pull Loss
        • Push Loss
      • Corner Pooling Math
    • Use Yourself
      • Network Design
      • Intuition & Interpretability
        • Interpretability For Delicate Motivation
        • Anchor-Based or Anchor-Free
      • Divide Task
      • TTA
    • Related Work
      • Two-Stage
        • R-CNN
        • SPP & Fast-RCNN
        • Faster RCNN
        • R-FCN
        • DeNet
      • One-Stage
        • YOLO
        • SSD
        • DSSD & RON
        • RetinaNet
        • RefineDet
        • Point Linking Network(PLN)
    • Blogs

Motivation

Problem to Solve

anchor的使用会带来一些弊端

  1. 需要大量的anchor

    以确保ground-truth box的覆盖率

    这会导致极端的正负样本不平衡,导致训练低效网络退化

  2. 引入许多的hyperparametersdesign choice

    以确保模型对于各种scale和ratio的object都具有良好的基准

    这在multi-scale的architecture中会更复杂(比如SSD和RetinaNet)

KeyPoints (Anchor-Free)

即:使用一对KeyPoints表示一个bounding box

Technique

CornerNet

Idea

使用一对KeyPoints表示一个bounding box

Architecture

Pipeline of CornerNet

![在这里插入图片描述](https://img-blog.csdnimg.cn/20201107155004176.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQxNjgzMDY1,size_16,color_FFFFFF,t_70#pic_center)

Overview of CornerNet

Detailed Architecture of CornerNet

Components

  • backbone
  • 2 prediction module

Stacked Hourglass Network

Components

Stacked Hourglass Network = 2 Hourglass Module ==> ×4 downsampleing

Hourglass Module

每个box都是一个residual module

hourglass module对输入的feature map进行5层下采样和上采样,通过skip connection恢复细节信息

Hourglass Module对于细节信息的恢复,和Feature Pyramid Network的思路是一样

Advantage

Hourglass Network 可以作为 object detention理想选择

  1. 是一个single unified structure
  2. 可以同时获得 globallocalfeature
  3. 多个hourglass module的堆叠可以提取到higher-level的信息

Improvement & Settings

本文使用2个hourglass module构成hourglass network

改进如下:

  • 弃用max pooling,使用stride=2的卷积层降低feature的分辨率

    在实验中,resolution降低5次,对应upsampling也是5次

  • intermediate supervision

    类似GoogLeNet到的auxiliary classifiergradient injection

Details

  • upsample

    2个residual module,后面再跟nearest neighbor upsampling

  • skip connection

    每个skip connection也包括2个residual module

    (注意2个residual module的位置)

  • hourglass module & residual module

    每个hourglass module都有4个通道数为512的residual module

  • pre down-sampling

    • 7×77×77×7 Conv,stride=2,channel=128
    • residual block,stride=2,channel=256
  • connection between hourglass modules

    1. 第一个hourglass moduleInputoutput,都经过一个 1×1 Conv-BN

    2. 将第1步的结果,进行对应元素的相加,在经过1个256 channel的residual block

    3. 将第2步的结果,作为第二个hourglass module的输入

  • prediction

    仅使用最后一层feature map(不使用Feature Pyramid)

Prediction Module

  • heatmap

    top-left cornerbottom-right corner分别预测一个heatmap ==> 本质是一个binary mask,表明每个location是不是该类的corner

    其维度为 H×W×CH×W×CH×W×C KaTeX parse error: Expected '}', got '_' at position 13: (\text{batch_̲size}, 128, 128…,其中 HHHWWW输入image的sizeCCCforeground的类别数

    heatmap的通道数foreground的类别数,是因为不需要对background寻找corner(当然分类时还是需要将background作为一类

    ==> 用以表示cornerlocation

    可能产生的错误类型:

    一堆corner任何一个的丢失,会导致这个object的丢失(这也是为什么只选择2个corner而不是4个corner来表示object)

  • embedding

    对每个检测到的corner预测一个embedding vector

    其维度为 H×W×1H×W×1H×W×1 KaTeX parse error: Expected '}', got '_' at position 13: (\text{batch_̲size}, 128, 128…

    ==> 用以使得同一个object的cornerembedding distance尽可能嵌入到子空间的同一位置

    可能产生的错误类型:

    错误的embedding,会导致false bounding box

  • offset

    每个corner预测一个offset

    其维度为 H×W×2H×W×2H×W×2 KaTeX parse error: Expected '}', got '_' at position 13: (\text{batch_̲size}, 128, 128…

    ==> 用以调整bounding boxcoordinate

    可能产生的错误类型:

不准确的offset,会导致松散的bounding box

Corner Pooling

Corner Pooling的输出不是直接用于heatmapembeddingoffset的预测

  • Introduction

    一种pooling layer,获得corner信息的更好表示

  • Operation

    由于corner都是在object之外,所以无法通过local evidence寻找corner

    所以,采用以下的方式确定corner:

    • top-left corner:向左看确定上边界向上看确定左边界
    • bottom-right corner:向右看确定下边界向下看确定右边界

    top-left为例子,是分别选取2个feature map,分别在2个方向上进行max pooling

    bottom-right pooling仅仅是向量的坐标范围pooling的方向)不同)

    Overview of Corner Pooling

    image-20201028203544314

    Details of Corner Pooling (gary layer: 3×3 Conv-BN-ReLU)

    image-20201028200707123

    Example of Corner Pooling
  • Math Formulation

    公式表述见 [Corner Pooling Math](#Corner Pooling Math)

Key Element

Why CornerNet Better?

  • corner仅仅依赖2个边来确定(而center需要4个边来确定)==> 丢失object的情况会减轻

  • corner pooling 可以encode一些corners的先验知识

  • corners对于box的表示效率高

    O(wh)O(wh)O(wh) 的corners可以表示 O(w2h2)O(w^2h^2)O(w2h2) 的box

Why Corner Pooling Works

有2点有待于实验验证:

  • Corner Pooling的2个输入feature map的区别
  • Stacked Hourglass Network的输出feature map到底长啥样

需要注意:corner pooling只是model的一部分,其不负责从image中提取feature map,其**结果也不是直接用于prediction(后续还有处理),**我个人理解为“corner pooling只是获得了对corner的更好的representation”,仅此而已。

总结来说,我认为有3点:

  • Stacked Hourglass Network本质上是一个KeyPoint Estimation Network,进行的是per-pixel的dense prediction,已经能初步获得corner location的estimation

  • Corner Pooling作为一种pooling操作,实现了pixel信息的空间位置的转移,将Hourglass Network估计的信息汇聚到corner的位置上,获得corner的更好的representation

  • 使用2个独立的feature map,降低了2路信号的相关性,使得feature map更专注于单个direction的edge信息

    这是因为一个cornertop-left / bottom-right)必然有2路独立的信息来源


Corner Pooling本质上是对于feature map的一种pooling操作

要理解Corner Pooling的作用,首先要了解feature map的含义

CornerNetbackboneStacked Hourglass NetworkCorner Pooling的输入就是Stacked Hourglass Network的输出

Stacked Hourglass Network本质上是一个KeyPoint Estimation Network,进行的是per-pixel的dense prediction

具体来说,我认为Stacked Hourglass Network已经能初步获得corner location的estimation

换句话说,其每个pixel(location)都具有相对完整的信息,这个单独的pixel理论上就可以拿去做后续的操作了(而不是像Classification一样需要整张图片才能表示完整的信息)

所以说,Corner Pooling是实现了pixel信息的空间位置的转移,获得corner的更好的representation(原文的描述是 “help better locate corners”)

关于Stacked Hourglass Network能在每个pixel上表示什么信息,我认为是可以表示edge(尤其是顶点)的信息的。因为Stacked Hourglass Network本身就是非常复杂且完备的KeyPoint Estimation Network,经过训练我觉得可以表示edge(尤其是顶点)的信息的

此外,corner pooling会使用2个独立的feature map,来分别预测top-mostleft-most,类似于2个方向的边缘检测算子的输出。corner的确定必然有2个独立的信息来源!如果使用同一个feature map的话,其最大激活值的位置在corner pooling后依旧还会是最大值,其信息具有很强很强的相关性,corner pooling就失去了意义!

关于“次极大值被抑制”的问题:

multi-object image来看,如果在Max Pooling的较前位置出现了极大值,会导致较后位置的次极大值被抑制(如下图所示)

但实际中不会出现这样的问题,原因如下:

最终corner的location的确定,是对两个Max Pooling方向的支路的element-wise的相加。换句话说,corner的位置由两个支路的信息确定

一个支路的corner信息被抑制另一个支路依旧会独立检测出corner信息,从而共同确定corner的location

为了画图方便,我们对Corner Pooling的两个支路输入相同的feature map(作图有很多不恰当的地方,仅为了说明思路)

可以看到水平方向的支路中,左侧object的corner信息被抑制了,而垂直方向的支路正常

将二者相加后:

可以看到,当水平支路的corner信息被抑制,垂直支路依旧会独立检测出corner信息,从而共同确定corner的location

当然,2个支路的corner极值都被抑制的时候,自然是无法检测到这个corner。

不过鉴于corner所占的位置很小,所以这种事情发生的概率也很小(所以corner pooling 在 small & large area 都是 effective & stable

Grouping Corners

根据cornersembedding distance对corners进行分组

同一组的cornerembedding distance应该小

Getting Bounding Box

NMS ==> top-100 ==> offset ==> grouping ==> reject ==> score

测试时,根据heatmapembeddingoffset生成bounding box

  1. corner heatmap进行NMS3×3 max pooling

  2. corner heatmap中选取top-100的corner

  3. 根据offset微调corner location

  4. 计算corners的embeddingL1 distance

  5. 拒绝两类corner pair

    • distance > 0.5
    • corners来自不同的category
  6. 计算detection score

    top-left cornerbottom-right cornerscore取平均

Data Augmentation

Training

  • horizontal filpping

  • scaling

  • croping

  • color jittering

    • brightness(亮度)
    • saturation(饱和度)
    • constrast(对比度)

Testing

  • 保留原始分辨率,补零到511×511(输出维度为128×128)
  • original & filpped
    1. 汇聚二者的的detection
    2. soft-nms抑制冗余的detection
    3. 取top-100的detection

Ablation Experiments

Corner Pooling

corner pooling对于中目标和小目标的提升大

Stability of Corner Pooling over Larger Area

corner pooling 在 small & large area 都是 effective & stable

area范围的由来:

  • corner pooling仅作用于 14\frac1441 圆周(四个象限之一)
  • 根据 (i,j)(i,j)(i,j) 的不同,area的范围也不同

Reducing Penalty to Negative Locations

penalty reduction有效(尤其是对于中目标和大目标

原因中目标和大目标对于corner location的要求更低

Hourglass Network Works

有两个结论:

  • backbone的选择很重要
  • hourglassCornerNet的性能很重要

Quality of the Bounding Boxes

CornerNet可以产生质量更高的bounding box

衡量标准:bounding boxobjectIoU

Error Analysis

结论

  1. CornerNet的主要瓶颈detecting corners
  2. detecting cornersgrouping corners 均有提升空间

Compared to SOTA

Math

Loss Function

L=Ldet+αLpull+βLpush+γLoffL = L_{det} + \alpha L_{pull} + \beta L_{push} + \gamma L_{off} L=Ldet+αLpull+βLpush+γLoff

Detection Loss

每个corner只对应一个location的positive其他location均为negative

由于positive附近的点依旧能产生良好的bounding box,故对positive一定radius内的negative降低惩罚

  • radius的确定

    对于不同size的object,要求radius内的一对点,与ground-truth box的IoU大于阈值(实验中阈值设定为0.3

  • 惩罚的减少量

    unnormalized 2D Gaussian确定
    e−x2+y22σ2e^{-\frac{x^2+y^2}{2\sigma^2}} e2σ2x2+y2

    • 中心为positive location
    • σ\sigmaσ 为radius的 13\frac1331

Detection Loss 为 Focal Loss 的变种:
Ldet=−1N∑c=1C∑i=1H∑j=1W{(1−pcij)αlog⁡(pcij)if ycij=1(1−ycij)β(pcij)αlog⁡(1−pcij)otherwise L_{d e t}=\frac{-1}{N} \sum_{c=1}^{C} \sum_{i=1}^{H} \sum_{j=1}^{W}\left\{\begin{array}{cc} \left(1-p_{c i j}\right)^{\alpha} \log \left(p_{c i j}\right) & \text { if } y_{c i j}=1 \\ \left(1-y_{c i j}\right)^{\beta}\left(p_{c i j}\right)^{\alpha} \log \left(1-p_{c i j}\right) & \text { otherwise } \end{array}\right. Ldet=N1c=1Ci=1Hj=1W{(1pcij)αlog(pcij)(1ycij)β(pcij)αlog(1pcij)ifycij=1otherwise

  • ycijy_{cij}ycijunnormalized Gaussian 增强的 ground-truth heatmap

    (1−ycij)(1-y_{cij})(1ycij) 起到降低惩罚的作用

  • pcijp_{cij}pcijheatmap上类别为 ccc(i,j)(i,j)(i,j) 位置的score

  • NNNimage中的object的数目

  • α,β\alpha, \betaα,β :两个起调节作用超参数

Offset Loss

由于降采样image(x,y)(x,y)(x,y)mapheatmap(⌊xn⌋,⌊yn⌋)(\lfloor \frac x n \rfloor,\lfloor \frac y n \rfloor)(nx,ny)

heatmapremapimage时会损失一些精确的信息,这会严重影响small bounding box的IoU

所以要通过offsetcorner location进行微调

offset ok\boldsymbol{o}_{k}ok 为:
ok=(xkn−⌊xkn⌋,ykn−⌊ykn⌋)\boldsymbol{o}_{k}=\left(\frac{x_{k}}{n}-\left\lfloor\frac{x_{k}}{n}\right\rfloor, \frac{y_{k}}{n}-\left\lfloor\frac{y_{k}}{n}\right\rfloor\right) ok=(nxknxk,nyknyk)
Offset Loss 定义为 ok\boldsymbol{o}_{k}oksmooth L1 Loss
Loff=1N∑k=1NSmoothL1Loss(ok,o^k)L_{off} = \frac 1 N \sum_{k=1}^N \text{SmoothL1Loss} (\boldsymbol{o}_{k}, \hat{\boldsymbol{o}}_{k} ) Loff=N1k=1NSmoothL1Loss(ok,o^k)

Pull Loss

使得同一组的cornerembedding distance尽可能embedding相同),即使得 etk=ebk=eke_{t_{k}}=e_{b_k}=e_{k}etk=ebk=ek

Lpull=1N∑k=1N[(etk−ek)2+(ebk−ek)2]L_{p u l l}=\frac{1}{N} \sum_{k=1}^{N}\left[\left(e_{t_{k}}-e_{k}\right)^{2}+\left(e_{b_{k}}-e_{k}\right)^{2}\right] Lpull=N1k=1N[(etkek)2+(ebkek)2]

  • etke_{t_{k}}etk :top-left corner的embedding
  • ebke_{b_k}ebk :bottom-right corner的embedding
  • eke_{k}eketke_{t_{k}}etkebke_{b_k}ebk 的均值

Push Loss

使得不同组corners的embedding distance尽可能大

  • Δ\DeltaΔ :实验中设定为1

Pull Loss 和 Push Lossembedding的角度来看,是使得类内距离小,类间距离大

Corner Pooling Math

tij={max(ftij,t(i+1)j)if i<HftHjotherwise t_{ij}= \left\{\begin{array}{cc} \text{max} (f_{t_{ij}}, t_{(i+1)j}) & \text { if }i<H \\ f_{t_{Hj}} & \text { otherwise } \end{array}\right. tij={max(ftij,t(i+1)j)ftHjifi<Hotherwise

lij={max(flij,t(i+1)j)if j<WftiWotherwise l_{ij}= \left\{\begin{array}{cc} \text{max} (f_{l_{ij}}, t_{(i+1)j}) & \text { if } j<W \\ f_{t_{iW}} & \text { otherwise } \end{array}\right. lij={max(flij,t(i+1)j)ftiWifj<Wotherwise

  • ftf_tftflf_lfl :top-left Corner Pooling的输入feature map
  • ftijf_{t_{ij}}ftijflijf_{l_{ij}}flijftf_tftflf_lfl(i,j)(i,j)(i,j) 处的vector
  • tijt_{ij}tij :在 ftf_tft(i,j)(i,j)(i,j)(i,H)(i,H)(i,H) 进行max pooling的结果
  • lijl_{ij}lij :在 $f_l $ 的 (i,j)(i,j)(i,j)(W,j)(W,j)(W,j) 进行max pooling的结果

上面两个式子都是一种递归调用ftHjf_{t_{Hj}}ftHj 作为 tijt_{ij}tij递归边界ftiWf_{t_{iW}}ftiW 作为 lijl_{ij}lij递归边界

表明从边界向点 (i,j)(i,j)(i,j) 计算max-pooling

Use Yourself

Network Design

网络的基本组件(卷积层、residual block,Inception module等)都可以服务于特定的设计目的,这种思路跟搭积木很像

举几个例子:

Faster-RCNN 的 RPN

RetinaNet的FPN

CornerNet 的 prediction module

从这3个例子可以看到,网络的设计思路在这里起到了很重要的作用

这是一种自顶向下的设计思路,是确定网络的功能,再通过具体的组件去实现所设计的功能

所以说,“直接套用之前论文中设计好的子网络”是一种错误的想法,真正的正确的思路应该是“从论文中学习设计思路

甚至从更广义来说,backbone也不是让你拿过来就用的

  • 一方面,需要对backbone进行修改,以适应后续的操作

  • 另一方面,backbone中蕴含的设计思路比backbone本身更有意义

Intuition & Interpretability

Interpretability For Delicate Motivation

回顾detection的发展,可以看出其对于网络结构和feature map可解释性和理解深度的要求是逐渐加深的,只有这样才能设计出更巧妙更精致的方法

从对feature map的理解上看

  • Faster-RCNN

    Faster-RCNN作为two-stage方法,思路是proposal + classification

    Faster-RCNN甚至不需要去关注image中的object会对应到feature map的什么位置,因为其在feature map上进行的是 dense & grid 的饱和式采样

    这种思路其实是将feature map视作了黑箱

  • YOLO v1

    YOLO v1 作为首个one-stage方法,使用regression的方法进行detection

    YOLO v1在classification上有segmentation的意味

    这使得我们必须要知道,image中的object会对应到feature map的什么位置

    这在image和feature map的location relationship上迈出了关键一步

  • SSD

    SSD作为one-stage的方法,使用了multi-scale的feature maps

    SDD主要回答了2个问题

    1. 使用不同level的feature map进行detection有什么区别?
    2. 使用多个level的feature map是否会提高detection的性能?

    具体来说

    • 对于第一个问题:SSD证明了不同level的feature map具有不同的detailed/location information和semantic information,且二者为负相关的关系(即detailed/location information和semantic information难以兼顾

    • 对于第二个问题:SSD进行了feature map的multi-scale,证明了结合不同stage的feature map可以提高detection的性能

    SSD其实提出了 Feature Pyramid Network 的雏形。但SSD为了保证feature map的strong semantic,将使用的所有feature map都限制在了low-resolution(即使用backbone的输出作为pyramid的第一层

    SSD真正去关注了feature map到底represent了什么信息,以及其representation能力随stage的变化情况

  • RetinaNet

    RetinaNet使用了完整的FPN,不再将feature map限制在low-resolution上,实现了在high-resolution上也能获得strong semantic的feature map

    Feature Pyramid Networkhigh-resolution & strong semantic的feature map的获得)将对于feature map所携带信息的理解更深入了一层

  • CornerNet

    CornerNet通过在feature map上进行Corner Pooling来获得feature map中包含的Corner信息

    CornerNet真正关注了feature map中每个pixel的含义,及其表示的representation,将对feature map的representation的理解深入细化到了pixel-level

    其对于feature map不同位置信息流动(object位置的信息流动到corner位置),也是一次有意义的尝试

Anchor-Based or Anchor-Free

  • 从feature map的生成来看:

    如何获得high-resolution & strong semantic的feature map

    从Faster-RCNN和YOLO的single-scale,到SSD的multi-scale,最后到RetinaNet使用的FPN基本解决了这个问题

  • 从feature map的使用来看:

    • Faster-RCNNSSDRetinaNet等方法均为anchor-based,其对于feature map的操作是饱和式检测对feature map的内在信息的挖掘不足

      其对feature map使用的精细度是在整个feature map的level上

    • anchor-free的方法中:

      • YOLO分类的思想类似于segmentation,对feature map的使用是patch-level每个grid cell对应的feature map是最小单位

      • CornerNet真正开启了在pixel-level使用feature map的序幕,该方法对feature map中信息的挖掘和利用远远高于anchor-based方法和YOLO

        之后的anchor-free方法都可以划分到此类

Divide Task

要在同一个feature map上实现多个功能,可以采用多个支路分别进行

是否还对信息进行聚合,取决于其使用位置

RPN

class+box subnet of RetinaNet

prediction module of CornerNet

TTA

主要是color jitterhorizontal flip

要注意horizontal flip如何聚合检测结果:先聚合,再NMS

Related Work

Two-Stage

two-stage的常规思路是:

  1. stage-1 生成 sparse set of regions of RoI
  2. CNN对regions进行分类

R-CNN

使用 low-level vision algorithm 获得RoIConvNet进行分类

  • 非端到端
  • 计算冗余

SPP & Fast-RCNN

feature map中获取RoIConvNet分类

  • 依旧是分立的proposal算法,无法端到端训练

Faster RCNN

引入RPN,从anchor中获取proposals

  • efficient
  • end-to-end

R-FCN

将sub-detection network从fully connected变为fully convolutional

DeNet

不使用anchor的two-stage方法

steps

  1. 确定一个location有多大的可能是4个corner之一
  2. 列出corner所有的组合方式,获得RoI
  3. CNNRoI进行分类

difference compared to CornerNet

  • DeNet不判断corner是否属于一个object,而是通过sub-detection network拒绝poor Rois
  • DeNet需要进行手动的feature selection
  • CornerNet引入了corner pooling层

One-Stage

one-stage的常规思路是:

  1. imagedense & regular 地放置anchor
  2. 通过 scoring anchor 来获取最后的 bounding box predictions
  3. 通过regressioncoordinate微调

YOLO

直接在image上预测bounding box和coordinate(后续版本也用回了anchor)

SSD

multi-scale的feature mapdense & regular 放置anchor

DSSD & RON

通过skip connection结合low-level和high-level的features(类似Hourglass

RetinaNet

Focal Loss

RefineDet

滤除一部分的negative box,对anchor进行粗调

Point Linking Network(PLN)

不使用anchor的one-stage方法

steps

  1. 预测bounding box4个corner1个centerlocation
  2. 构造corner-center pair
    • 对于corner,预测每个pixel有多大的可能是center
    • 对于center,预测每个pixel有多大的可能是corner
  3. 根据corner-center pair生成bounding box
  4. 4个bounding boxmerge1个bounding box

difference compared to CornerNet

  • PLN通过预测pixel的locationgroup corner & center

    CornerNet通过embedding vector来group corner & center

  • CornerNet使用corner pooling,以更好地定位corner

Blogs

  • CornerNet结构的代码:【Anchor free】CornerNet 网络结构深度解析(全网最详细!)

  • CornerNet的ground-truth处理、Loss Function的代码:【Anchor free】CornerNet损失函数深度解析(全网最详细!)

  • Corner Pooling的具体作用:CornerNet算法解读

[paper reading] CornerNet相关推荐

  1. [paper reading] FCOS

    [paper reading] FCOS GitHub:Notes of Classic Detection Papers 2020.11.09更新:更新了Use Yourself,即对于本文的理解和 ...

  2. [paper reading] CenterNet (Object as Points)

    [paper reading] CenterNet (Object as Points) GitHub:Notes of Classic Detection Papers 2020.11.09更新:更 ...

  3. [paper reading] CenterNet (Triplets)

    [paper reading] CenterNet (Triplets) GitHub:Notes of Classic Detection Papers 2020.11.09更新:更新了Use Yo ...

  4. cvpr2019/cvpr2018/cvpr2017(Papers/Codes/Project/Paper reading)

    cvpr2019/cvpr2018/cvpr2017(Papers/Codes/Project/Paper reading) Source:https://mp.weixin.qq.com/s/SmS ...

  5. [paper reading] RetinaNet

    [paper reading] RetinaNet GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能 ...

  6. [paper reading] SSD

    [paper reading] SSD GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能放到CSDN ...

  7. [paper reading] YOLO v1

    [paper reading] YOLO v1 GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能放到 ...

  8. [paper reading] Faster RCNN

    [paper reading] Faster RCNN GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法 ...

  9. [paper reading] DenseNet

    [paper reading] DenseNet GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能放 ...

最新文章

  1. 《C#精彩实例教程》小组阅读12 -- C#面向对象技术高级应用
  2. Android --- 夜神模拟器中没有图片怎么办?夜神模拟器中怎么导入图片?
  3. MIMIC 以太坊医疗项目开发(4)Axios
  4. 信息学奥赛一本通 2045:【例5.13】蛇形填数
  5. 力扣20-有效的括号(C++,附思路)
  6. fortran调用matlab画图,[转载]Matlab与Fortran的交互--基本概念
  7. oracle向右削减和补全,b操纵序列削减Oracle数据库开辟工作量-开辟技术/b[Oracle防范]...
  8. 【代码笔记】iOS-账号,密码记住
  9. VScode安装并设置SVN插件
  10. siki暗黑战神项目总结,框架和主要的优化点
  11. c语言bubblesort函数,C++实现冒泡排序(BubbleSort)
  12. 使用x64编译fastdb报错
  13. 生存分析第四课:Cox Proportional hazards model
  14. cookie安全性问题
  15. opencv实现人脸识别和眼部识别
  16. Invalid hook call. Hooks can only be called inside of the body of a function
  17. 操作系统:磁盘调度算法FCFS算法(c语言)
  18. GPS定位系统,开放GPS定位平台SDK/API
  19. 【外贸收款】拉美银行BBVA介绍
  20. Cocos2dx发展历程

热门文章

  1. 浅谈智能语音交互,看一个Windows语音识别程序
  2. 绵阳创客开发长语音识别平台 1小时语音10分钟转化为文字
  3. cimco edit v5_iA Writer for Mac(写作软件)v5.6.3
  4. Error in mounted hook: “TypeError: Cannot read property ‘init‘ of undefined“
  5. 51单片机微波炉c语言程序,基于51单片机的微波炉控制C源程序.doc
  6. UHDTV (超高清电视)的色域与取样精度及格式
  7. java io图_JAVA IO流结构图
  8. h3c c语言题库,H3C认证试题
  9. 坚果pro2 android 8,手机 篇一:坚果Pro2特别版使用感受
  10. Authentication failed for 错误