Fine-grained Detection —— DCL(2022.02.18)

  • 1. Region Confusion Mechanism
  • 2. Region Alignment Network
  • 3. My Thinking
    • 3.1. RCM部分
    • 3.2. RAN部分
  • 4. My Summary

文章:Destruction and Construction Learning for Fine-grained Image Recognition
原文.

简称DCL,包含2个部分内容,RCM、判别器和RAN模块可以完全去掉,几乎没有额外的推理开销:

  1. 区域混乱机制RCM(Region Confusion Mechanism)
  2. 区域对其网络RAN(Region Alignment Network)

DCL:细中细,检测关键局部特征,实现细粒度目标检测。

1. Region Confusion Mechanism

作者称其为“破环”模块,目的是注重局部的学习

将原图A划分为N*N个小的子区域,并将其按照策略打乱,形成新的重组图B。通过对比重组图B和原图A的特征向量关系(点乘),训练分类器。意图最大可能忽略位置信息,让局部特征做主导进行辨别目标属性。

这种做法,作者说会带来噪声问题。作者使用对抗网络中的判别器来区分目标和噪声。目的是让网络摒弃噪声,趋势提炼目标特征

2. Region Alignment Network

作者称其为“构造”模块,目的是学习各子区域之间的(语义性)关联

将原图和重组图中的各个子区域与对应的坐标做L1范数差值,锁定子区域中的关键区域。

3. My Thinking

3.1. RCM部分

  • 打乱策略可以采纳复用。

  • 点乘的方式做度量,得到的是分类器各个点的差异度的总和。作为唯一度量有待商榷。

  • 噪声的产生,作者没明说原因。我认为是因为拆分成子区域后,负样本(背景)区域变得更集中,而目标变得更稀疏。所以我认为,这篇文章的做法不适用于目标可拆分的场景和背景特点有明显规则的场景。因为打乱重组后的图容易将单一目标变成多个小目标。

  • 判别器如何得来,作者没有明说。我认为大概率是用该场景下大量数据训练出来的,然后将训练好的对抗网络中的判别器单独提出来使用。这就意味着,该方法需要做大量前期工作。

3.2. RAN部分

  • 我认为很大概率得出来的关键子区域是原图中目标“重心”的区域。对于细粒度目标的特征在边缘的场景,好像不太适用。

4. My Summary

RCM迫使backbone更关注目标的局部特征,使用前期训练好的对抗网络中的判别器解决RCM带来的噪声问题,使得backbone学得对。

RAN迫使backbone侧重关注目标局部特征中的关键特征。

Fine-grained Detection —— DCL相关推荐

  1. YOLO系列阅读(一) YOLOv1原文阅读:You Only Look Once: Unified, Real-Time Object Detection

    目录 0.Abstract 0.1原文翻译 第一段(说明本次研究和之前研究的区别) 第二段(速度快.虽然错误率高一点,但是背景被错误标记的概率更低) 0.2总结 1. Introduction 1.翻 ...

  2. 【论文翻译】UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation

    UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation UniT:任意样本量的目标检测和分割的统 ...

  3. 视觉显著性python_OpenCV中的显著性检测(Saliency Detection)

    前言 显著性检测,就是使用图像处理技术和计算机视觉算法来定位图片中最"显著"的区域.显著区域就是指图片中引人注目的区域或比较重要的区域,例如人眼在观看一幅图片时会首先关注的区域.例 ...

  4. dcl学习_dcl简介

    dcl学习 I'm incredibly honored to have Eugene Lazutkin author for David Walsh Blog. Eugene has written ...

  5. 细粒度图像分析论文汇总

    1-1.细粒度图像分析--识别篇 论文 2020 2019 2018 2017 2016 2015 参考及推荐链接 个人了解有限,还需大家评论,继续补足,纯属个人狭窄知识面.每个排序同等地位,且不分先 ...

  6. 深度学习在计算机视觉中的应用长篇综述

    深度学习在计算机视觉中的应用长篇综述 前言 2012年ImageNet比赛,使深度学习在计算机视觉领域在全世界名声大震,由此人工智能的全球大爆发.第一个研究CNN的专家使Yann LeCun,现就职于 ...

  7. 超全!深度学习在计算机视觉领域的应用一览

    作者 | 黄浴,奇点汽车美研中心首席科学家兼总裁 转载自知乎 简单回顾的话,2006年Geoffrey Hinton的论文点燃了"这把火",现在已经有不少人开始泼"冷水& ...

  8. 收藏 | 深度学习在计算机视觉领域的应用总结

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|计算机视觉联盟 还是做一些背景介绍.已经是很热的深度学习, ...

  9. 深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源 | 黄浴 原文 |  https://zhuanlan.zhihu.com/p/55747295 ...

最新文章

  1. 解决 js ajax跨域访问报“No 'Access-Control-Allow-Origin' header is present on the requested resource.”错误
  2. 计算机ai听课记录,ai ei ui评课稿听课记录
  3. 回顾2011年最热门的开源PHP项目
  4. LeetCode14 最长公共前缀
  5. DRF (Django REST framework) 框架介绍
  6. 《机器学习实战》笔记(03):决策树
  7. 企业双11业绩增长156% 、成交额突破151亿元...... 这背后是阿里云数据中台的场景赋能
  8. 证明一下拉普拉斯的《概率分析论》观点
  9. 学python可以做什么职业-学完python都能做哪些职业?老男孩Python基础培训
  10. 190121每日一句
  11. 软件方法上竞赛自测题答案
  12. EasyAR4.0简单使用说明
  13. Error: Couldn‘t find preset “stage-2“ relative to directory
  14. Googlenet v1、v2、v3、v4区别
  15. IE浏览器退役,终究还是被市场淘汰!
  16. 前端ppt\word等等文件实现在线预览功能
  17. 零基础转行,你要不要去编程培训班?
  18. HPB Introduction
  19. 私有RTP协议和标准流媒体协议
  20. ASP.NET程序设计课程设计——新闻发布系统

热门文章

  1. windows远程linux的工具
  2. 《A More Fine-Grained Aspect-Sentiment-Opinion Triplet Extraction Task》论文阅读
  3. ImageView图片不变形
  4. TL6678-EasyEVM高端多核DSP评估板
  5. Dochub v2.2 发布,构建你自己的百度文库
  6. 京东又一高管辞职 隆雨辞去京东集团首席法务官职务
  7. MTS格式视频转AVI相关软件
  8. 2021肇庆高考成绩查询入口,2021肇庆高考成绩查询系统入口
  9. 二关节机械手PD控制simulink仿真
  10. autojs-webview上传文件