CVPR2020 | Code

思想:首先文章提出当前基于对抗的方法

image and instance levels alignment [7], strong-local and weak-global alignment [44], local-region alignment based on region proposal [62], multi-level feature alignment with prediction-guided instance-level constraint

未考虑到可迁移性(transferability)和可判别性(discriminability)是可能存在矛盾的,

the transferability refers to the invariance of the learned representations across domains,
and discriminability refers to the ability of the detector to localize and distinguish different instances.

因此提出使用Hierarchical Transferability Calibration Network (HTCN)来平衡这两者的关系。

Importance Weighted Adversarial Training with Input Interpolation (IWAT-I)

首先使用CycleGAN分别对源域和目标域生成了相应的合成图像,然后对这些生成的图像按照跨域的相似性(cross-domain similarity)进行权重的分配。

Our key insight is that not all images are created equally in terms of transferability especially after interpolation

根据域分类器D2D_2D2​的输出di=D2(G1⋅G2(xi))d_i = D_2(G_1 \cdot G_2(x_i))di​=D2​(G1​⋅G2​(xi​)),将其带入信息熵函数中
vi=H(di)=−di⋅log⁡(di)−(1−di)⋅log⁡(1−di)v_i = H(d_i) = -d_i \cdot \log(d_i) -(1- d_i) \cdot \log(1-d_i) vi​=H(di​)=−di​⋅log(di​)−(1−di​)⋅log(1−di​)

值越大,说明该样本具有越高的uncertainty,此时加大输入到D3D_3D3​的特征fif_ifi​的权重。

gi=fi×(1+vi)g_i = f_i \times (1+v_i)gi​=fi​×(1+vi​)

那么此时域分类器D3D_3D3​的对抗损失可以写为:

Lga=E[log⁡(D3(G3(gis)))]+E[1−log⁡(D3(G3(git)))]\mathcal{L}_{ga} = \mathbb{E}[\log(D_3(G_3(g_i^s)))] + \mathbb{E}[1-\log(D_3(G_3(g_i^t)))]Lga​=E[log(D3​(G3​(gis​)))]+E[1−log(D3​(G3​(git​)))]

从而实现图像级的可迁移性的校准。

Context-Aware Instance-Level Alignment (CILA)

作者认为,常见的Instance-level对齐,每个ROI对应的特征向量只代表了每个局部的个体,未考虑到全局上下文信息,因此作者提出将finsf_{ins}fins​(特征向量的长度为128)同时与不同层次的GiG_iGi​的特征向量进行融合

ffus=[fc1,fc2,fc3]⊗finsf_{fus} = [{f_{c}^{1}}, {f_c^2},f_c^3] \otimes f_{ins}ffus​=[fc1​,fc2​,fc3​]⊗fins​

但与strong-weak不同的是,这样的tensor product operation可能会产生维度爆炸,因此先随机采样,然后进行Hadamard product.

ffus=1d(R1fc)⊙(R2fins)f_{fus} = \frac{1}{\sqrt{d}}(R_1f_c) \odot (R_2f_{ins})ffus​=d​1​(R1​fc​)⊙(R2​fins​)

Local Feature Mask for Semantic Consistency

同一物体在不同域中,虽然所处的场景不同,但应该是语义不变,可以匹配的。因此作者认为图像的某些局部区域是更利于迁移的。

we assume that some local regions of the whole image are more descriptive and dominant than others.

D1D_1D1​是一个pixel-wise(针对G1G_1G1​生成的特征图)的域分类器,同样对域分类器的值使用了信息熵来确定每个区域(针对原图像)的不确定性。

根据特征图上的每个位置kkk,计算mfk=2−H(dik)m_f^k = 2- H(d_i^k)mfk​=2−H(dik​)得到相应的Mask 图(不确定性值越小的区域,可迁移性越好),作为一个Attention Map。

总结

作者将信息熵作为一个度量域分类器的准则,从而挖掘出难迁移的图像(IWAT-I),易迁移的区域(Local Feature Mask)。

论文简读《Harmonizing Transferability and Discriminability for Adapting Object Detectors》相关推荐

  1. 论文笔记:Harmonizing Transferability and Discriminability for Adapting Object Detectors

    论文地址:https://ieeexplore.ieee.org/document/9157147 源码地址:https://github.com/chaoqichen/HTCN 1 Main Ide ...

  2. 搭建目标检测模型之Harmonizing Transferability and Discriminability for Adapting Object Detectors

    搭建环境 准备数据集 下载数据集 数据集1:PASCAL_VOC 07+12 and Clipart 数据集2:cityscapes and foggy_cityscapes 修改数据集配置信息 预训 ...

  3. CVPR2020 Harmonizing Transferability and Discriminability for Adapting Object Detector

    Harmonizing Transferability and Discriminability for Adapting Object Detector code:https://github.co ...

  4. 论文解读:Adapting Object Detectors via Selective Cross-Domain Alignment

    论文题目:Adapting Object Detectors via Selective Cross-Domain Alignment(CVPR2019) 论文主要贡献:以往的域自适应的方法在分类和分 ...

  5. 【没有哪个港口是永远的停留~ 论文简读】2019 Distilling Object Detectors with Fine-grained Feature Imitation

    链接:2019 Distilling Object Detectors with Fine-grained Feature Imitation 代码:https://github.com/twangn ...

  6. SOLOv2论文简读

    论文:SOLOv2: Dynamic, Faster and Stronger 代码:https://github.com/WXinlong/SOLO 摘要 主要提出了作者在SOLOv2中实现的优秀的 ...

  7. 边缘检测论文简读、开源代码和数据集合集

    文章目录 概述 基于深度学习的边缘检测 一般的边缘检测 2019 Object Contour and Edge Detection with RefineContourNet Edge-Direct ...

  8. FairFuzz 论文简读+源码分析+整体流程简述

    FairFuzz: A Targeted Mutation Strategy for Increasing Greybox Fuzz Testing Coverage 一.论文阅读 Abstract ...

  9. Extending IOU Based Multi-Object Tracking by Visual Information论文简读

    写在前面 这篇论文是在方法"High-speed tracking-by-detection without using image information"(IoU)基础上的改进 ...

最新文章

  1. html脱离标准文档流,关于css脱离标准文档流的两种方式
  2. golang设置默认地区
  3. Java-CAS初探
  4. “模板类与友元”那些事(C++)
  5. Display Substring
  6. 快手打击低俗直播 封禁一批高粉用户
  7. Mozilla 扩展漏洞奖励计划,涵盖利用缓解技术绕过
  8. B-S期权定价模型 Black Scholdz
  9. 2017VS2018年非工作日日期大集合
  10. java单例模式——双重检查
  11. 关于gis中坐标系:WGS84,EPSG4326,EPSG3857,墨卡托。EPSG:4490
  12. 惠普触控板使用指南_手势操作更简便 笔记本触控板使用简介
  13. Python爬取周杰伦的200首歌+BI可视化分析
  14. 为图片添加LOMO效果
  15. PHP练习6 使用MySQL实现简单身份验证
  16. VM安装win7系统一直失败,可能是镜像文件不对
  17. 正则表达式匹配 整数和正整数
  18. 详解数据模型设计方法
  19. C++ 对OPENCV rect矩形进行颜色填充
  20. 《大话设计模式》读书总结

热门文章

  1. 大数据之Hive:hive中的四个by
  2. Sql server 2005日志文件太大,使其减小的方法
  3. 用树莓派打造属于自己的古典游戏机
  4. 《大话成像-图像质量检测》EMVA 1288: 6个重要图像质量测试指标
  5. 用html写一个个人简历
  6. TensorFlow/PyTorch和cuda等版本对应关系
  7. java中乱码产生的原因_java出现乱码的原因与解决方法详解
  8. 第七届蓝桥杯——生日蜡烛
  9. 机器算法有哪几种 python_机器学习10种经典算法的Python实现
  10. 东方木教你如何用WINDOWS自带的压缩功能去压缩软件