【论文阅读】Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation
论文标题:
Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation
作者信息:
代码地址:
https://github.com/maeve07/RCA.git
Abstract
弱监督分割是一个非常具有挑战的任务。很多方法从单个图像或者图像对获得相对有限的语义标注信息。作者提出来使用弱标签的训练集数据进行丰富的语义信息的学习。提出了regional semantic contrast and aggregation (RCA) 模块,主要包括两个方面:
1.semantic contrast:让网络对大量不同类别的区域的信息进行学习,以使有一个整体的pattern的理解(数据集级别的learning方法)
2.semantic aggregation: 捕获不同的上下文献信息去扩充语义表示(如何使用semantic contrast学到的信息)
Introduction
(图一简述了该论文主要的motivation)
在WSSS发展中,:
- 首先是 class activation mapping (CAM) ,但是它们对物体的区域的估计不够完整也很稀疏,另外仅使用单个图片的信息用于物体定位,忽略图像间的信息。(单个图像不行)
- 另外一些方法尝试利用图像对(pairwise or quadruplet) 中的有限图片,但也无法保证对整体语义模式的理解(cannot guarantee a sufficient understanding of holistic semantic patterns in the entire dataset)。(图像对也不行)
上述两种均缺乏有效的监督信号,并且比较占用计算代价。
作者提出了RCA,从整体的数据集的角度进行更全面的语义模式的学习与推理。(此处作者又列举了一些优点和做法,如下:
- RCA prefers region-aware representations that are more efficient and robust to noises.
- For each pseudo region, RCA establishes its relations to regions in all other images to facilitate dataset-level semantic context learning.
- We associate RCA with a continuously-updated memory bank.)
RCA主要从Semantic contrast 和Semantic aggregation两个方面展开的,其中:
- Semantic contrast:lets the model learn to discriminate all possible object regions in the dataset。
- Semantic aggregation :allows the model to gather dataset-level contextual knowledge to yield more meaningful object representations.
二者的作用:
- Semantic contrast helps the network to learn more structured object embedding space from a holistic view。
- Semantic aggregation focuses on improving feature representations of each image by collecting diverse semantic contexts.
Method
(图2为论文的总体结构图)
3.1. Problem Statement
Task Setup: Training a classification network first for identifying object regions corresponding to each category, which are then re-
fined to produce pseudo segmentation labels as the supervision of a semantic segmentation network。
Previous Solutions to WSSS 最近的一些方法从与训练的全卷积网络中抽出 class-ware attention maps,一些论文证明了产生定位的效果和CAM一致(该论文基于此展开)。对于mini-batch的图像III,它产生class-ware attention maps的方式如下:
其中FFCNF_{FCN}FFCN指骨架网络(VGG,Resnet)等,FCAMF_{CAM}FCAM 是常见的CAM的提取方法,可以理解成一个1x1卷积。
对于得到的mapPlP_lPl,一般经由全局池化获得多标签的分类score。
3.2. Regional Semantic Contrast and Aggregation
3.2.1 Pseudo-Region Representation
根据公式(1)中的PPP对FFF加入masked average pooling (MAP),生成嵌入向量:
主要是根据PlP_lPl的均值设定阈值uuu用于mask 池化,将特征图F中的关于类别l的强activate 像素生成Representation。
3.2.2 Pseudo-Region Memory Bank
作者为RCA建立了一个非参数和动态存储库来存储数据集级的区域语义信息,称为mermory bank,M。M中包含L个字典,每个字典对应一类标签类别,即:
其中的每一个MlM_lMl代表图像III中的第l个类别的区域性的representation,记为mlm_lml。内存库会在反向传播过程中不断更新mlm_lml,即:
仅当III中第l个类别出现,且对应的plp_lpl大于阈值时,才会更新mlm_lml,否则不更新。
Memory Mechanism Discussion (该方法的优势):
- Memory bank 比较容易进行划分,能够分别压缩每个训练样本中的每个潜在语义假设(即伪区域嵌入),并能够在弱标记的视觉数据中很好地编码每个类别的不同语义模式。
- 更新方案,能够使semantic contrast获得较为一致的memory feature,并提供较为精准全面的语义表示。
总体来公式(3)积累了由图像分类器在不同的训练时期产生的每个对象区域的所有中间状态。训练到最后,mlm_lml的表征能力将逐渐提升,后面用于semantic aggregation。
3.2.3 Regional Semantic Contrast (RSC)
采用对比学习的思想,对于公式2中给定的flf_lfl,训练使其同类别{ml+∈Ml}\{m_l^+\in{M_l}\}{ml+∈Ml}的相似性越高高越好,不同类别{ml−∈Ml}\{m_l^-\in{M_l}\}{ml−∈Ml}的相似性越低越好。
利用NCE损失函数:
由于弱监督的标签比较弱且存在噪声,使用了region mixup去增强学习的representations 的鲁棒性。即对于I中的每个区域l,通过将其与另一个小批量图像中的区域ll线性组合来创建一个混合区域。
这里lll和l−l-l−表示不同的类别。www为服从β\betaβ分布的系数。应用mixup后的对比学习的损失函数为:
公式(6)鼓励网络从mix region中学习相似性,并从不完美的label中学习鲁棒性。
3.2.4 Regional Semantic Aggregation (RSA)
(对获得representations进行利用)
memory bank中的信息比较的富足和冗余,直接利用也计算量比较大。作者对bank中的每个类别lll对应的MlM_lMl使用k-means均值聚类获得K个原型reprentation,记为QlQ_lQl。多个QlQ_lQl用于解释类内特征的不同。将bank中所有的一类的QlQ_lQl连接在一起,得到Q=[Q1,...,QL]Q=[Q_1,...,Q_L]Q=[Q1,...,QL]。将公式(1)中的FFF和获得的reprentationQQQconcat并做softmax处理获得affinity matrix S:
每个S都反应了F的每一行和Q中的每一列的标准化相似性(S的作用)。基于affinity matrix S,计算扩充feature reprentation F′F^{'}F′:
将获得的enrich reprentation F′F^{'}F′和原本的FFF concat:
其中FFF能够表示intra-image local contexts ,F′F^{'}F′能够表示 inter-image global contexts,那么所获得总F的大概就有能表示这个意思。
3.2.5 Class Activation Map Prediction
把公式(9)获得的总的F输入到公式(1)的FCAMF_{CAM}FCAM(本质是一个1×1的卷积)中去:
【论文阅读】Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation相关推荐
- 论文笔记:CVPR2022 Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation
任务:image-level标签的弱监督分割 Motivation:numerous semantically similar but visually different instances; fo ...
- 【论文阅读】Cross Language Image Matching for Weakly Supervised Semantic Segmentation
这篇论文是CLIP模型较早的在弱监督分割上应用的论文. 论文标题: Cross Language Image Matching for Weakly Supervised Semantic Segme ...
- 论文阅读 [TPAMI-2022] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised I
论文阅读 [TPAMI-2022] Leveraging Instance-, Image- and Dataset-Level Information for Weakly Supervised I ...
- 《论文笔记》—— Self-supervised Image-specific Prototype Exploration for Weakly Supervised Semantic Segment
摘要:基于图像级标签的弱监督语义分割(WSSS)由于标注成本低而备受关注.现有的方法通常依赖于类激活映射(CAM)来度量图像像素和分类器权重之间的相关性.然而,分类器只关注识别区域,而忽略每张图像中的 ...
- 【论文阅读】Online Attention Accumulation for Weakly Supervised Semantic Segmentation
一篇弱监督分割领域的论文,其会议版本为: (ICCV2019)Integral Object Mining via Online Attention Accumulation 论文标题: Online ...
- 【论文阅读】Weakly Supervised Semantic Segmentation using Out-of-Distribution Data
一篇弱监督分割领域的论文,发表在CVPR2022上: 论文标题: Weakly Supervised Semantic Segmentation using Out-of-Distribution D ...
- CVPR 2020 论文总结:Weakly Supervised Semantic Point Cloud Segmentation: Towards 10×Fewer Labels
Weakly Supervised Semantic Point Cloud Segmentation: Towards 10×FewerLabels (本文是看完了这篇论文做的总结,有不对的地方欢迎 ...
- 阅读笔记:Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation 基于等变注意力机 ...
- 文章阅读Non-Salient Region Object Mining for Weakly Supervised Semantic Segmentation
Non-Salient Region Object Mining for Weakly Supervised Semantic Segmentation 文章名称:非显著区域对象挖掘的弱监督语义分割 ...
最新文章
- centos7 更新源 安装ifconfig
- python聚类分析如何确定分类个数_Python数据挖掘—聚类—KMeans划分法
- MySQL - 分页查询优化的两个案例解析
- vim的代码折叠:设置默认代码不折叠
- UPS蓄电池的内阻没有参考值,如何才能发现劣化蓄电池?
- python之jieba库
- matlab输入集合,matlab关于集合的操作大全
- 结构体与共用体(联合体)
- python 怎么判断字符串是否有换行_JAVA中如何判断一个字符串是否换行
- eclipse无法打开.ftl文件或打开.ftl没提示
- SVN版本管理系统的使用(CentOS+Subversion+Apache+Jsvnadmin+TortoiseSVN)
- Oracle11新特性:分区功能增强-Oracle新增复合分区 (转载)
- 对于electron-react-boilerplate(ERB)的学习笔记(legacy)
- JavaScript内建对象 (一) ----- Array
- 一款支持CHM格式的安卓阅读器:ireader
- Spring blunder
- Matlab中的Smith 预估器
- 2020年某计算机菜鸡的中九保研之旅(武大、华科、北理、西交、中山)
- 基于RWEQ模型的土壤风蚀模数估算及其变化归因分析
- QT 虚拟键盘使用问题