论文地址:https://webdocs.cs.ualberta.ca/~xuebin/BASNet.pdf

内容简介

  • 这个网络是用来做显著目标检测的(SOD),可以在边界处取得比较出色的效果
  • Boundary Aware指的是用了个针对边界进行关注的loss
  • 有种把预测问题建模成了中间预测和边缘预测的感觉

网络结构

还是算一个比较经典的Encoder-Decoder + Refine的结构,先整一个粗的结果,然后再考虑怎么优化。
Encoder-Decoder:

  • 每个decoder的输出(图中的sup)受ground truth监督,从而降低过拟合的风险
  • Encoder用的是修改后的Resnet-34

Refine:
大多数情况下一个Encoder-Decoder出来其实就"高度可用"了,后面要做的就是疯狂尝试怎么去打磨。首先是这么个思想:
Srefined =Scoarse +Sresidual S_{\text {refined }}=S_{\text {coarse }}+S_{\text {residual }} Srefined ​=Scoarse ​+Sresidual ​

这个式子这么理解:refine网络需要学习的是ground truth(实际值)减去coarse(预测值)得到的"残差"。
而这篇文章很有意思的分析了什么叫coarse:

a是ground truth,gt显著图只有0和1两种情况。
b是第一种coarse的情形。因为模型输出的是一个概率图,所以会有个从0到1过渡的过程,但在视觉上这就会造成边缘变淡,看起来模糊。而这个模糊对应的gt有一部分是0,有一部分是1,因此确实有可能找到一个"自适应"的阈值将其分割,从而使得边缘更加锐利。
c是第二种coarse的情形。没有绝对的0和1,中间区域呈现出模糊的情况,这也是目前大部分模型在解决的问题。
d是一般的情形,结合两种coarse的综合情况,中间和边缘都糊。

而具体落实到refine网络的结构上…其实就是一个简化的一阶段encoder-decoder,个人感觉没有太多好研究的。

Loss

首先总的loss是6个side output加上2个output(sup7,sup8)的loss:
L=∑k=1Kαkℓ(k)\mathcal{L}=\sum_{k=1}^{K} \alpha_{k} \ell^{(k)} L=k=1∑K​αk​ℓ(k)
l(k)l^{(k)}l(k)就是第k个side output的loss,αk\alpha_{k}αk​是权重,对中间层的输出进行监督训练有助于减轻过拟合。
而对于某个具体的l(k)l^{(k)}l(k)而言:
ℓ(k)=ℓbce(k)+ℓssim(k)+ℓiou(k)\ell^{(k)}=\ell_{b c e}^{(k)}+\ell_{s s i m}^{(k)}+\ell_{i o u}^{(k)} ℓ(k)=ℓbce(k)​+ℓssim(k)​+ℓiou(k)​
给人的感觉就比较,缝合(文中也直接干脆叫了Hybrid Loss,混合损失)…标题中所谓的"Boundary Aware"也是源自于里面的ℓssim(k)\ell_{s s i m}^{(k)}ℓssim(k)​,一个用来针对边界进行监督的loss。
个人感觉这个loss对整个结果贡献巨大:

把Hybrid Loss换成别的单(双)loss后…结果有点过于夸张。

论文阅读:BASNet:Boundary-Aware Salient Object Detection相关推荐

  1. [论文阅读] Disentangled High Quality Salient Object Detection

    论文地址:https://arxiv.org/abs/2108.03551 代码:https://github.com/luckybird1994/HQSOD 发表于:ICCV'21 Abstract ...

  2. [论文阅读] Structure-Consistent Weakly Supervised Salient Object Detection with Local Saliency Coherence

    论文地址:https://ojs.aaai.org/index.php/AAAI/article/view/16434 代码:http://github.com/siyueyu/SCWSSOD 发表于 ...

  3. [论文阅读] Unsupervised Domain Adaptive Salient Object Detection Through Uncertainty-Aware Pseudo-Label

    论文地址:https://arxiv.org/abs/2202.13170 代码:https://github.com/Kinpzz/UDASOD-UPL 发表于:AAAI 22 Abstract 深 ...

  4. 论文阅读:Uncertainty-aware Joint Salient Object and Camouflaged Object Detection

    论文地址:https://arxiv.org/abs/2104.02628 代码地址:https://github.com/JingZhang617/Joint_COD_SOD 发表于:CVPR 20 ...

  5. 论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio

    论文阅读 [TPAMI-2022] Disentangling Monocular 3D Object Detection: From Single to Multi-Class Recognitio ...

  6. 【视频目标检测论文阅读笔记】Optimizing Video Object Detection via a Scale-Time Lattice

    1.1 论文信息 标题 Optimizing Video Object Detection via a Scale-Time Lattice 会议 CVPR 2018 原文链接 Optimizing ...

  7. 【论文阅读】Oriented R-CNN for Object Detection

    原文链接:https://arxiv.org/abs/2108.05699 原文代码:GitHub - jbwang1997/OBBDetection: OBBDetection is an orie ...

  8. [论文阅读] Active Learning for Deep Object Detection via Probabilistic Modeling

    论文地址:https://openaccess.thecvf.com/content/ICCV2021/html/Choi_Active_Learning_for_Deep_Object_Detect ...

  9. Deeply supervised salient object detection with short connections 论文复现

    DSS Model论文复现 <Deeply supervised salient object detection with short connections>这篇文章是南开大学程明明教 ...

最新文章

  1. 2021 年架构技术面试大厂高频题汇总(附答案详解)
  2. uoj#268. 【清华集训2016】数据交互(动态dp+堆)
  3. 【python图像处理】tiff文件的保存与解析
  4. 通过configuration隐藏product overview page上某些区域
  5. 【目标检测】cvpr2021_VarifocalNet: An IoU-Aware Dense Object Detector
  6. php判断中英文请求,并实现跳转
  7. Java的一些基础知识深入
  8. 十字连接焊盘_PCB板上的那些“特殊焊盘 “到底起什么作用?
  9. Codeforces 600E. Lomsat gelral(Dsu on tree学习)
  10. H5 下载文件到本地
  11. OMS 订单管理系统
  12. Spell Checker
  13. 【C语言打印三角形】
  14. Android BLE操作成功或失败status code对应解释
  15. 汇编语言(32位二进制数的减法、带符号数除法、字符串大小写转换、分段函数求值,含源程序)
  16. Oracle-SQL-group by-报错:不是单组分组函数
  17. python中scapy模块的使用
  18. 医院住院管理系统项目研发阶段性总结
  19. 关于DistroWatch
  20. 数值作业:Guass全选主元消去法之C语言代码

热门文章

  1. ajax中设置请求头和自定义请求头
  2. python settings模块导入不了_Django:无法导入“模块”。检查模块AppConfig.name是否正确 - python...
  3. python通过opc读plc实例_OPC通讯实例(C#通过OPC连接PLC读写数据)
  4. python网络爬虫学习笔记(十):数据存储
  5. 《智能计算系统》课程报告——《An Efficient FPGA Accelerator Optimized for High Throughput Sparse CNN Inference》学习笔记
  6. 【最详细】Tcpdump使用实验
  7. 【干货】微信小程序如何设置背景图片
  8. leetcode689:Maximum Sum of 3 Non-Overlapping Subarrays
  9. Largest Number(leetcode 179)
  10. 东大OJ-1430-PrimeNumbers