代码暂未公布。

Bisenet有四个系列,分别是bisenetv1,bisenetv2,bisenetv3,和rethink bisenet(STDC)。今天直接V3是着重想看一下边缘提取部分。

摘要:

空间信息和感受野对语义分割是非常重要的,具体体现在,空间信息每个像素和邻近的像素组成一个物体,每个像素和整张图片其他所有像素的关系组成图片的语义信息,而感受野则是模型可以覆盖到整张图片,这样有利于语义信息的提取。

现在的大多方法都在分辨率和低层细节信息做了妥协。作者提出了bisenetv3,引入特征完善和特征融合模块,有效的结合特征。同时使用注意力机制帮助模型捕捉上下文信息。同时引入边缘检测技术增强特征的边界。SOTA。

引言:

ICNet:降低输入图像的分辨率,简单高效,损失空间细节,导致精度下降。

ENet:移除模型最后几个stage,减少冗余性,导致感受野不足以覆盖整张图片。

实时语义分割需要快速推理并且不损失精确性。

为了减少空间细节的丢失:

U-shape结构:backbone在imagenet上预训练,然后不断下采样。

SFNet:提出FAM模块,对齐相同stage的特征图,用于更高效的融合。

对于实时语义分割:

Bisenet提出空间分支和context分支,空间分支减少空间信息的损耗,保持细节信息,context增加感受野。

STDCNet重新提出了backbone,提取感受野和多尺度信息。同时移除了冗余的路径,加入细节引导模块。

本文Bisenetv3使用STDCNet的backbone,移除消耗时间的空间分支,和注意力模块ARM,和特征融合模块FFM,加入了传统的边界检测模块和两个新模块。encoder已经处理的很好了,作者更关注于decoder部分。提出了CFRM和SFFM。同时语义分割对于边界检测有很强的任务相关性。使用了传统的边界检测算法增强CFRM模块。

相关工作:

1:有效backbone设计:

squeezenet,squeezenext,shufflenet v2,densenet,moboilenet v2,efficientnet,ghostnet。

2:传统语义分割:

fcn,segnet,pspnet,deeplabv3。

3:即时语义分割:

dfanet,bisenet v2,harnet。

本文提出的方法:

两个注意力模块,一个增强特征的边界提取。

1:两个注意力模块

bisenet提出的arm模块,使用平均池化捕捉背景,特征变为cx1x1,这个模块只测量了每个通道的相关性,忽略了空间信息。空间信息对于生成attention map十分重要。因此提出了CFRM模块。

CFRM将图片划分为CXHX1,和CX1XW ,相当于在横轴和纵轴进行平均池化,这种操作也类似于sobel算子的操作。

最后通过sigmoid进行注意力向量的计算进行特征学习。

如何计算attention map:

(CXHX1)@(CX1XW)=CXHXW

与原始图片相乘:

CXHXW * CXHXW=CXHXW

然后将backbone捕捉的全局上下文信息和上下文信息进行结合,即concat。

CFFM模块,在bisenet中宣称,不同stage的特征有不同的层次表示,因此不能直接相加。

decoder的特征具有丰富的语义信息,并且CFRM的模块保持了丰富的语义信息。沿着H和W方向进行平均池化,将特征图划分为CXHX1和CX1XW。CFFM是为了融合特征,接着维度变为CX1X(H+W)。然后使用SEnet减少通道的占比。最后通过sigmoid产生注意力向量,再和原始的图片相乘,再来一个残差连接。这意味着我们考虑了图片中重要和不重要的像素。

边界检测:边界检测是为了用来捕捉和学习边界信息,来获得细节信息。为了帮助CFRM完善特征,作者加入了sobel操作。去面向目标边缘中模糊和不准确的分割区域。边缘检测方法是用于提取输入特征的边界特征。他和backbone提取的语义分割特征connect在一起。sobel使用梯度向量作为操作。如果阈值设置的过高,将会产生非常多特征。如果太低边界就会看不到或者无效。

注:这个地方应该是提取完特征进行二值化处理,即大于阈值设置为1,反之为0。

经过试验发现1/8和1/16最合适,阈值设置为40。

边切提取作用就相当于注意力机制,最终输出的边界图是双分类,(binary classfication)。通过检测不同尺度的边界,效果更好。

因为边界的像素总是少于非边界像素,因此需要解决分类平衡问题。因此作者使用binary 交叉熵和dice loss。dice loss对前景和背景不敏感,所以可以缓解分类不平衡问题。

整体网络架构:

实验:

实验细节:

数据增强:

消融实验:

sobel参数设置:i=40最合适。

边缘检测的位置设置:

有效性设置:

CFRM:效果

CFFM:

同上。

和其他结果比:

在两个数据集上:

BiSeNet V3: Bilateral Segmentation Network with Coordinate Attention for Real-time Semantic Segment相关推荐

  1. 【BiSeNet】《BiSeNet:Bilateral Segmentation Network for Real-time Semantic Segmentation》

    ECCV-2018 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...

  2. 白话详细解读(六)----- BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

    一.论文简介 论文链接:https://openaccess.thecvf.com/content_ECCV_2018/html/Changqian_Yu_BiSeNet_Bilateral_Segm ...

  3. Coordinate Attention for Efficient Mobile Network Design

    目录 摘要 Coordinate Attention 注意力机制 Coordinate Attention模块 坐标信息嵌入(Coordinate Information Embedding ) 坐标 ...

  4. Coordinate Attention for Efficient Mobile Network Design论文详解(结合代码)

    1.简介 Mobile Network设计的最新研究成果表明,通道注意力(例如,SE注意力)对于提升模型性能具有显著效果,但它们通常会忽略位置信息,而位置信息对于生成空间选择性attention ma ...

  5. 【ACNET2019】:ATTENTION BASED NETWORK TO EXPLOIT COMPLEMENTARY FEATURES FOR RGBD SEMANTIC SEGMENTATION

    ACNET: ATTENTION BASED NETWORK TO EXPLOIT COMPLEMENTARY FEATURES FOR RGBD SEMANTIC SEGMENTATION ACNE ...

  6. 注意力机制——Coordinate Attention

    目录 摘要 1 介绍 2 相关工作 2.1 Mobile Network 2.2 注意力机制 3 Coordinate Attention 3.1 Revisit SE Block 3.1.1 Squ ...

  7. Coordinate Attention 论文笔记

    Coordinate Attention for Efficient Mobile Network Design CA block CVPR2021 论文链接: https://arxiv.org/a ...

  8. 论文翻译:2020_DARCN_A Recursive Network with Dynamic Attention for Monaural Speech Enhancement

    论文地址:基于动态注意的递归网络单耳语音增强 论文代码:https://github.com/Andong-Li-speech/DARCN 引用格式:Li, A., Zheng, C., Fan, C ...

  9. 语义分割--Attention to Scale: Scale-aware Semantic Image Segmentation

    Attention to Scale: Scale-aware Semantic Image Segmentation CVPR2016 http://liangchiehchen.com/proje ...

最新文章

  1. 【组队学习】曹志宾:基于Python的会员数据化运营
  2. redis为什么是cp_面试官:Redis怎么持久化的?如何回答持久化策略呢?
  3. iptables 转发oracle端口
  4. Linux系统命令三剑客之 awk
  5. C#开发微信门户及应用(8)-微信门户应用管理系统功能介绍
  6. 以色列:新发明大幅提高太阳能发电效率
  7. java去除重复对象_Java19-2 集合类去除重复对象
  8. JMeter基础之组件的作用域与执行顺序
  9. 多线程join方法解析
  10. 单表的更新UPDATE和删除记录DELETE(二十六)
  11. 签名别人的公钥以及验证签名的公钥
  12. KVM之五:KVM日常管理常用命令
  13. 秘籍和修改器之人偶遗迹 ひとがたルイン
  14. android交叉编译工具链,NDK 交叉编译工具链使用
  15. 超简单的wf日记程序
  16. 关于立体图形切n刀最多切多少块的结论及推导
  17. 【UCIe】UCIe NOP 介绍
  18. Akka(6): become/unbecome:运算行为切换
  19. 分省直接融资、间接融资及金融倾斜度数据(2001-2018年)
  20. 福昕阅读器给pdf创建目录方法

热门文章

  1. php无限分类之网站导航
  2. 设计数据密集型应用——数据系统的未来(12 上)
  3. Ceres Solver 官方教程学习笔记(十二)——非线性最小二乘法建模Modeling Non-linear Least Squares (下)
  4. gshhs matlab,matlab的mmap
  5. PyTorch实现PPO代码
  6. 计算机毕业设计-仿QQ音乐--HTML+CSS
  7. 天猫5403亿!京东出王炸,地下物流“胶囊快递”曝光!
  8. 程序员的linux杯子,6款专为程序猿定制的礼品
  9. 专业名词解释 - DNS,A记录,子域名,CNAME别名,PTR,MX,TXT,SRV 记录,TTL
  10. 使用树莓派GPIO17和GPIO18连接DS18B20温度传感器(关于DS18B20的时序设置)