点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

近年来,深度神经网络在图像识别领域取得了较高的精度。在借鉴人类学习方法的基础上,提出了一种基于协作学习的语义分割方法。我们使用两个相同的网络和路径在两个网络之间发送特征映射。同时训练两个网络。通过共享特征映射,两个网络中的一个可以获得单个网络无法获得的信息。此外,为了提高合作程度,我们提出了只连接同一层和多层的两种方法。我们在两种网络上评估了我们提出的想法。一个是双注意网络(DANet),另一个是DeepLabv3+。与传统的单一网络和集成网络相比,该方法具有更好的分割精度。

框架结构

我们准备两个网络,并引入两个网络之间的连接,从顶部网络获得的特征映射可以发送到底部网络,并将两个特征映射连接起来。由于这两个网络都训练来解决分割问题,为任务寻址好的信息被发送到底层网络。因此,底层网络可以利用从顶层网络获得的好的特征映射来解决任务,而底层网络则专注于顶层网络无法解决的问题。由于底层网络将上层网络获得的特征图进行拼接,拼接后的特征图中滤波器的数量比原网络多出两倍。这就是我们在本文中提出的合作学习。

在我们的方法中,我们采用了以下损失,因为我们的方法同时分别训练两个cnn。我们使用Softmax交叉熵来计算损失(Loss = Loss1 + Loss2)其中Loss1为CNN1的Loss, Loss2为CNN2的Loss。两种损耗同时得到优化。在这种网络结构中,我们可以训练两个网络,同时共享单个网络无法获得的特征映射。合作学习有几个优点。首先,我们可以通过使用两个网络之间的特征映射来增加有用信息的数量。由于第一个网络解决了分割任务,因此已经获得了解决该任务的特征。因此,第二网络可以学习任务使用信息从第一个网络作为参考。基于以上原因,我们认为合作学习对于提高准确性是有效的。

在本文中,我们提出了两种合作学习的连接方法。第一种连接方法是在相同的层之间。第二种连接方法是多层之间的连接。下面的小节将解释这两种方法。通过与集成网络的比较,验证了协同连接的有效性。集成网络使用两个相同的cnn。集成网络与我们方法的区别如图2 (a)所示。

图1合作网络的结构

图2集成网络(a)和提出的协作网络(b)(c)结构

实验结果

城市景观数据集上的分割结果(val)。baseline是DANet。

城市景观数据集上的分割结果(val)。baseline为Deeplabv3+

结论

通过以上实验,我们证实了无论使用哪种基线网络,合作学习都能提高准确率。对于DANet而言,采用同一层连接的合作学习比采用不同层连接的合作学习具有更高的准确率。另一方面,DeepLabv3+的多层连接精度更高。从这些结果来看,最优的连接方法依赖于基线CNN。DANet使用注意模块对feature map进行增强。因此,同一层连接可以使用对应层的重要特征。另一方面,不同的层连接不能在不同的层上很好地使用这些特性。

在DeepLabv3+的情况下,使用一种编码解码器结构来聚合多尺度信息。多层连接可以从多层中提供有效的信息。因此,DeepLabv3+结构的多层连接获得了较高的精度,因为来自不同层次的许多信息可以帮助DeepLabv3+结构获得有效的信息。我们认为采用一种简单的编译码结构网络是有效的不同层连接。如果我们在图4中使用注意模块。城市景观数据集上的分割结果(val)。基线是由Deeplabv3+增强特征映射,同层连接的合作学习是有效的。

在实验中,我们将图2(a)所示的网络集成与提出的协作网络进行了比较。所提出的两种连接方法比两种网络集成的方法更精确。通过两种实验验证了该协作网络的有效性。

论文链接:https://arxiv.org/pdf/2101.07905.pdf

载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目31讲

在「小白学视觉」公众号后台回复:Python视觉实战项目31讲即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

用于语义分割的特征共享协作网络相关推荐

  1. CVPR2020 | 即插即用!将双边超分辨率用于语义分割网络,提升图像分辨率的有效策略...

    点击上方"AI算法修炼营",选择"星标"公众号 精选作品,第一时间送达 本文是收录于CVPR2020的工作,文章利用低分辨率的输入图像通过超分辨率网络生成高分辨 ...

  2. Dynamic Routing-中科院西交旷视(孙剑团队)提出用于语义分割的动态路由网络,精确感知多尺度目标,代码已开源!...

    关注公众号,发现CV技术之美 ▊ 写在前面 近年来,大量手工设计和基于搜索的网络被用于语义分割.然而,以前的工作(如FCN.U-Net和DeepLab系列)希望在预定义的静态网络结构中处理不同规模的输 ...

  3. *基于类平衡自我训练的无监督域自适应用于语义分割

    基于类平衡自我训练的无监督域自适应用于语义分割 摘要:最近的深度网络实现了最先进的性能在各种语义分割任务中.尽管有这样的进步,但是这些模型在现实世界中面临挑战,它们存在很大的差别在已标签训练/源文件和 ...

  4. 目前缺少用于语义分割的 3D LiDAR 数据吗?关于三维点云数据集和方法的调查

    目前缺少用于语义分割的 3D LiDAR 数据吗?关于三维点云数据集和方法的调查 原文 Are We Hungry for 3D LiDAR Data for Semantic Segmentatio ...

  5. CVF2020邻域自适应/语义分割:FDA: Fourier Domain Adaptation for Semantic SegmentationFDA:用于语义分割的傅立叶域自适应算法

    邻域自适应/语义分割:FDA: Fourier Domain Adaptation for Semantic Segmentation FDA:用于语义分割的傅立叶域自适应算法 0.摘要 1.概述 1 ...

  6. Swin-Unet跑自己的数据集(Transformer用于语义分割)

    原始代码位置: GitHub - HuCaoFighting/Swin-Unet: The codes for the work "Swin-Unet: Unet-like Pure Tra ...

  7. LiteSeg: 一种用于语义分割的轻量级ConvNet

    作者:Tom Hardy Date:2020-02-09 来源:LiteSeg: 一种用于语义分割的轻量级ConvNet

  8. 图像语义分割:FCN全卷积网络概述

    图像语义分割:FCN全卷积网络概述 Why does FCN work? FCN网络的基本概念 FCN的计算原理 Feature map上采样 What is FCN? FCN网络的结构 FCN每层的 ...

  9. 特征图注意力_CCNet:用于语义分割的交叉注意力网络

    此篇文章内容源自 CCNet: Criss-Cross Attention for Semantic Segmentation,若侵犯版权,请告知本人删帖. 此篇文章是论文 CCNet: Criss- ...

最新文章

  1. 【组队学习】【30期】李宏毅机器学习(含深度学习)
  2. Facebook 开源标准卷积替代方案 OctConv
  3. A*算法解决八数码问题 Java语言实现
  4. HBase中Bloomfilter类型的设置及使用的理解
  5. UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 1: ordinal not in range(128)
  6. bootstrap modal 一闪
  7. 有关试用Silverlight OOB模式遇到的一些问题
  8. c++,派生类对象可以对基类赋值,基类对派生类不可以赋值
  9. UISwitch的大小
  10. 基于Eclipse+Java+Swing+Mysql实现旅游管理信息系统
  11. 《财富自由子路》李笑来
  12. 设计大赛现场统分系统(C语言)
  13. Java实现简单四则运算
  14. 2022年软件工程师报告出炉,年薪最高的是...
  15. 挂载并修改img镜像的分区文件
  16. 自制操作系统——第一周
  17. 大炮打蚊子(已AC)
  18. 卷帘曝光和全局曝光的差别
  19. Go 读者提问:GPM 模型的 M 实际数量受什么影响?
  20. 2011国信蓝点杯全国软件设计大赛编程大题

热门文章

  1. 假如AI也会diss人类,他们会这样.....
  2. 精选180+Python开源项目,随你选!做项目何愁没代码
  3. 今晚直播 | 基于知识图谱的人机对话系统方法与实践
  4. 干掉zookeeper:kafka里程碑式改进,牛逼!
  5. 分页场景(limit,offset)为什么会慢?
  6. 求求你别再用 System.out.println 了!!
  7. 浅析几种线程安全模型
  8. 【PDF下载】无意中发现的另一本 统计学入门好书
  9. 腾讯ARC、华中科大联合提出QueryInst,开启基于Query的实例分割新思路
  10. 【干货】CNN与Transformer的强强联合!谷歌最新开源BoTNet,ImageNet达84.7%准确率