BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation

原文链接:https://arxiv.org/abs/1503.01640

Abstract

  • 目前的语义分割任务主要采用像素级(pixel-level)的分割标签,但像素级的分割标签比较难以获取,导致深度学习模型难以用更多的数据去训练。
  • 本文提出的方法(BoxSup)采用目标框(bounding box)的分割标签,基本思想是在自主生成region proposals和训练CNN之间迭代,逐渐实现生成适合于分割的标签,并优化分割网络。
  • 在相同的情况下,本文提出的弱监督方案分割结果(62.0%mAP)接近强监督模型(63.8%mAP)。

Main Contribution

作者采用FCN作结合CRF作为Baseline,CRF主要用于处理FCN的输出结果,损失函数如下。

由于缺少像素级标签,因此需要从gt Box中生成合适的像素级标签。作者采用无监督region proposal methods(Multiscale Combinatorial Grouping)在gt Boxs中生成候选片段(candidate segments)。主要优势如下:首先 region proposal 具有较高的召回率,此外该方法生成的候选区域差异性较大,具有数据增强的效果。生成的candidate segments用于更新FCN,同时FCN学习到的语义特征信息可以得到更好的candidates。两者迭代。在训练过程中,生成candidate segments为固定的,但是其标签(即属于哪一类)随着FCN的训练而变化。

对于GT Box,作者希望得到的condidate Mask尽可能覆盖整个box,因此定义了以下损失函数。其中 计算B与S之间的语义标签是否一致。

在有了candidate masks和想对应的语义标签后,就可以监督训练FCN。其中损失函数如下。该公式与公式(1)相一致,即用condidate masks及所对应的语义标签来训练FCN。

文章最终损失函数是公式(2)与公式(3)的结合。如果只含有公式3,会导致优化方向去找到最大的IoU值,如果是只含有公式4,那么优化方向是去训练FCN。

How to train

由于公式4包含两个优化方向,因此如何找到这两个问题的局部最优解是个问题。解决方案主要包含两个步骤。

第一步 首先固定FCN的参数,对所有的candidate segments更新语义标签。作者首先假设,每一个GT Boxs中只含有一个语义标签,且只有一个candidate。基于此假设,相对容易从gt box中的candidate segments挑选出一个,相对于公式(4)而言,损失最小的candidate segment,并更新其语义标签。GT box中的其他像素点设置为背景。但是这种方法,容易导致选出相似的candidate segments,从而造成局部最优。为了增加样本的复杂度,作者采用随机的方法从GT Boxs中随机挑选出公式(4)loss值最大的 前k(文中k为5)的candidate segments。

第二步 采用步骤一中的具有语义标签的candidate segments,训练FCN。

BoxSup: Exploiting Bounding Boxes to Supervise Convolutional Networks for Semantic Segmentation相关推荐

  1. Fully Convolutional Networks for Semantic Segmentation (FCN)论文翻译和理解

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  2. 【论文翻译】Fully Convolutional Networks for Semantic Segmentation

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  3. 深度图像分割 -- Fully Convolutional Networks for Semantic Segmentation

    CVPR2015 PAMI 2016 Fully Convolutional Networks for Semantic Segmentation Code: https://github.com/s ...

  4. (FCN)-Fully Convolutional Networks for Semantic Segmentation

    文章目录 Fully Convolutional Networks for Semantic Segmentation 摘要 全局信息和局部信息 感受野 FCN算法架构 训练技巧 详细参考 Fully ...

  5. 论文精读及分析:Fully Convolutional Networks for Semantic Segmentation

      本文主要内容为论文<Fully Convolutional Networks for Semantic Segmentation> 的阅读笔记,在原始论文的基础上加入了自己的一些理解, ...

  6. 【FCN】Fully Convolutional Networks for Semantic Segmentation学习

    论文翻译 又是一个看不懂原文,又看不懂翻译的论文. semantic segmentation 图像语义分割 就是预测每个像素所属的对象类别 语义分割是指像素级地识别图像,即标注出图像中每个像素所属的 ...

  7. FCN的学习及理解(Fully Convolutional Networks for Semantic Segmentation)

    大多数人接触"语义"都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在&qu ...

  8. 论文笔记《Fully Convolutional Networks for Semantic Segmentation》

    [论文信息] <Fully Convolutional Networks for Semantic Segmentation> CVPR 2015 best paper key word: ...

  9. 【论文笔记】FCN:Fully Convolutional Networks for Semantic Segmentation

    <Fully Convolutional Networks for Semantic Segmentation>,CVPR 2015 文章目录 1. 概览 2. 主要亮点 2.1 全卷积化 ...

  10. 【2015-CVPR】Fully Convolutional Networks for Semantic Segmentation

    概述 卷积网路自身逐像素端到端训练效果好于目前的SOTA语义分割网络,本文提出了FCN可接受任意大小输入并推理学习产生对应大小输出,它将来自深层的粗糙层语义信息和来自浅层的精细的外观信息相结合,该网络 ...

最新文章

  1. git 下载项目和更新项目(1)
  2. seaborn使用displot函数实现多面板直方图(Multi-panel)可视化:使用set_title函数自定义设置多面板直方图标题(Multi-panel histograms’ title)
  3. 芬兰计算机研究生申请表,芬兰的研究生申请技巧
  4. UNIX再学习 -- 信号
  5. 软件配置管理(三)软件配置管理核心功能
  6. 当年一道python面试题的失利让我错过心仪公司,希望你不会
  7. 重写equals()和hashcode()方法详解
  8. C++基础::字符串流(stringstream)
  9. 联想台式计算机排行榜,联想电脑品牌机排名介绍
  10. mysql less2,实测Aurora Serverless MySQL
  11. 解决 iOS 13 定位权限弹框自动消失
  12. python爬虫开发 urlparse、parse_qs、urlencode、quote、unquote、urljoin 用法总结
  13. 《steam community 启动发现端口被占用》
  14. 我是太阳因为自信才会把你照亮—2015许小乖的IT之路
  15. 使用Amazon SageMaker RL 和Unity训练强化学习智能体
  16. RoboMaster视觉教程(5)目标位置解算(通过像素点获取转角)
  17. 计算机无法完成更新如何处理,Win10更新过程中碰到“无法完成更新”怎么办
  18. 带你了解EOF!!!
  19. javac -d,-cp是什么意思
  20. (二)ROS中控制机器人运动(示例运行)

热门文章

  1. 龙须酥nbsp;[我的饮食情节#9352;]
  2. 杂谈 跟编程无关的事情11
  3. on1 photo raw 2020中文版(RAW图像处理) v14.5.1.9231绿色便携版
  4. 超实数系统的单子(Monad)结构
  5. 【ES实战】ES上的安全性运行方式
  6. cpu之ALUSrc_Reg
  7. AI仿生:人类进化新可能
  8. php faker,Laravel的Faker的使用
  9. easypanel b.php,easypanel 免费主机面板
  10. linux 怎样停定时任务,linux停用cron定时执行任务的方法