SEC论文笔记

  • Abstract
  • Introduction
  • Related Work
    • 方法概述
    • 比较
  • Proposed Method
    • 损失函数
    • 训练
  • Experiments

Abstract

  1. 基于三个指导原则提出新的损失函数
    (1) 将较弱的定位线索作为种子
    (2) 基于图像中的类别信息扩展目标区域
    (3) 根据目标轮廓限制分割预测的边界
  2. 通过对比试验进一步指出所提损失函数对分割性能的影响以及今后工作的一些切入点

Introduction

文章按如下3个切入点来设计混合的损失函数:

  1. 分类网络如VGG、AlexNet可生成相对可靠的区域定位的线索cues,即种子,但不能生成精确的空间信息。文章利用seeding loss结合上述信息使得分割网络匹配到一定的定位线索
  2. 可以使用全局池化层将分割mask聚合到图像级别的标签得分中。这一层的选择对分割的质量有很大的影响。例如,最大池化倾向于低估对象的大小,而平均池化倾向于高估对象的大小。文章提出一种全局加权池化(Global Weighted Rank Pooling,GWRP)方法将种子区域扩展到合理的范围,该方法对最大池化和均值池化进行了综合,取得了较好的效果
  3. 在测试时使用全连接条件随机场(FC-CRF)进行后处理通常不足以提取物体的边界,因为一旦网络经过训练,它们甚至对错误分类的区域也会有置信度。文章提出一种新的边界约束损失函数,尽量在训练期间保持一些低级图像信息,尤其是目标的边界

Related Work

方法概述

利用图像级标签学习分割模型是个较大的挑战,已有的方法大致可分为3类

  1. 利用图模型根据图像间或图像内部的相似性去推断片段或者超像素的标签
  2. 将其归结为多示例学习问题,利用图像级的损失函数训练模型,同时保持图像内部的空间表示
  3. (利用传统的自训练方法)训练一个全监督模型,同时模型本身通过一个类似EM(期望最大值算法)的过程来获得必要的像素级标注
    文献采用的方法结合了后两种,因为同时采用了图像级和像素级的损失函数

比较

若想获得较高的分割性能,目前只能采取基于深层卷积网络的方法。文献在后文中将与以下文献进行对比

  1. MIL-FCN、MIL-ILP基于深度网络,采用多示例学习方法,主要在池化策略上有所不同,即它们如何将内部空间表示转换为每个图像的标签
  2. EM-Adapt和CCNN依赖于自训练框架,并且在如何保持每个图像标签与预测分割mask的一致性上有所区别
  3. SN_B添加了附加步骤,用于创建并结合多个对象建议

Proposed Method


上图是我从一篇博客中保存的,欢迎博主来认领,我把出处链接加到文中,顺便可否告知一下图片出处?我找了好久都没找到…

损失函数

  1. Lseed:为模型提供一定的定位提示
    (1) 依据:已有很多文献提到,深度分类网络尽管只通过图像级标签的数据进行训练,仍可被成功应用于寻找目标定位的线索
    (2) 策略:使用基于梯度的显著性检测方法,使用seeding loss促使神经网络仅匹配“地标性”的区域,忽略其他位置
  2. Lexpand:当模型分割预测中存在太小或者分割错误的区域实施一定的惩罚,以确保目标区域的精确性
    (1) 目的:为确保分割mask和图像分类标签的一致性,可以通过损失函数将分割得分汇总到分类得分中
    (2) 依据:对于存在于图像中的类,全局最大池化(Global Max Pooling,GMP)仅使得单个位置的响应高,而全局平均池化(Global Average Pooling,GAP)促使所有位置的响应都很高
    (3) 策略:提出一种全局加权池化GWRP方法,将GMP和GAP进行综合。GWRP针对每个类别计算加权平均分数,赋予得分高的位置高权重,可有效缓解GMP和GAP矛盾的存在
  3. Lconstrain:使分割预测充分考虑到图像的空间和颜色信息
    (1) 思想:惩罚神经网络产生对输入图像的空间和颜色信息不连续的分割,从而鼓励神经网络学习产生的分割mask与目标边界相匹配
    (2) 策略:借助条件随机场(Conditional Random Field,CRF)利用颜色、纹理等信息提取目标边界的特性,利用全连接的条件随机场(Fully-Connected CRF,FC-CRF)作为损失函数对目标边界进行优化

训练

  • 端到端训练

Experiments

  1. PASCAL VOC 2012数据集用于验证
  2. FC-CRF用作损失函数
  3. failure cases
    (1) 几乎总是共同出现的目标和背景(co-occurence),如水上的船只,轨道上的火车
    (2) 一些目标区域可以被正确分割,但被分配了错误的类别
    (3) 一些分割预测结果只能涵盖目标的一部分,不能分割出完整的目标,比如the face of a person
  4. 细节讨论
    较大的感受野(Field of View,FOV)可使网络模型的分类精度更高,但是会对目标分割产生不利影响;而较小的感受野往往在分类性能上有所减弱
  5. Insights
    (1) 有关目标的大小的知识
    (2) 较强的监督先验知识,比如形状或者材料

[论文笔记]Seed,Expend and Constrain相关推荐

  1. 【eccv2016-论文笔记】《Seed, Expand and Constrain: ... Weakly-Supervised Image Segmentation》

    目录 文章概述 符号解读 核心思路 Seeding loss with localization cues Expansion loss with global weighted rank pooli ...

  2. [论文笔记]User-Centric Ultra-Dense Networks for 5G: Challenges , Methodologies, and Directions

    前言 本文是我所作的第四篇论文笔记,前三篇都是按照"翻译--笔记"的模式进行,本篇将跳过翻译环节直接进行论文的笔记摘录.原因有以下几点:1.翻译步骤对内容理解很有限,理解主要在笔记 ...

  3. 【论文笔记】半监督的多视图学习:Semi-supervised Multi-view Deep Discriminant Representation Learning

    [论文笔记]Semi-supervised Multi-view Deep Discriminant Representation Learning 1. 概念 多视图学习(Multiview Lea ...

  4. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

  5. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

  6. 最新图神经网络论文笔记汇总(附pdf下载)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 [导读]近年来,图神经网络变得非常火热,每年顶会在该领域内都会出现大量的研究论文,本文为大家提 ...

  7. [论文笔记] Fast Quality Driven Selection of Composite Web Services (ECOWS, 2006)

    Time: 4.0 hours Jae-Ho Jang, Dong-Hoon Shin, Kyong-Ho Lee, "Fast Quality Driven Selection of Co ...

  8. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  9. 光流 速度_[论文笔记] FlowNet 光流估计

    [论文笔记] FlowNet: Learning Optical Flow with Convolutional Networks 说在前面 个人心得: 1. CNN的光流估计主要是速度上快,之后的v ...

最新文章

  1. HTML4 和 HTML5 的10个关键区别
  2. query插件之ajaxForm ajaxSubmit的理解用法
  3. 如何查看进程的运行路径
  4. BugKuCTF WEB 变量1
  5. 深入c#的string类
  6. Oracle从小白到大牛的刷题之路(建议收藏学习)
  7. CSVDE批量导入域用户
  8. 进入环境_大学新生,进入新环境该怎样和舍友、同学相处
  9. 什么是浏览器同源策略?
  10. $.ajax与$.post、$.get的区别
  11. oracle 密码过期 ora-01017,Oracle密码过期, 报:ORA-01017: 用户名/口令无效; 登录被拒绝...
  12. Readyboost技术U 盘变内存,加速电脑(只针对Windows 7和Vista系统)
  13. FME会员期刊(2012冬季版)
  14. 严格执行系统,严格止损,不要心存侥幸,勇敢承认错误,不给自己的错误找理由。
  15. 【返老还童】大脑衰老可逆转,只需注入年轻脑脊液 From Nature
  16. C1实训-Java薪资转换(适合初学者)
  17. 首次!嫦娥四号成功软着陆月球背面,中国探测器完成人类航天史壮举...
  18. 使用Wechaty实现微信机器人操作
  19. heritrix mysql_heritrix的简单使用以及在后台调用heritrix
  20. EasyBuilder8000的安装(古月金真)

热门文章

  1. 氨氮废水吸附处理工艺——树脂吸附
  2. 2021金融保险行业数据泄露大事件
  3. 【UE5 C++基础 05】UBT基础
  4. 【方向盘】使用IDEA的60+个快捷键分享给你,权为了提效(视窗、选择篇)
  5. 文件下载(xls、txt、pdf)格式
  6. UnusualDeepLearning-task1
  7. PTA 7-2 简化的插入排序 (15 分)本题要求编写程序,将一个给定的整数插到原本有序的整数序列中,使结果序列仍然有序。
  8. 专题地图制作之POI获取
  9. 互联网协议入门(一) 作者:阮一峰
  10. linux终端进超级用户,Ubuntu里的sudo 超级用户与普通用户