论文地址: Detecting the Unexpected via Image Resynthesis

1. 简介

  目前一般的语义分割方法都假定测试时遇到的物体类别在训练过程中出现过,但这并不符合复杂的实际情况。为此,该论文提出与图像生成的方式解决该问题的新思路,过程如下图所示:首先语义分割网络给类别未知物体的区域打上一个可信度较低的标签,这样根据语义分割结果重新生成原始输入时就会在该区域与真实的输入图像产生较大的差别,检测类别位置物体的任务变为检测合成图像与原始图像差别较大的区域。

  为此,方法涉及一个生成网络用于根据语义分割结果生成原始输入图像,一个判别网络来(以生成的原始输入图像,真实的原始输入图像和语义分割网络的分割结果为输入)生成一个指明类别未知物体区域的分割结果图。为了对判别网络进行训练,我们将原始训练数据中的某一类物体实例全部随机改为其他类,这样整个方法仍然是强监督的。

  除此之外,论文提出的方法还能够处理针对语义分割模型的对抗攻击(利用错误标签的数据重新生成的图像与原始图像差别较大,这样模型就能对这种类似对抗攻击的情况更具鲁棒性)。

2.方法和途径

  该论文的目标是检测出测试时遇到的类别未知的物体,与其他多数语义分割方法为图像逐像素点打标签完全不同,下图总结了论文提出的方法:

  首先使用经典的语义分割算法(例如FCN,DeepLab系列等)生成一个语义分割结果图(pix2pixHD生成方法);然后将这个图输入给生成网络用于生成原始输入图像(若某一个物体的类别从未出现,则生成的原始输入图像对应的像素点会被打上错误的标签,生成结果与真实的原始输入图像差别会很大);接着检测二者之间的显著差异,下面一节介绍用于达成该目的的判别网络。

2.1 判别网络


  该部分网络架构如上图所示,使用预训练的VGG16处理真实的原始图像和生成的原始图像(二者权重共享,就是一个网络),使用一个简单的CNN来生成分割结果图(包含未知类别的物体)。每一个特征层级都通过逐通道融合和11×11 \times 11×1卷积来减少通道数,真实的原始图像的特征和生成的原始图像的特征同时被计算和传递,最终使用反卷积返会判别的分数。训练过程前面已经提过,为了保证强监督,需要将训练数据中某一类别的全部实例随机标成其他类别,网络实现细节如下图所示。

2.3 该方法为何对检测对抗攻击有效

  通过真实的原始图像(有可能包含对抗攻击)产生语义分割结果图,然后重新生成一个原始输入图像,若包含对抗攻击,则生成的原始输入图像与真实的原始图像整幅图都会差异巨大,这样就检测出了真实的原始图像是否包含对抗攻击(之后通过计算HOG特征之间的L2L^2L2距离,应用逻辑回归判别是否包含对抗攻击,值得一提的是基于HOG特征的判别方法要比基于深度学习的方法更好,因为其不易受到对抗攻击)。

3. 实验结果

3.1 与其他方法对比,对类别未知物体的检测结果:

3.2 使用不同的分割网络时的检测结果:

3.3 对抗攻击检测效果:

3.4 定量分析结果:

4. 结论

  论文提出的方法虽然很有效,但是当语义分割网络将训练时已出现过的物体错误的划分为未知物体时,方法会受到很大的影响。(可能需要效果更好的分割网络吧)


欢迎扫描二维码关注微信公众号 深度学习与数学  [每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾]

图像语义分割(20) 通过图像合成方法检测训练中未出现的类别未知的物体相关推荐

  1. 图像语义分割方法研究

    转自:https://yhlleo.github.io/2016/10/19/CNN-SemanticSeg/ 把前段时间自己整理的一个关于卷积神经网络应用于图像语义分割的PPT整理发布在本篇博客内, ...

  2. 图像语义分割方法研究进展

    全监督学习的图像语义分割方法研究进展 简介 1 全监督学习的图像语义分割方法 1.1 基于全卷积的图像语义分割方法 1.2 基于编码器解码器结构的图像语义分割方法 1.3 基于注意力机制的图像语义分割 ...

  3. 一个关于卷积神经网络应用于图像语义分割的PPT

    转自:https://yhlleo.github.io/2016/10/19/CNN-SemanticSeg/ 把前段时间自己整理的一个关于卷积神经网络应用于图像语义分割的PPT整理发布在本篇博客内, ...

  4. 从特斯拉到计算机视觉之「图像语义分割」

    说起特斯拉,大家可能立马会想到今年5月份发生在特斯拉Model S自动驾驶上的一宗夺命车祸.初步的调查表明,在强烈的日照条件下,驾驶员和自动驾驶系统都未能注意到牵引式挂车的白色车身,因此未能及时启动刹 ...

  5. PyTorch12—Unet图像语义分割

    语义分割简介 图像语义分割是计算机视觉中十分重要的领域.它是指像素级地识别图像,即标注出图像中每个像素所属的对象类别.下图为语义分割的一个实例,其目标是预测出图像中每一个像素的类标签. 图像语义分割是 ...

  6. Tensorflow入门与实战学习笔记(十三)-FNN图像语义分割

    目录 1 图像语义分割 1.1 应用场景: 1.1.1 街景的语义分割​ 1.2 圖像语义分割的实质 1.3 网络结构 1.4 两种实现方式 1.4.1 采用了上采样 特点: 1.4.2 输入和输出 ...

  7. 图像语义分割和目标检测(上)

    语义分割是对图像在像素级别上进行分类的方法,在一张图像中,属于同一类的像素点都要被预测为相同的类,因此语义分割是从像素级别来理解图像.但是需要正确区分语义分割和实例分割,虽然他们在名称上很相似,但是他 ...

  8. 毕业设计-基于卷积神经网络的遥感图像语义分割方法

    目录 前言 课题背景和意义 实现技术思路 一.相关技术理论 二.基于残差融合和多尺度上下文信息的遥感图像语义分割方法 三.基于注意力机制和边缘检测的遥感图像语义分割方法 实现效果图样例 最后 前言

  9. 深度学习遥感图像语义分割目标检测

    深度学习遥感图像语义分割&目标检测 代码见github: WangZhenqing-RS/2021Tianchi_RSgithub.com 图标 赛题描述 本赛题基于不同地形地貌的高分辨率遥感 ...

  10. 用Transformer进行图像语义分割,性能超最先进的卷积方法!

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 正如大家所知,在进行图像语义分割时,图像被编码成一系列补丁后往往很模糊,需要借助上下文信息才能被正确分割. 因此上下文建模对图像语义分割的性 ...

最新文章

  1. LeetCode简单题之通过翻转子数组使两个数组相等
  2. brad wu_一百万归功于Brad Traversy
  3. main方法为什么是静态的
  4. 如何在Rancher 2.2 Preview2上部署和管理多K8s集群应用
  5. Python基于cq-http协议端,使用nonebot2框架制作属于自己的智能机器人
  6. ADA本月上涨100%,背后或有三个原因
  7. 优动漫PAINT基础系列之图层模式
  8. 采访:应用软件定制化有什么优点?
  9. 猫眼电影经典电影爬取
  10. 护理和计算机哪个专业好,护理专业考研的就业前景和方向
  11. phpstudy Error while setting value ‘STRICT_TRANS_TABLES, NO_AUTO_CREATE_USER, NO_ENGINE_SUBSTITUTION
  12. 基于豆瓣评价的文本分析 ——以《流浪地球》为例
  13. STOP: c000021a { Fatal System Error } the initial session process or system process terminated ...
  14. [技术讨论]关于《交换编程——极限编程的延伸实践》一文拟录用通知
  15. stm32——定时器之中断
  16. 此计算机无法打开其他数据源,电脑上的wps无法打开数据源的解决方法
  17. android神隐模式,android 跳转到小米手机神隐模式
  18. 计算机安全弹窗,怎么屏蔽网站的弹窗广告保卫电脑安全
  19. 16位AD,基准电压用3V,4V,5V的区别
  20. c语言朗读工具案例,C语言自制朗读工具,教你用电脑表白!

热门文章

  1. 人民邮电出版社图灵公司征求《Windows Communication Foundation Unleashed》译者
  2. [LeetCode]Palindrome Number 推断二进制和十进制是否为回文
  3. [模板]洛谷T3368 树状数组 模板2
  4. java 局部内部类
  5. poj2488-A Knight's Journey【DFS】
  6. leetcode 名单 Insertion Sort List
  7. 进程间通信学习APUE学习---进程间通信(4)
  8. JavaScript浮点运算的问题
  9. 借助JavaEE中Timer API实现定时关闭计算机的功能
  10. memcached—Java操作Memcached