该论文聚焦于影子的分割(segmentation),创新点在于提出新的数据集和一种局部特征增强方法。

创新点1:自建的数据集CUHK-Shadow:

1. 数据集的特点

  • 10500张带标签的图片;更复杂的场景;
  • 包含了投射到背景物体上的投影,也包含了投射到自身的投影;
  • 提供了测试集;
  • 数据集里的图片有5个不同的来源,分别是ADE20K、KITTI、Google MAP、USR、Internet,每个部分都有独立的划分出数据集,在后文作者的实验部分即对总体数据集进行了性能的评估,也分别对五个部分独立地进行了试验评估。

2. 数据集的复杂性

2.1 阴影面积的相对于图片总面积的占比(更复杂)

2.2 每幅图片的阴影个数更多、方差更大

2.3 阴影区域有着更均匀的空间分布

2.4 非阴影区与阴影区的颜色对比度(比以往的数据集更低)


PS. 现有的数据集

3. 评价指标:

3.1 Balanced error rate (BER)【越小越好】


传统的BER指标用来评价二分类(0/1)结果,于是对指标进行一些改进来适用连续(0~1)的预测结果:

3.2 f_β^ω【越大越好】

创新点2:Fast shadow detection network (FSDNet)

3.1 骨干网络:MobileNet V2【先前已有的工作】

首先,使用 MobileNet V2 作为具有一系列反向残差瓶颈 (IRB) 的主干来提取多个尺度的特征图。 每个 IRB 包含一个 1×1 卷积、一个 3×3 深度卷积和另一个 1×1 卷积,并通过跳跃连接添加输入和输出特征图。 此外,它在每次卷积后采用批量归一化,在前两次卷积后采用 ReLU6。 其次,我们在主干的最后一个卷积层之后使用方向感知空间上下文 (direction-aware spatial context, DSC) 模块来收集 DSC 特征,其中包含用于识别阴影的全局上下文信息。

3.2 细节增强模块:Detail Enhancement Module (DEM)【独创性工作】

图 7 显示了细节增强模块(DEM)的结构。 以低级特征 FL 和 DSC 特征 FD 作为输入,它首先通过 1×1 卷积减少 FD 的特征通道数,并将其上采样到 FL 的大小。 然后,我们计算门图(gate map) G 以根据 DSC 特征和低级特征之间的距离来衡量细节结构的重要性:

G=α∗log(1+(FL−FD)2)G=α*log(1+(FL-FD)^2) G=α∗log(1+(FL−FD)2)

其中(FL−FD)2(FL-FD)^2(FL−FD)2表示两个特征之间的距离,由对数函数重新缩放。 然后,引入可学习参数α来调整门图的比例。 最后,我们将门图G与输入的低级特征 FL 相乘以增强空间细节并产生精细的低级特征 FE。这个模块只引入了很少参数(一个1×1的卷积和参数α),所以计算时间可以忽略不计。

3.3 消融实验

  • basic:直接使用backbone的最后一层直接预测阴影
  • basic+DSC:增加DSC模块聚合全局特征
  • FSDNet-high-only:不使用多尺度的特征,直接使用high-leve特征预测阴影的mask
  • FSDNet w/o DEM:不使用DEM,直接对low-level、middle-level、high-level特征拼接

3.4 模型的对比

[论文解读 2021-TIP] Revisiting Shadow Detection: A New Benchmark Dataset for Complex World相关推荐

  1. 论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering

    论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering   本文解决KBQA中的子问题--Relat ...

  2. 论文解读--K-Radar:4D Radar Object Detection for Autonomous Driving in Various Weather Conditions

    摘要 与使用可见光波段(384 ~ 769 THz)的RGB相机和使用红外波段(361 ~ 331 THz)的激光雷达不同,雷达使用波长相对较长的无线电波段(77 ~ 81 GHz),因此在恶劣天气下 ...

  3. 论文研读 “Liar, Liar Pants on Fire”:A New Benchmark Dataset for Fake News Detection

    给十月画个句号 最近上的很喜欢的一门课中,老师要求我们研读一篇顶会论文并进行分享,好久没能静静地坐下来写一篇博客了,接下来希望自己能够多读论文的同时把论文的思路以博客的形式输出~ 论文来源 " ...

  4. Open-Vocabulary Object Detection Using Captions(2021 CVPR)----论文解读

    Open-Vocabulary Object Detection Using Captions[2021CVPR]----论文解读 paper code 1. Abstract Open-Vocabu ...

  5. CVPR 2021 | 腾讯AI Lab入选论文解读

    本文转载自腾讯AI实验室 CVPR(Conference on Computer Vision and Pattern Recognition)是计算机视觉三大顶会之一,也是中国计算机学会推荐的人工智 ...

  6. 论文解读:DETR 《End-to-end object detection with transformers》,ECCV 2020

    论文解读:DETR <End-to-end object detection with transformers>,ECCV 2020 0. 论文基本信息 1. 论文解决的问题 2. 论文 ...

  7. CVPR2020论文解读:3D Object Detection三维目标检测

    CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...

  8. 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征

    论文解读:韩宗博 硕士研究生 | 天津大学 智能与计算学部 指导老师:张长青,天津大学副教授,博士生导师 1. 方法动机 多模态人工智能技术正在被广泛应用到智能医疗.无人系统等重要领域,设计精准.可靠 ...

  9. 2021 CVPR论文解读征集令

    2021年,旷视研究院迎来了崭新的征程,在CVPR论文中,一共有22篇成功入选,其中口头报告2篇.被收录的论文涵盖了激活函数.神经网络.神经网络架构搜索.光流估计.无监督学习.人体姿态估计.目标检测等 ...

最新文章

  1. Vue之通过连接数据库的接口获取列表实现添加删除功能
  2. caffe基础(8):draw_net.py绘制网络结构
  3. json对象数组按对象属性排序
  4. Vue 动态创建实例
  5. java用户里获取部门id_javaWeb开发,根据部门ID查询该部门和下属所有部门的ID集合...
  6. 网络编程(part1)--IO及字节串
  7. java 记录一个类加载顺序的坑
  8. 多线程中 start()和run()方法的区别
  9. 云图说|小云妹-DDS实例安全基本操作
  10. 不要让你的不主动,耽误了你的人脉
  11. 转:从内部开始 认识Oracle数据库结构组件
  12. tensorflow学习之(十一)RNN+LSTM神经网络的构造
  13. Nike Zoom LeBron 15 Performance Review
  14. 青年大学习自动名单核对程序
  15. Microbiome:根际微生物影响植物开花时间
  16. python用cartopy包画地图_python – 使用Cartopy在地图上显示图像时的投影问题
  17. 人工智能:第十一章 自然语言理解
  18. 袁萌:Linux的十项重要进展
  19. MemoryStream 的一些用法
  20. linux: 多个文件内容(交集,并集,补集,单词个数统计)

热门文章

  1. keil固件库芯片支持包下载
  2. yd什么意思_yd是什么单位?
  3. 硬盘智能搜索匹配技术研究与实现
  4. 给孩子的备忘录——梁继璋给儿子的信
  5. 微信公众号---报名系统
  6. Win10开机wsappx进程占用CPU资源过高,最全的解决方法总结。
  7. macOS iTerm2 简单使用
  8. 步进电机梯形曲线加减速运动算法实现
  9. 【怎样制作ppt】Focusky教程 | 安装Focusky
  10. MFC中通过Tooltip类来实现悬浮鼠标显示提示信息